CLARIN-D

CLARIN-D ist der deutsche Partner der 2012 gegründeten europäischen Infrastrukturmaßnahme für die Geistes- und Sozialwissenschaften CLARIN. Das Akronym steht für „Common Language Resources and Technology Infrastructure“, deutsch Gemeinsame Sprachdaten und technologische Infrastruktur. Grundidee ist es, digitale Sprachdaten (Gedrucktes, Audioaufnahmen, Interviews etc.). sowie Werkzeuge zu ihrer Bearbeitung in ganz Europa bzw. weltweit zur Verfügung zu stellen.

Organisationsstruktur und Förderphasen

CLARIN-D ist, wie auch DARIAH-DE, in einem European Research Infrastructure Consortium (ERIC) organisiert und darin Bestandteil der Roadmap des Europäischen Strategieforums für Forschungsinfrastrukturen (ESFRI).[1][2]

CLARIN-D besteht derzeit aus neun zertifizierten Zentren, die jeweils auf bestimmte Datentypen/Inhalte spezialisiert sind.[3] Das Infrastrukturprojekt wird durch das Bundesministerium für Bildung und Forschung gefördert.[4][5]

Die erste Phase (2012–2014) diente der Implementierung und dem Aufbau des Zentrenverbundes,[6] die zweite (2014–2016) dem Auf- und Ausbau der technischen Infrastruktur und Textkorpora unter Einbindung der geisteswissenschaftlichen Communities.[7] Die dritte Phase (2016–2020) befasste sich mit Dissemination und Verstetigung und beschäftigte sich z. B. mit Urheberrechtsfragen und (technischen) Herausforderungen von Mehrsprachigkeit in Europa und Social Media Daten.[8]

Mit dem DARIAH-DE Projekt gibt es technische Zusammenarbeit[9][10] und institutionelle Verbindungen.[11] Im Jahr 2018 waren beide an der Ausrichtung von Workshops[12] zur Vorbereitung der vom Rat für Informationsinfrastrukturen angeregten „Nationalen Forschungsdateninfrastrukturen“ (NFDI)[13] beteiligt. 2019–2021 schließen CLARIN-D und DARIAH-DE ihre Dienste in einer Betriebskooperation zu CLARIAH-DE zusammen.[14]

Ziele

Angebote

Die meisten Angebote von CLARIN-D lassen sich direkt über die Webpräsenz des Verbundes erreichen und online nutzen. Dazu gehören Services, die von allen europäischen CLARIN-Beteiligten zusammen bereitgestellt werden (wie die Suche nach und in internationalen Sprachressourcen VLO, FCS), sowie solche, die von CLARIN-D vor allem für ein deutschsprachiges Publikum angeboten werden (WebAnno, WebLicht, Legal Helpdesk). Zudem bieten die Zentren individuelle Beratung von Projekten / Wissenschaftlern an, die an einer Zusammenarbeit etwa bei der langfristigen Speicherung von Forschung(sdaten) interessiert sind.

Zu den Angeboten zählen:

Liste der CLARIN-D-Zentren und ihrer Spezialgebiete innerhalb CLARIN-Ds

  • Universität Tübingen – CLARIN Center Tübingen[20]: Annotierte Korpora (Baumbanken), lexikalische Daten, Experimentaldaten, linguistische Wissenskomponenten und Webservices
  • Universität Leipzig – CLARIN-D Centre Leipzig (Repository)[21] und Projektarbeit[22]: Andere Sprachen (nicht Deutsch), Gegenwartssprache, lexikalische Daten, Webservices, spezielle Referenzkorpora, öffentliche Daten
  • BBAW Berlin – CLARIN Servicezentrum[23]: Deutsche Sprache, Lexika, diachrone Korpora (vor 1900), digitale Editionen, Texterfassungsmethoden (OCR)
  • Universität Stuttgart – CLARIN-D Centre Stuttgart[24]: Computerlinguistische Software, z. B. Korpora und Korpuswerkzeuge, parametrisierbare Tools u. Webservices, geschriebene Sprache
  • IDS Mannheim – CLARIN-D am IDS[25]: Deutsche Sprache, große Korpora des Deutschen (nach 1900), Minderheitensprachen (Dialekte), gesprochene Sprache
  • LMU München - CLARIN-D Zentrum am Bayerischen Archiv für Sprachsignale[26]: Deutsche Sprach- und multimodale Daten, phonetische Tools und Services, Sprachstatistiken, Aussprache-Lexika
  • MPI Nijmegen – The Language Archive/CLARIN-D[27]: Minoritätensprachen, bedrohte Sprachen, Multimedia- und multimodale Daten, Experimentaldaten, Gebärdensprache
  • Universität Hamburg – CLARIN-D am Zentrum für Sprachkorpora (HZSK)[28] und bei der Germanistik[29]: Mehrsprachige gesprochene Korpora, Transkriptionswerkzeuge, Gebärdensprache
  • Universität des Saarlandes – CLARIN-D Zentrum (Repository)[30]: Multilinguale Korpora und Korpuswerkzeuge

Literatur

  • Leibniz-Gemeinschaft: Leibniz-Beteiligung an ESFRI-Projekten, in: Forschungsinfrastrukturen in der Leibniz-Gemeinschaft, 2014, S. 47. (PDF downloadbar [2]).
  • Bundesministerium für Bildung und Forschung: Auf dem Weg zu europaweiten Forschungsinfrastrukturen: DARIAH und CLARIN, in: Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften, Februar 2013, S. 27–28. (PDF [1]).
  • Guido Koller: Geschichte digital. Historische Welten neu vermessen. Stuttgart 2016, S. 100–102. (PDF [3]), ISBN 978-3-17-028929-1

Weblinks

Einzelnachweise

  1. ESFRI Information der Europäischen Kommission
  2. About CLARIN | CLARIN ERIC. Abgerufen am 15. April 2023.
  3. Zentren. Abgerufen am 15. April 2023.
  4. Über... Abgerufen am 15. April 2023.
  5. BMBF: Geförderte Informationsinfrastrukturen für die Geistes- und Sozialwissenschaften (Memento desOriginals vom 11. Juli 2017 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.bmbf.de
  6. Informationen im Wiki Forschungsdaten.org
  7. Facharbeitsgruppen. Abgerufen am 15. April 2023.
  8. Foliensatz von Franciska de Jong: CLARIN: a Research Infrastructure for a Multi-Lingual Europe, Juni 2016
  9. Partner: DARIAH-DE. Abgerufen am 15. April 2023.
  10. DARIAH-DE Information über gemeinsame Gremien (Memento desOriginals vom 22. September 2017 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/de.dariah.eu
  11. Liste der Partner im DARIAH-DE Forschungsverbund (Memento desOriginals vom 22. September 2017 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/de.dariah.eu
  12. start [Geistes- und kulturwissenschaftliche Forschungsinfrastrukturen e.V.]. Abgerufen am 15. April 2023.
  13. zu NFDI als einer der Themen des Rats für Informationsinfrastrukturen@1@2Vorlage:Toter Link/www.rfii.de (Seite nicht mehr abrufbar, festgestellt im August 2019. Suche in Webarchiven.)
  14. Startseite - DARIAH-DE - DARIAH. Abgerufen am 22. Januar 2020.
  15. Auswerten. Abgerufen am 15. April 2023.
  16. VLO: Suche nach Ressourcen. Abgerufen am 15. April 2023.
  17. FCS: Suche in Ressourcen. Abgerufen am 15. April 2023.
  18. Referenzressourcen. Abgerufen am 15. April 2023.
  19. Deutscher Wortschatz / Leipzig Corpora Collection. Abgerufen am 15. April 2023.
  20. CLARIN Center | Universität Tübingen. Abgerufen am 15. April 2023.
  21. Leipzig Corpora Collection - Wortschatz Deutsch. Abgerufen am 15. April 2023.
  22. Laufende Projekte - Abteilung Automatische Sprachverarbeitung. Abgerufen am 15. April 2023.
  23. Das CLARIN-Servicezentrum des Zentrums Sprache an der BBAW. Abgerufen am 15. April 2023.
  24. Projekt CLARIN-D | Institut für Maschinelle Sprachverarbeitung | Universität Stuttgart. Abgerufen am 15. April 2023.
  25. Webseite CLARIN-D am IDS Mannheim (Memento desOriginals vom 26. Juni 2017 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www1.ids-mannheim.de
  26. Bayerisches Archiv für Sprachsignale - Phonetik und Sprachverarbeitung - LMU München. Abgerufen am 15. April 2023.
  27. The Language Archive. Abgerufen am 15. April 2023.
  28. Projekte | Hamburger Zentrum für Sprachkorpora. Abgerufen am 15. April 2023.
  29. Janine Fricke: CLARIN-D. Abgerufen am 15. April 2023.
  30. CLARIND-UdS :: Language Resource Repository: Home. Abgerufen am 15. April 2023.