DeReKo und COSMAS II des Instituts für Deutsche Sprache (IDS): Einführung
Das Institut für Deutsche Sprache in Mannheim unterhält mit dem DeReKo (Deutsches Referenzkorpus) eines der grössten deutschsprachigen Korpora. Es enthält über 46 Milliarden Wörter (Stand 18. 1. 2020) und ermöglicht linguistische Forschung auf empirischer Basis geschriebener Texte
"aus der Gegenwart und der neueren Vergangenheit".
Das Korpus ist in eine Menge von Unterkorpora aufgeteilt, die teilweise auch morphologisch und syntaktisch annotiert sind.
Aufgabe 1
|
Auf der folgenden Webseite kannst du dir einen Überblick über das Korpusarchiv des IDS machen: https://www1.ids-mannheim.de/kl/projekte/korpora/
Der aktuelle Stand mit den neusten und geplanten Erweiterungen sind ebenso erwähnt wie aktuelle Veröffentlichungen zum Korpus. Informiere dich über den aktuellen Stand!
|
Um das Korpus abzufragen, gibt es
COSMAS II, die Nachfolgeversion von COSMAS I, dem "Corpus Search, Management and Analysis System".
Es gibt zwei Möglichkeiten, COSMAS II zu verwenden: Einerseits über ein
WWW-Interface, das mit jedem modernen Browser angesteuert werden kann, andererseits mit einem
PC-Client, der auf Windows-PCs installiert werden kann. In diesem Kapitel fokussiere ich mich auf den WWW-Client, da dieser unproblematisch auf jedem Betriebssystem im Browser benutzt werden kann. Aus historischen Gründen ist eine
kurze Anleitung zum PC-Client noch immer verfügbar.
Achtung, wichtig: Aus Copyright-Gründen ist nur ein Teil des IDS-Korpus öffentlich zugänglich. Und auch dieser Teil ist erst nach einer kostenlosen Registrierung für nicht-kommerzielle Zwecke verfügbar. Die Registrierung erfolgt hier:
https://perso.ids-mannheim.de/registration/
Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über
eine
Mitteilung.
Ebenso bei Fehlern und anderen Hinweisen!
Diese elektronische Ressource soll wie folgt zitiert werden:
Bubenhofer, Noah (2006-2025): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.