DeReKo und COSMAS II des Instituts für Deutsche Sprache (IDS): Einführung

Das Institut für Deutsche Sprache in Mannheim unterhält mit dem DeReKo (Deutsches Referenzkorpus) eines der grössten deutschsprachigen Korpora. Es enthält über 46 Milliarden Wörter (Stand 18. 1. 2020) und ermöglicht linguistische Forschung auf empirischer Basis geschriebener Texte "aus der Gegenwart und der neueren Vergangenheit".

Das Korpus ist in eine Menge von Unterkorpora aufgeteilt, die teilweise auch morphologisch und syntaktisch annotiert sind.

Aufgabe 1
Auf der folgenden Webseite kannst du dir einen Überblick über das Korpusarchiv des IDS machen: https://www1.ids-mannheim.de/kl/projekte/korpora/
Der aktuelle Stand mit den neusten und geplanten Erweiterungen sind ebenso erwähnt wie aktuelle Veröffentlichungen zum Korpus. Informiere dich über den aktuellen Stand!

Um das Korpus abzufragen, gibt es COSMAS II, die Nachfolgeversion von COSMAS I, dem "Corpus Search, Management and Analysis System".

Es gibt zwei Möglichkeiten, COSMAS II zu verwenden: Einerseits über ein WWW-Interface, das mit jedem modernen Browser angesteuert werden kann, andererseits mit einem PC-Client, der auf Windows-PCs installiert werden kann. In diesem Kapitel fokussiere ich mich auf den WWW-Client, da dieser unproblematisch auf jedem Betriebssystem im Browser benutzt werden kann. Aus historischen Gründen ist eine kurze Anleitung zum PC-Client noch immer verfügbar.

Achtung, wichtig: Aus Copyright-Gründen ist nur ein Teil des IDS-Korpus öffentlich zugänglich. Und auch dieser Teil ist erst nach einer kostenlosen Registrierung für nicht-kommerzielle Zwecke verfügbar. Die Registrierung erfolgt hier: https://perso.ids-mannheim.de/registration/