IDS Korpus für gesprochene Sprache

Das Archiv für Gesprochenes Deutsch des Instituts für Deutsche Sprache archiviert die bei Spracherhebungen und in Forschungsprojekten erstellten Korpora von gesprochenem Deutsch. Das Archiv enthält gut 8000 "Interaktionen", also Interviews, Monologe, Erzählungen, Beratungsgespräche, Diskussionen etc.

Der Fokus der Aufnahmen liegt auf varietätenlinguistischen Untersuchungsinteressen. Es finden sich also Sprecherinnen und Sprecher unterschiedlichster Mundarten, darunter auch Deutsch im Nichtdeutschen Ausland, historische Aufnahmen usw. Eine Tabelle der enthaltenen Dokumente ist hier verfügbar.

Von grossem Wert ist, dass die meisten Aufnahmen transkribiert und Tonspur und Transkription aligniert wurden. So kann eine bestimmte Passage im Transkript gleich angehört werden.

Registrierung

Ohne Registrierung ist nur ein ganz kleiner Teil zugänglich. Für wissenschaftliche Zwecke ist eine Registration kostenlos und online schnell gemacht:

http://dsav-wiss.ids-mannheim.de/DSAv/ANMELDEN/PERSONAL.HTM

Recherche

Hat man sich für die "Wissenschaftler-Version" registriert, kann man über die Suchmaske nach vielfältigen Kriterien das Korpus durchsuchen. Die Suchmaske ist etwas unübersichtlich; die wichtigsten Optionen befinden sich aber oben und ganz unten.

Oben kann die Suche auf bestimmte Teilkorpora begrenzt werden. Eine Checkbox ermöglicht die Angabe, dass in allen Korpora gesucht werden soll.

Fast ganz unten, im blau hinterlegten Suchbereich, können Suchbegriffe definiert werden, nach denen die Transkripte durchsucht werden sollen. Es ist möglich, mit dem Stern (*) Wörter zu trunkieren.

Resultate

Auf der Resultate-Seite werden die Treffer in KWIC-Darstellung angezeigt:



Ein Klick auf die Korpusbezeichnung ganz links führt zu Informationen zum Korpus. Je nach Stand der Aufbereitung der Daten erscheinen neben der Korpusbezeichnung die Buchstaben T (für Transkript) und W (Ton im WMA-Format) und M (Ton im MP3-Format). Ein Klick darauf zeigt das Transkript bzw. spielt den KWIC-Ausschnitt ab. (Welches Tonformat gewählt werden soll, hängt von der Konfiguration des Computers ab. Unter Windows funktioniert normalerweise das WMA-Format, wenn der Windows Media Player installiert ist, unter anderen Betriebssystemen das MP3-Format.)

Schaut man sich das Trankript an, kann mit Doppelklick auf eine Transkriptstelle der zugehörige Ton angehört werden (sofern das Transkript mit dem Ton aligniert ist). Die verwendete Transkriptkonvention ist ebenfalls im Kopf der Transkript-Datei abrufbar.