IDS Korpus für gesprochene Sprache
Das
Archiv für Gesprochenes Deutsch des Instituts für Deutsche Sprache archiviert die bei Spracherhebungen und in Forschungsprojekten erstellten Korpora von gesprochenem Deutsch. Das Archiv enthält gut 8000 "Interaktionen", also Interviews, Monologe, Erzählungen, Beratungsgespräche, Diskussionen etc.
Der Fokus der Aufnahmen liegt auf varietätenlinguistischen Untersuchungsinteressen. Es finden sich also Sprecherinnen und Sprecher unterschiedlichster Mundarten, darunter auch Deutsch im Nichtdeutschen Ausland, historische Aufnahmen usw. Eine Tabelle der enthaltenen Dokumente ist
hier verfügbar.
Von grossem Wert ist, dass die meisten Aufnahmen transkribiert und Tonspur und Transkription aligniert wurden. So kann eine bestimmte Passage im Transkript gleich angehört werden.
Recherche
Hat man sich für die "Wissenschaftler-Version" registriert, kann man über die Suchmaske nach vielfältigen Kriterien das Korpus durchsuchen. Die Suchmaske ist etwas unübersichtlich; die wichtigsten Optionen befinden sich aber oben und ganz unten.
Oben kann die Suche auf bestimmte Teilkorpora begrenzt werden. Eine Checkbox ermöglicht die Angabe, dass in allen Korpora gesucht werden soll.
Fast ganz unten, im blau hinterlegten Suchbereich, können Suchbegriffe definiert werden, nach denen die Transkripte durchsucht werden sollen. Es ist möglich, mit dem Stern (*) Wörter zu trunkieren.
Resultate
Auf der Resultate-Seite werden die Treffer in KWIC-Darstellung angezeigt:
Ein Klick auf die Korpusbezeichnung ganz links führt zu Informationen zum Korpus. Je nach Stand der Aufbereitung der Daten erscheinen neben der Korpusbezeichnung die Buchstaben T (für Transkript) und W (Ton im WMA-Format) und M (Ton im MP3-Format). Ein Klick darauf zeigt das Transkript bzw. spielt den KWIC-Ausschnitt ab. (Welches Tonformat gewählt werden soll, hängt von der Konfiguration des Computers ab. Unter Windows funktioniert normalerweise das WMA-Format, wenn der Windows Media Player installiert ist, unter anderen Betriebssystemen das MP3-Format.)
Schaut man sich das Trankript an, kann mit Doppelklick auf eine Transkriptstelle der zugehörige Ton angehört werden (sofern das Transkript mit dem Ton aligniert ist). Die verwendete Transkriptkonvention ist ebenfalls im Kopf der Transkript-Datei abrufbar.
Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über
eine
Mitteilung.
Ebenso bei Fehlern und anderen Hinweisen!
Diese elektronische Ressource soll wie folgt zitiert werden:
Bubenhofer, Noah (2006-2024): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.