Verwendung der annotierten DeReKo-Korpora in COSMAS II
Ein immer grösser werdender Teil des DeReKo ist mit Wortarten
annotiert, also getagged. Damit werden Suchabfragen möglich, die in den anderen Korpora nicht möglich sind.
Die Archive "TAGGED-C" und "TAGGED-M" enthalten diese Korpora, wobei sich die beiden Archive dadurch unterscheiden, dass unterschiedliche Tagger verwendet wurden. "TAGGED-C" wurde mit dem CONNEXOR-Tagger, "TAGGED-T" mit dem
TreeTagger annotiert. Darauf kann sowohl von der WWW-Version als auch vom PC-Client von COSMAS II aus zugegriffen werden, wobei in der WWW-Version eine grafische Menüsteuerung bei der Formulierung der Suchabfrage hilft.
Wähle also im WWW-Client von COSMAS das Archiv TAGGED-C. Anschliessend stehen einige virtuelle Korpora zur Verfügung. Das virtuelle Korpus "W-TAGGED-gesamt" enthält alle öffentlich zugänglichen annotierten Korpora.
Spezielle Suchsyntax
Um auf die Wortarteninformationen zugreifen zu können, ist eine spezielle Suchsyntax erforderlich. Grundsätzlich ist der Operator "MORPH()" dafür zuständig. Der hier verwendeten Annotation liegt das sog.
CONNEXOR-Tagset zugrunde (beim Archiv "TAGGED-M" ist es das
MECOLB-Minimal-Tagset). Das
Tagset legt fest, welche Wortartklassen mit welchen Merkmalen verwendet werden.
In der WWW-Version gibt es einen
morphosyntaktischen Assistenten, der bei der Verwendung dieses Operators hilft. Auf den Hilfe-Seiten von COSMAS II ist
die Verwendung gut beschrieben. Im Prinzip funktioniert der Assistent folgendermassen:
Zuerst wird festgelegt, wonach gesucht werden soll. Man möchte z.B. nach "der" suchen, allerdings nur, wenn es sich dabei um ein Relativpronomen handelt.
Unterhalb des Eingabefensters klickt man auf "MORPH-Assistent" und es öffnet sich ein Fenster. Dort können die Wortklassen und ggf. entsprechende Unterkategorien ausgewählt werden. In unserem Fall wählen wir "Pronomen", wobei nach dem Klick auf "Übernehmen" der Operator ins Eingabefenster eingetragen wird:
Lässt man nur danach suchen, erhält man einfach alle Pronomen. Nun möchten wir das aber nur auf "der" anwenden. Wir müssen den Operator MORPH() also mit "der" verbinden. Das geschieht, indem wir den
Wortabstandsoperator benutzen, und zwar mit dem Abstand 0. Also:
Das bedeutet also: Gesucht wird nach "der", das allerdings zusätzlich ein Pronomen sein muss.
Aufgabe 1
|
---|
Verwende diese Suchanfrage in COSMAS und analysiere die Ergebnisse. Funktioniert es? Stimmen die Resultate?
|
Natürlich kann man einfach nach Wörtern suchen, die einer bestimmten Wortklasse angehören, ohne ein konkretes Lemma dazu anzugeben. Beispielsweise:
MORPH(A SUP) /w1:1 MORPH(N)
|
Gesucht wird damit nach einem Adjektiv im Superlativ (MORPH(A SUP)), dem unmittelbar ein Substantiv (MORPH(N)) folgt.
Aufgabe 2
|
---|
Versuche nun folgende Suchanfragen zu formulieren oder finde eigene Fragestellungen, nach denen du suchen kannst!
- Suche Superlative! Anschliessend kannst du noch eine Kookkurrenzanalyse dazu machen.
- Suche Konstruktionen, bei denen nach einem Superlativ ein Verb folgt!
- Suche Adverb-Verb-Konstruktionen!
- Suche Belege für "schön" in adverbialer Funktion!
|
Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über
eine
Mitteilung.
Ebenso bei Fehlern und anderen Hinweisen!
Diese elektronische Ressource soll wie folgt zitiert werden:
Bubenhofer, Noah (2006-2024): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.