Verwendung der annotierten DeReKo-Korpora in COSMAS II

Ein immer grösser werdender Teil des DeReKo ist mit Wortarten annotiert, also getagged. Damit werden Suchabfragen möglich, die in den anderen Korpora nicht möglich sind.

Die Archive "TAGGED-C" und "TAGGED-M" enthalten diese Korpora, wobei sich die beiden Archive dadurch unterscheiden, dass unterschiedliche Tagger verwendet wurden. "TAGGED-C" wurde mit dem CONNEXOR-Tagger, "TAGGED-T" mit dem TreeTagger annotiert. Darauf kann sowohl von der WWW-Version als auch vom PC-Client von COSMAS II aus zugegriffen werden, wobei in der WWW-Version eine grafische Menüsteuerung bei der Formulierung der Suchabfrage hilft.

Wähle also im WWW-Client von COSMAS das Archiv TAGGED-C. Anschliessend stehen einige virtuelle Korpora zur Verfügung. Das virtuelle Korpus "W-TAGGED-gesamt" enthält alle öffentlich zugänglichen annotierten Korpora.

Spezielle Suchsyntax

Um auf die Wortarteninformationen zugreifen zu können, ist eine spezielle Suchsyntax erforderlich. Grundsätzlich ist der Operator "MORPH()" dafür zuständig. Der hier verwendeten Annotation liegt das sog. CONNEXOR-Tagset zugrunde (beim Archiv "TAGGED-M" ist es das MECOLB-Minimal-Tagset). Das Tagset legt fest, welche Wortartklassen mit welchen Merkmalen verwendet werden.

In der WWW-Version gibt es einen morphosyntaktischen Assistenten, der bei der Verwendung dieses Operators hilft. Auf den Hilfe-Seiten von COSMAS II ist die Verwendung gut beschrieben. Im Prinzip funktioniert der Assistent folgendermassen:

Zuerst wird festgelegt, wonach gesucht werden soll. Man möchte z.B. nach "der" suchen, allerdings nur, wenn es sich dabei um ein Relativpronomen handelt.

Unterhalb des Eingabefensters klickt man auf "MORPH-Assistent" und es öffnet sich ein Fenster. Dort können die Wortklassen und ggf. entsprechende Unterkategorien ausgewählt werden. In unserem Fall wählen wir "Pronomen", wobei nach dem Klick auf "Übernehmen" der Operator ins Eingabefenster eingetragen wird:

MORPH(PRON)

Lässt man nur danach suchen, erhält man einfach alle Pronomen. Nun möchten wir das aber nur auf "der" anwenden. Wir müssen den Operator MORPH() also mit "der" verbinden. Das geschieht, indem wir den Wortabstandsoperator benutzen, und zwar mit dem Abstand 0. Also:

der /+w0:0 MORPH(PRON)

Das bedeutet also: Gesucht wird nach "der", das allerdings zusätzlich ein Pronomen sein muss.

Aufgabe 1
Verwende diese Suchanfrage in COSMAS und analysiere die Ergebnisse. Funktioniert es? Stimmen die Resultate?

Natürlich kann man einfach nach Wörtern suchen, die einer bestimmten Wortklasse angehören, ohne ein konkretes Lemma dazu anzugeben. Beispielsweise:

MORPH(A SUP) /w1:1 MORPH(N)

Gesucht wird damit nach einem Adjektiv im Superlativ (MORPH(A SUP)), dem unmittelbar ein Substantiv (MORPH(N)) folgt.

Aufgabe 2
Versuche nun folgende Suchanfragen zu formulieren oder finde eigene Fragestellungen, nach denen du suchen kannst!
  1. Suche Superlative! Anschliessend kannst du noch eine Kookkurrenzanalyse dazu machen.
  2. Suche Konstruktionen, bei denen nach einem Superlativ ein Verb folgt!
  3. Suche Adverb-Verb-Konstruktionen!
  4. Suche Belege für "schön" in adverbialer Funktion!