Mit AntConc arbeiten

AntConc ist ein Konkordanz-Programm zur Korpusanalyse. Es arbeitet mit Dateien im TXT, HTML oder XML-Format zusammen. Das zu analysierende Korpus muss also in diesen Formaten vorliegen. Dabei spielt es keine Rolle, ob das Korpus aus mehreren Dateien oder nur einer Datei besteht.

Die Software läuft auf allen wichtigen Betriebssystemen: Windows, Mac OS X und Linux.

Hier folgt eine Kurzanleitung, wie mit AntConc gearbeitet werden kann.

Erste Schritte

  1. Starte das Programm "AntConc".
  2. Über "File" -> "Open File(s)" kannst du eine oder mehrere Korpusdateien laden. Über "File" -> "Open Dir" kannst du einen Ordner angeben, in dem mehrere Korpusdateien liegen.
  3. Allenfalls muss die Codierung der Dateien angegeben werden. Im Zweifelsfall sollte man die Standardeinstellungen verwenden. Wenn Sonderzeichen falsch dargestellt werden, muss die Codierung angepasst werden. Das wird über das Menü "Global Settings" -> "Character Encoding" erledigt. Dort auf "Edit" klicken und dann im Menü "Standard Encodings" die korrekte Codierung auswählen. Anschliessend auf "Apply" klicken, um das Fenster wieder zu schliessen.
  4. In der linken Spalte sind nun alle geladenen Dateien aufgeführt. Im rechten Bereich sind über die Karteireiter verschiedene Tools verfügbar. Mit diesen arbeiten wir nun.

Konkordanzen

Der Karteireiter "Concordance" ermöglicht die Suche im Korpus und die Anzeige der Treffer als KWiC-Liste (Key Word in Context).

  1. Tippe in das Suchfeld "Search Term" ein beliebiges Suchwort ein. Achte auf die anklickbaren Kästchen oberhalb des Feldes:
    • Words: Der angegebene Suchausdruck ist ein ganzes Wort. Wenn diese Option nicht ausgewählt ist, können auch Worteile gefunden werden.
    • Case: Ist diese Option gewählt, wird die Gross- und Kleinschreibung des Suchbegriffs beachtet, ansonsten ignoriert.
    • Regex: Damit können sog. "Reguläre Ausdrücke" verwendet werden, um eine Suchanfrage zu formulieren. Bei diesen regulären Ausdrücken handelt es sich um eine mächtige Suchsprache. Vgl. für weitere Informationen das entsprechende Kapitel.
    Die Suche wird mit Klick auf "Start" gestartet. Nach dem Suchprozess werden die Anzahl Treffer im Feld "Concordance Hits" angezeigt.
  2. Die KWiC-Liste kann nach den Wörtern links und rechts des Suchausdrucks sortiert werden. Dazu kann unter "Kwic Sort" angegeben werden, wie sortiert werden soll. Es stehen drei "Levels" zur Verfügung, also Kriterien, die nacheinander beachtet werden. Mit Klick auf die Pfeiltasten der Felder kann z.B. mit "1L" angegeben werden, dass zunächst nach dem 1. Wort links sortiert werden soll. Ein Klick auf "Sort" führt die Sortierung aus.
  3. Mit einem Klick auf das hervorgehobene Suchwort in der KWiC-Liste kann man sich die entsprechende Stelle im Korpus anzeigen lassen.

Aufgabe: Suche nach beliebigen Suchausdrücken. Du kannst Wortteile, Wörter oder auch ganze Phrasen eingeben.

Mit der Option "Regex" kannst du nach Varianten suchen. So z.B. mit

(Haus|Häuser)
nach "Haus" oder "Häuser", mit
\w+weise
nach allen Wörtern, die mit "-weise" enden. ("|" steht für "oder", "\w" steht für einen beliebigen Buchstaben, "+" steht für "mindestens einmal"; weitere Infos.)

Kollokationen

Mit "Collocates" können Kollokatoren zu einem bestimmten Suchausdruck ermittelt werden.

  1. Dazu wird im Feld "Search Term" wieder ein beliebiger Suchausdruck eingegeben, z.B. "ich" (als Wort; "Words" angeklickt).
  2. Unter "Window Span" wird angegeben, in welchem Bereich links und rechts des Suchwortes nach Kollokatoren gesucht werden soll, also z.B. von 5 Wörtern links bis 5 Wörtern rechts. Zudem kann die minimal geforderte Frequenz des Kollokators angegeben werden ("Min. Collocate Frequeny").
  3. Mit dem Klick auf "Start" beginnen die Berechnungen. In der danach entstandenen Liste werden die Kollokatoren zum Suchbegriff ("Collocate") aufgeführt, sowie deren Frequenzen.
  4. AntConc kann die Kollokatoren nach einem statistischen Maß ("Stat") sortieren, wobei in den "Tool Preferences" -> "Collocates" -> "Selected Collocate Measure" das gewünschte Mass ausgewählt werden kann. (Tipp: Für die Berechnung von Kollokatonen eignet sich der t-Test etwas besser als MI.)

Weitere Möglichkeiten

AntConc bietet noch eine Reihe weiterer Möglichkeiten, z.B. das Erstellen von Wortlisten (Listen aller Wörter, die im Korpus vorkommen, geordnet nach Frequenz) oder das Berechnen von Clustern von häufig zusammen auftretenden Wörtern. Infos dazu gibt auch die ReadMe-Datei zum Programm, die hier zu finden ist.