Dieses Verzeichnis ist hoffnungslos veraltet. Ich kann die Liste von Adrien Barbaresi empfehlen, die Korpora und NLP-Tools für Deutsch aufführt!
Textverarbeitung (für ProgrammiererInnen)
jEdit
OpenSource TextEditor auf Java-Basis, läuft auf allen Betriebssystemen und ist über Plug-ins erweiterbar. Download
Betriebssystem: alle (auf Java basierend)
BBEdit
Auf dem Mac wohl bester Texteditor mit umfangreichen Textmanipulations-Werkzeugen (Grep-Suche, Zeilen sortieren, Textformat-Konversionen etc.). Kostenpflichtig (49$ im Bildungsbereich). Download
Betriebssystem: Mac OS X (ältere Versionen: Mac OS 9)
TextWrangler
Vom gleichen Hersteller wie BBEdit; etwas kleinerer Funktionsumfang wie BBEdit, dafür gratis erhältlich. Download
Betriebssystem: Mac OS X
Search & Replace
Kleines Tool, um eine oder mehrere Dateien rasch nach bestimmten Suchmustern zu durchsuchen und zu ersetzen. Grep-Suche mit regulären Ausdrücken möglich. Kostenpflichtig (25$). Download
Betriebssysteme: Windows
Crimson Editor
Ich muss zugeben: meinen Lieblingseditor für Windows habe ich bis jetzt nicht gefunden. Crimson Editor bietet immerhin vieles, was für korpuslinguistische Arbeiten nötig ist. (Für andere Tipps von Windows-NutzerInnen bin ich dankbar!) Download
Betriebssystem: Windows
kostenlos
Statistik
wordcount.pl
Perl-Script, um unterschiedliche Wörter in einer oder mehreren Dateien zu zählen. Download
Betriebssysteme: alle, auf denen Perl läuft
AntConc
Konkordanz-Programm, das auch N-Gramme und Wortcluster berechnen kann Download
Betriebssysteme: Windows, Mac OS X (unter X11), Linux
kostenlos
ConcApp
Konkordanz-Programm, findet auch Kollokationen Download
Betriebssystem: Windows
kostenlos
KWiCFinder
Durchsucht mit Hilfe einer Suchmaschine das Web, bietet ausgefeilte Suchmöglichkeiten und präsentiert die Resultate auf unterschiedliche Arten Download
Betriebssystem: Windows
kostenlos
kfNgram
Programm zur Erstellung von N-Grammen aus Text- oder HTML-Dateien Download
Betriebssystem: Windows
kostenlos
Ngram Statistics Package (NSP)
Berechnung von N-Grammen mittels ausgefeilter statistischer Methoden. Programmiert in Perl, ohne grafische Oberfläche Download
Betriebssysteme: Mac OS X, Unix-Systeme, Windows
kostenlos
Simple Concordance Program
Erstellt Wortlisten, lässt Korpus durchsuchen etc. Download
Betriebssysteme: Mac OS X und Windows
kostenlos
RFTagger
Werkzeug zur Annotierung von Texten mit feinkörnigen Wortart- und Lemma-Informationen (sprachunabhängig, trainiert für Deutsch, Tschechisch, Slowenisch und Ungarisch) Download
Betriebssysteme: Mac OS X, Unix/Linux
kostenlos
JBootCat
Java-Implementierung von BootCat: Scripts um ein eigenes Korpus aus Web-Dokumenten zusammenzustellen. Download
Betriebssysteme: plattformunabhängig
kostenlos
Web as Corpus Toolkit
Suite von Perl-Programmen, um auf Grund einer Liste von URLs Webseiten herunterzuladen, zu filtern, tokenisieren und archivieren lassen. Damit kann einfach ein Korpus an Webdokumenten zusammengestellt werden. Download/Infos
Betriebsysteme: Systeme mit installiertem Perl (Windows, Mac OS X, Linux/Unix)
Das Copyright dieses Kurses liegt bei Noah Bubenhofer. Bei Zitaten oder Verweisen darauf, freut der Autor sich über
eine Mitteilung.
Ebenso bei Fehlern und anderen Hinweisen! Diese elektronische Ressource soll wie folgt zitiert werden:
Bubenhofer, Noah (2006-2025): Einführung in die Korpuslinguistik: Praktische Grundlagen und Werkzeuge. Elektronische Ressource: http://www.bubenhofer.com/korpuslinguistik/.