-
Neueste Beiträge
- CatGPT: Wenn sich ein Sprachmodell bewegt
- Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3
- How we (could) write scientific texts in the future – part 2
- How we (could) write scientific texts in the future – part 1
- Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 2
Neueste Kommentare
- “Cat-GPT” – wie drückt ein Katzenroboter Sprache aus? | Discourse Lab bei CatGPT: Wenn sich ein Sprachmodell bewegt
- Philipp Zumstein bei Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3
- Noah Bubenhofer bei Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3
- Patrick Sahle bei Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3
- Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3 | Sprechtakel bei Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 2
Blogroll
Archive
- Oktober 2023
- Februar 2023
- Dezember 2022
- Dezember 2021
- November 2021
- Juli 2021
- April 2020
- Februar 2020
- März 2019
- Juli 2018
- November 2017
- Februar 2017
- Januar 2017
- Dezember 2016
- Juni 2016
- August 2015
- Juli 2015
- Mai 2015
- März 2015
- Dezember 2014
- November 2014
- August 2014
- Juli 2014
- Mai 2014
- Januar 2014
- August 2013
- Mai 2013
- März 2013
- Februar 2013
- Januar 2013
- Juni 2012
- Mai 2012
- Februar 2012
- Januar 2012
- November 2011
- Oktober 2011
- September 2011
- Dezember 2006
- November 2006
- Oktober 2006
- September 2006
- August 2006
- Juli 2006
- Juni 2006
- Mai 2006
- April 2006
- März 2006
- Februar 2006
- Januar 2006
- Dezember 2005
Kategorien
Meta
Archiv der Kategorie: Korpustools
Von Schätzen und Monstern. Drei Thesen zu Visualisierungspraktiken in den Digital Humanities
Visualisierungen wissenschaftlicher Daten boomen. Sie werden eingesetzt, um riesige Datenmengen überhaupt überblicken zu können, z.B. indem Beziehungen zwischen Akteuren als Netzwerk visualisiert werden. Dann wird plötzlich sichtbar, welche Akteure besonders eng verbandelt sind und wer besonders einflussreich ist. Solche „visuellen … Weiterlesen
Veröffentlicht unter Korpustools, Visual Linguistics
Verschlagwortet mit Algorithmus, Coding Cultures, Digital Humanities, Programmierung, Visual Analytics
2 Kommentare
Anatomie eines Textes: Bildgebendes Verfahren für Textkorpora
Was „zeigt“ sich, wenn eine Maschine einen Text „liest“, also sequenziell Wort für Wort abarbeitet? Eher für didaktische Zwecke habe ich eine kleine Spielerei versucht (und dabei mit P5.js experimentiert):
Veröffentlicht unter Korpuslinguistik, Korpustools, Visual Linguistics
Verschlagwortet mit bildgebende Verfahren, Ikonizität, Visual Linguistics
Kommentare deaktiviert für Anatomie eines Textes: Bildgebendes Verfahren für Textkorpora
Vom Download zum XML-Korpus: Gangbare Wege für die Lehre
Mein Online-Handbuch Korpuslinguistik („Einführung in die Korpuslinguistik„) enthält ein Kapitel zur Erstellung von eigenen Korpora. Es ist dabei das Ziel, einfache Wege zu beschreiben, wie man aus unterschiedlichen Quellen ein Korpus bauen kann – Wege, die auch für technisch weniger … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit AncConc, Corpus Workbench, Crawler, curl, CWB, Korpuserstellung, Korpustool, TagSoup, wget, XML, XSLT
Kommentare deaktiviert für Vom Download zum XML-Korpus: Gangbare Wege für die Lehre
Die typische Bergtour
Als Korpuslinguist kann ich mit Hilfe des Text+Berg-Korpus der alpinistischen Periodika des Schweizer Alpenclubs von 1864 bis heute mal eine empirisch fundierte Geschichte erzählen: Die typische Bergtour. So sieht sie aus (Klick für zoombare SVG-Datei):
Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools, Methoden, Sprechtakel, Visual Linguistics
Verschlagwortet mit Alpen, Bergsteigen, Gephi, Kollokationen, Korpustool, Netzwerk, Visual Linguistics
Kommentare deaktiviert für Die typische Bergtour
Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen
Ich bin etwas stolz auf die folgende Grafik: Allerdings nicht, weil sie besonders schön aussehen würde oder weil der Inhalt sehr überraschend wäre, sondern weil sie methodisch elegant erstellt wurde. Nämlich in R unter direktem Zugriff auf die Corpus Workbench. … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit Corpus Workbench, CWB, R, rcqp, Wulff
Kommentare deaktiviert für Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen
LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen
Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit AncConc, Corpus Workbench, kfnGram, Korpustool, LDA-Toolkit, R
Ein Kommentar
Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)
Um maschinell Wortarten zu bestimmen, gibt es fürs Deutsche den Part-of-Speech-Tagger „TreeTagger“ aus Stuttgart, eine Art Defakto-Standard fürs Deutsche (und andere Sprachen). Doch wie sieht es mit syntaktischem Parsing aus? Soeben meldete Rico Sennrich aus Zürich die Verfügbarkeit von ParZu: … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Verschlagwortet mit Computerlinguistik, Parser
Kommentare deaktiviert für Bäume zeichnen: Maschinelles syntaktisches Parsing (Deutsch)
Korpora und Wirklichkeit
Heute wieder in der Kategorie „Korpuslinguistik“ ganz fachlich/sachlich: Das Recherchenblog verweist auf eine Linkliste der Seite Infobroker.ch, auf der frei zugängliche Zeitungsdatenbanken aufgeführt sind. Das sind natürlich interessante Quellen für korpuslinguistische Studien. Die Infobroker-Seite ist ein Produkt der beiden Schweizer … Weiterlesen
Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools
Kommentare deaktiviert für Korpora und Wirklichkeit
Über den Wolken…
Anscheinend besuchte ich länger die Spiegel-Online-Seite nicht mehr: Erst heute fällt mir das neue Design auf. Am 6. September wurde anscheinend Version 7.0 der Nachrichtenseite veröffentlicht. Neu ist in der rechten Spalte die Darstellung „Themen des Tages“: Eine Art Wortwolke … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Kommentare deaktiviert für Über den Wolken…
Zeig mir wo die Bäume stehn!
Beim Wühlen in grossen Korpora sieht man manchmal den Wald vor lauter Bäumen nicht mehr. Man hangelt sich durch KWiC-Ansichten, Beleg- und Kollokationenlisten und findet kaum mehr raus. Manchmal ist es deshalb sinnvoll, Strukturen in Korpora zu visualisieren. Ausserhalb der … Weiterlesen
Veröffentlicht unter Korpuslinguistik, Korpustools
Kommentare deaktiviert für Zeig mir wo die Bäume stehn!