Archiv der Kategorie: Korpuslinguistik

Das Weltbild des Wissenschaftsjournalismus

Der Wissenschaftsjournalismus hat sich in den letzten Jahrzehnten stark gewandelt. Während früher Zeitungen berichteten, dass „Forscher in den USA gezeigt haben, dass…“, wird heute ein differenzierteres Bild der Wissenschaft gezeichnet: In der Wissenschaft gibt es keine einheitliche Meinung zu einem … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Methoden, Visual Linguistics | Verschlagwortet mit , , , , | Kommentare deaktiviert für Das Weltbild des Wissenschaftsjournalismus

Die Semantik von „Terrorismus“: LDA Topic Modelling

Was meinen wir eigentlich, wenn wir von „Terrorismus“ sprechen? 9/11? Der „Deutsche Herbst“ von 1977? Oder München 1972? Die Bedeutung von „Terrorismus“ ist breit und vor allem an bestimmte Diskurse gebunden. 1972 versteht man etwas anderes unter Terrorismus als heute. … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Methoden | Verschlagwortet mit , , , | Kommentare deaktiviert für Die Semantik von „Terrorismus“: LDA Topic Modelling

Die typische Bergtour

Als Korpuslinguist kann ich mit Hilfe des Text+Berg-Korpus der alpinistischen Periodika des Schweizer Alpenclubs von 1864 bis heute mal eine empirisch fundierte Geschichte erzählen: Die typische Bergtour. So sieht sie aus (Klick für zoombare SVG-Datei):

Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools, Methoden, Sprechtakel, Visual Linguistics | Verschlagwortet mit , , , , , , | Kommentare deaktiviert für Die typische Bergtour

Diachrone Analysen: Verlaufskurven clustern

Ein halbes Jahr schlief das Sprechtakel – das tut mir leid. Die Gründe drücken die Kollokatoren zu „Familie“ aus: -2 2 6210 Beruf Vereinbarkeit 413 60% die Vereinbarkeit [von] Familie [und] Beruf Bzw. zu „Job„: -1 -1 24466 neuen 4356 74% einen neuen […] Job Aber jetzt bin … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Methoden | Kommentare deaktiviert für Diachrone Analysen: Verlaufskurven clustern

Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen

Ich bin etwas stolz auf die folgende Grafik: Allerdings nicht, weil sie besonders schön aussehen würde oder weil der Inhalt sehr überraschend wäre, sondern weil sie methodisch elegant erstellt wurde. Nämlich in R unter direktem Zugriff auf die Corpus Workbench. … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , | Kommentare deaktiviert für Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen

LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen

Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit , , , , , | Ein Kommentar

Wulff’sche Floskeln

Jetzt, da die Bundespräsidentschaft von Christian Wulff zu Ende ist, möchte ich ein paar weitere Ergebnisse der Analysen dieser Affäre präsentieren. Das Thema heute: Floskeln. Mit einem datengeleiteten Verfahren können die typischen Sprachgebrauchmuster herausgearbeitet werden: Welche sprachlichen Muster sind typisch … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , | Kommentare deaktiviert für Wulff’sche Floskeln

Skandalisierung: Berichterstattung zu Wulff

Die Skandale um Bundespräsident Christian Wulff sind ein wunderbares Untersuchungsobjekt für die Linguistik. Genauer: Die Berichterstattung darüber. Wie wird ein Skandal sprachlich konstruiert? Um dies zu untersuchen habe ich ein kleines Korpus aller Artikel zu „Wulff“, die auf Bild.de und … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , , | Kommentare deaktiviert für Skandalisierung: Berichterstattung zu Wulff

Die Karte im Kopf: Über welche Orte schreiben wir?

Gerade bin ich auf eine Arbeit von Mark Graham gestoßen: Mapping Wikipedia’s augmentations of our planet. Er liest die Geotags von Wikipedia-Artikeln aus, um dann auf Karten darzustellen, welche Orte in der Wikipedia thematisiert werden. Wenn man die englischsprachige mit anderssprachigen … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel, Visual Linguistics | Verschlagwortet mit , , , | Kommentare deaktiviert für Die Karte im Kopf: Über welche Orte schreiben wir?

Sprechen über Berge

Das Text+Berg-Korpus eignet sich vorzüglich zu linguistische Studien für Liebhaberinnen und Liebhaber der Berge. Denn es enthält alle von 1864 bis 2009 erschienenen Jahrbücher und Alpen-Zeitschriften des Schweizer Alpenclubs: 196 Bände, knapp 36 Mio. Wörter in digitaler Form korpuslinguistisch aufbereitet. … Weiterlesen

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit , , , | Kommentare deaktiviert für Sprechen über Berge