Archiv der Kategorie: Korpuslinguistik

Das Weltbild des Wissenschaftsjournalismus

Publiziert am 9. Mai 2013 von Noah Bubenhofer

Der Wissenschaftsjournalismus hat sich in den letzten Jahrzehnten stark gewandelt. Während früher Zeitungen berichteten, dass „Forscher in den USA gezeigt haben, dass…“, wird heute ein differenzierteres Bild der Wissenschaft gezeichnet: In der Wissenschaft gibt es keine einheitliche Meinung zu einem … Weiterlesen →

Veröffentlicht unter Korpuslinguistik, Methoden, Visual Linguistics | Verschlagwortet mit Geotagging, R, Visual Analytics, Visual Linguistics, Wissenschaftsjournalismus | Kommentare deaktiviert

Die Semantik von „Terrorismus“: LDA Topic Modelling

Publiziert am 6. März 2013 von Noah Bubenhofer

Was meinen wir eigentlich, wenn wir von „Terrorismus“ sprechen? 9/11? Der „Deutsche Herbst“ von 1977? Oder München 1972? Die Bedeutung von „Terrorismus“ ist breit und vor allem an bestimmte Diskurse gebunden. 1972 versteht man etwas anderes unter Terrorismus als heute. … Weiterlesen →

Veröffentlicht unter Korpuslinguistik, Methoden | Verschlagwortet mit LDA, Semantik, Terrorismus, Topic Modeling | Kommentare deaktiviert

Die typische Bergtour

Publiziert am 21. Februar 2013 von Noah Bubenhofer

Als Korpuslinguist kann ich mit Hilfe des Text+Berg-Korpus der alpinistischen Periodika des Schweizer Alpenclubs von 1864 bis heute mal eine empirisch fundierte Geschichte erzählen: Die typische Bergtour. So sieht sie aus (Klick für zoombare SVG-Datei):

Veröffentlicht unter Korpora, Korpuslinguistik, Korpustools, Methoden, Sprechtakel, Visual Linguistics | Verschlagwortet mit Alpen, Bergsteigen, Gephi, Kollokationen, Korpustool, Netzwerk, Visual Linguistics | Kommentare deaktiviert

Diachrone Analysen: Verlaufskurven clustern

Publiziert am 17. Januar 2013 von Noah Bubenhofer

Ein halbes Jahr schlief das Sprechtakel – das tut mir leid. Die Gründe drücken die Kollokatoren zu „Familie“ aus: -2 2 6210 Beruf Vereinbarkeit 413 60% die Vereinbarkeit [von] Familie [und] Beruf Bzw. zu „Job„: -1 -1 24466 neuen 4356 74% einen neuen […] Job Aber jetzt bin … Weiterlesen →

Veröffentlicht unter Korpuslinguistik, Methoden | Kommentare deaktiviert

Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen

Publiziert am 5. Juni 2012 von Noah Bubenhofer

Ich bin etwas stolz auf die folgende Grafik: Allerdings nicht, weil sie besonders schön aussehen würde oder weil der Inhalt sehr überraschend wäre, sondern weil sie methodisch elegant erstellt wurde. Nämlich in R unter direktem Zugriff auf die Corpus Workbench. … Weiterlesen →

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit Corpus Workbench, CWB, R, rcqp, Wulff | Kommentare deaktiviert

LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen

Publiziert am 5. Mai 2012 von Noah Bubenhofer

Korpuslinguistische Analysen begnügen sich heute nicht mehr damit, bloß Belege für ein bestimmtes Phänomen in einem bestehenden Korpus zu suchen. Vielmehr möchte man eigene Korpora aufbauen und avanciertere Analysemethoden anwenden: Automatisches Wortarten-Tagging der Daten Keyword-Analysen durch Vergleich mehrerer Korpora miteinander … Weiterlesen →

Veröffentlicht unter Korpuslinguistik, Korpustools | Verschlagwortet mit AncConc, Corpus Workbench, kfnGram, Korpustool, LDA-Toolkit, R | Ein Kommentar

Wulff’sche Floskeln

Publiziert am 17. Februar 2012 von Noah Bubenhofer

Jetzt, da die Bundespräsidentschaft von Christian Wulff zu Ende ist, möchte ich ein paar weitere Ergebnisse der Analysen dieser Affäre präsentieren. Das Thema heute: Floskeln. Mit einem datengeleiteten Verfahren können die typischen Sprachgebrauchmuster herausgearbeitet werden: Welche sprachlichen Muster sind typisch … Weiterlesen →

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit Floskeln, Politik, Skandal, Sprachgebrauchsmuster | Kommentare deaktiviert

Skandalisierung: Berichterstattung zu Wulff

Publiziert am 21. Januar 2012 von Noah Bubenhofer

Die Skandale um Bundespräsident Christian Wulff sind ein wunderbares Untersuchungsobjekt für die Linguistik. Genauer: Die Berichterstattung darüber. Wie wird ein Skandal sprachlich konstruiert? Um dies zu untersuchen habe ich ein kleines Korpus aller Artikel zu „Wulff“, die auf Bild.de und … Weiterlesen →

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit Adjektive, Deutschland, Skandal, Wahlen, Wulff | Kommentare deaktiviert

Die Karte im Kopf: Über welche Orte schreiben wir?

Publiziert am 12. November 2011 von Noah Bubenhofer

Gerade bin ich auf eine Arbeit von Mark Graham gestoßen: Mapping Wikipedia’s augmentations of our planet. Er liest die Geotags von Wikipedia-Artikeln aus, um dann auf Karten darzustellen, welche Orte in der Wikipedia thematisiert werden. Wenn man die englischsprachige mit anderssprachigen … Weiterlesen →

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel, Visual Linguistics | Verschlagwortet mit Diskurs, Geotagging, NZZ, Visual Linguistics | Kommentare deaktiviert

Sprechen über Berge

Publiziert am 28. Oktober 2011 von Noah Bubenhofer

Das Text+Berg-Korpus eignet sich vorzüglich zu linguistische Studien für Liebhaberinnen und Liebhaber der Berge. Denn es enthält alle von 1864 bis 2009 erschienenen Jahrbücher und Alpen-Zeitschriften des Schweizer Alpenclubs: 196 Bände, knapp 36 Mio. Wörter in digitaler Form korpuslinguistisch aufbereitet. … Weiterlesen →

Veröffentlicht unter Korpora, Korpuslinguistik, Sprechtakel | Verschlagwortet mit Alpen, Bergsteigen, Schweiz, Wortwolke | Kommentare deaktiviert

Archiv der Kategorie: Korpuslinguistik

Das Weltbild des Wissenschaftsjournalismus

Die Semantik von „Terrorismus“: LDA Topic Modelling

Die typische Bergtour

Diachrone Analysen: Verlaufskurven clustern

Statistische Analysen von Korpora: Mit R direkt auf die CWB zugreifen

LDA-Toolkit: Korpusanalyse zum Klicken statt Tippen

Wulff’sche Floskeln

Skandalisierung: Berichterstattung zu Wulff

Die Karte im Kopf: Über welche Orte schreiben wir?

Sprechen über Berge

Neueste Beiträge

Neueste Kommentare

Blogroll

Archive

Kategorien

Meta