Die Interaktionsdesignerin Nadine Prigann interessierte sich für die Frage, wie Sprachdaten interaktiv visualisiert werden können. Daraus ist ihre BA-Arbeit „Explorative Spatial Analysis“ an der Zürcher Hochschule der Künste entstanden, die auf meinen Analysen zu den 14.000 Geburtsberichten beruht, in denen Mütter in Online-Foren über die Geburten ihrer Kinder erzählen.
In einigen Diskussionen sind wir zu interessanten Einsichten zu Daten, Datentransformationen und Lektüre gelangt. Ausgangspunkt waren meine Berechnungen von typischen narrativen Mustern in den Geburtsberichten (Blogbeitrag, Publikation in der Zeitschrift LiLi). Diese bestehen aus n-Grammen (Mehrworteinheiten) und deren typische Positionen in den Geschichten. Dazu erstellte ich auch verschiedene Visualisierungen, die der Exploration der Daten dienten:
Durch Nadine Priganns Lektüre der Daten entstand eine neue Umsetzung als Installation im Raum. Ein Video gibt die Installation am besten wieder:
Ambientsound
Als ich den Raum betrat, nahm ich zunächst die zahlreichen roten Acrylglasplatten wahr – und parallel dazu den Hintergrundsound, ein typischer digitaler Ambientsound, der zusammen mit dem beherrschenden Rot in eigenartigem Gegensatz steht zum Thema, das die Daten repräsentieren: Der Schmerz und die Intensität des Erlebnisses Geburt.
Die Acrylglasplatten sind an Neonfäden aufgehängt. Sie stehen für die n-Gramme und die Höhe im Raum repräsentiert deren Frequenz. Sie Platten sind ebenfalls auf den Achsen Fortgang der Geschichte und Clusterähnlichkeit im Raum angeordnet; die drei Achsen x, y und z (= Häufigkeit) sind also in einen realen Raum übertragen.
Gleichzeitig ergeben sich durch die Beleuchtung der Platten aber Farbreflexionen auf dem Boden, wobei die häufigeren, also weiter oben hängenden Platten eine größere Reflexion auf dem Boden produzieren. Damit wird ein Effekt der Dimensionsreduktion von 3D auf 2D erfahrbar.
Computerstimme
Man kann sich nun durch die Installation hindurch bewegen und nimmt bei den jeweiligen Clustern eine Computerstimme wahr, die die n-Gramme vorliest. Hier kommt nun der krasse Gegensatz zwischen Ambient-Hintergrundsound, Text (z.B. „hielt es nicht mehr aus“, „legte mir auf den Bauch“ etc.) und der nüchtern-maschinellen Computerstimme zum tragen. Diese Diskrepanz löst dann wohl im besten Fall eine Reflexion über Erlebnis, Daten und statistische Berechnung aus, wie ich es mit dem Ausdruck „Serialität der Singularität“ als Titel meines Beitrags ausdrücken wollte.
Die Installation war während etwa zweier Wochen ausgestellt und Nadine Prigann erzählte mir auch von den Reaktionen der Besucher_innen. Offensichtlich verstanden die meisten, dass es „irgendwie um Daten geht“. Die Installation nimmt ja die Grundfigur des Streudiagramms auf, eigentlich eine außerhalb der Wissenschaft eher seltenere Diagrammform. Doch die massenhaft wiederkehrende Grundform des Quadrates wird wohl schematisch gelesen und so ist der Weg zum Diagramm naheliegend.
Lektüre
Für mich ist an der Arbeit von Nadine Prigann ein weiterer Aspekt interessant: In meinem Text „Wenn ‚Linguistik‘ in ‚Korpuslinguistik‘ bedeutungslos wird. Vier Thesen zur Zukunft der Korpuslinguistik“ im aktuellen OBST-Band zu Korpuslinguistik stellte ich die unter anderem folgende zwei aufeinander aufbauenden Thesen auf:
These 2: Bei der quantitativen Analyse von Sprache droht die Linguistik bedeutungslos zu werden
These 3: Um der Bedeutungslosigkeit zu entgehen, sind zwei Dinge wichtig: Linguistische Theorie und die hermeneutische Deutung der Ergebnisse quantitativer Analysen
These 2 thematisiert, dass noch nie so viele Menschen damit beschäftigt waren, um Sprache zu analysieren und zu prozessieren, wenn man an die zahlreichen Anwendungen um Text Mining, Information Retrieval, maschinelles Übersetzen etc. denkt. Allerdings sind dabei linguistische Theorien mehr oder weniger bedeutungslos.
Ein wichtiger Aspekt, um dem etwas entgegenzuhalten, ist jedoch die geisteswissenschaftliche Tradition der Lektüre stark zu machen und auf Ergebnisse von Datenanalysen anzuwenden. Denn in der utilitaristischen Denkweise des Text Minings (und verwandter Anwendungen) sind Datenanalysen nur Mittel zum Zweck, um damit ein Tool zu ermöglichen, das eine Aufgabe gut löst. Wenn die Aufgabe gut gelöst wird, ist die Datenanalyse nicht mehr interessant. Um jedoch zu verstehen, was maschinelle Verarbeitung von Sprachdaten macht, von welchen Prämissen sie ausgeht, von welchen Modellen von Sprache, müssen solche Analyeergebnisse genauso gelesen und gedeutet werden, wie das in philologischer Tradition gemacht wird. Dies zwar mitunter mit anderen Methoden und Erkenntnisinteressen, aber ein Analyseergebnis ist nichts weiter als ein weiterer Text.
Für Nadine Prigann waren meine Daten auch ein Text, den sie einer eigenen Logik unterzogen und neu interpretiert (mit Ludwig Jäger könnte man sagen: transkribiert) hat. Diese Logik ist eine des Interaktionsdesigns, der Ästhetik, des Erlebnisses, der Verkörperlichung. Es ist nicht die richtigere Visualisierung, sondern eine neue Deutung.