Radikale Veränderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. Künstliche Intelligenz kann automatisch Texte verfassen, übersetzen und redigieren. Trotzdem plagen wir uns noch immer mit Textverarbeitungsprogrammen, die zwischen Schreibmaschine und Code-Editor stecken geblieben sind. Und in den Wissenschaften wird noch immer darüber gestritten, was die richtige Publikationssprache ist, wie zitiert werden soll und wie Plagiate entdeckt werden können. In naher Zukunft könnte sich das Schreiben von wissenschaftlichen Texten so stark verändert haben, dass diese Fragen obsolet geworden sind. Dies ist Teil 1 einer Serie.
Thesen
Wenn es um das Schreiben von wissenschaftlichen Texten geht, zu dem ich auch die Recherche zähle, dann könnte es in den kommenden Jahren zu grossen Veränderungen kommen. Das hat etwas zu tun mit den neuen Möglichkeiten von grossen Sprachmodellen, die für Künstliche Intelligenz verwendet werden, wie das z.B. bei ChatGPT gerade sichtbar ist. Aber es hängt auch damit zusammen, dass sich nun endlich die Möglichkeit ergibt, Schreiben mit Computern nicht mehr als besseres Schreiben mit Schreibmaschinen aufzufassen, sondern ganz neu zu denken.
Hier die fünf Thesen, über die ich im Folgenden schreiben möchte:
- Schreib- und Rechercheunterstützung durch KI: Systeme der Künstlichen Intelligenz zum Generieren von Texten werden keine sinnvollen wissenschaftlichen Texte verfassen, uns aber eine riesige Hilfe beim Schreiben und Recherchieren sein.
- Die Frage nach der richtigen Publikationssprache ist obsolet: Ich verfasse meinen wissenschaftlichen Text in der Sprache, in der ich am liebsten schreibe. Die Leser:innen entscheiden selber, in welcher Sprache sie ihn rezipieren möchten. (Vgl. dazu Teil 2.)
- Vorgaben von Institutionen und Disziplinen zu bestimmten Bibliographieformaten sind überflüssig: Zitation kann endlich völlig losgelöst von Formalitäten betrachtet werden. (Vgl. dazu Teil 3.)
- Keine Plagiate mehr: Weil Zitation und Übernahme von Ideen sowieso technisch anders gelöst werden und Rechercheprozesse mit KI-Unterstützung anders verlaufen, wird es auch keine Plagiate mehr im eigentlichen Sinn geben.
- Andere Maschinen und Programme: Die Maschinen und Programme, mit denen wir wissenschaftliche Texte schreiben, müssen sich radikal verändern. Word & Co, OpenOffice aber auch LaTeX oder kollaborative Software wie Google Docs, Onlyoffice etc. sind völlig ungeeignete Tools. Auch die Computersysteme, mit denen wir arbeiten (Laptops, externe Bildschirme, Tastaturen, Tablets), sind ungeeignet.
Schreib- und Rechercheunterstützung durch KI
Till Heilmann unterscheidet in seinem Buch „Textverarbeitung“ drei Arten des Schreibens mit und für den Computer: Schreiben für den Computer, aber nicht mit den Computer (z.B. Programmieren mit Lochkarten), Schreiben für den Computer und mit dem Computer (Programmierung in einem Editor auf dem Computer) und Schreiben mit dem Computer aber nicht für den Computer: Klassische Textverarbeitung.
Diese drei Typen des Schreiben haben historisch auch die Entwicklung von Maschinen und Programmen geprägt: Die mechanische Schreibmaschine wurde von der elektrischen abgelöst, die dank Speicher eine erste Entfernung von Tippen und Drucken ermöglichte: Vor der Ausgabe der Zeile auf das Papier konnte die Eingabe überprüft und ggf. korrigiert werden.
Die ersten Computer wurden programmiert, indem Stecker gesteckt oder später Lochkarten gestanzt worden sind: Die Planung und das Verfassen des Programms geschah ausserhalb des Computers, was auf Dauer unpraktisch war: So wurden die Idee geboren, Computern ein Betriebssystem zu geben und darauf aufbauende Software, Editoren, mit denen das Programm direkt auf dem Computer erstellt und dessen Ausführung überwacht und das Programm sofort korrigiert werden konnte.
Erst danach entstand die Idee, solche Editoren auch für das Schreiben von beliebigen anderen Texten zu verwenden und somit die Vorteile der Live-Beeinflussung eines Textes, die mit dem Computer möglich geworden ist, zu nutzen.
Diese beiden Entwicklungsstränge – programmieren (schreiben für den Computer) und schreiben (für uns) – führten zu zwei unterschiedlichen Textverarbeitungssoftware-Typen:
In beiden kann beides gemacht werden. Ein Editor zeichnet sich jedoch dadurch aus, dass sein Dateiformat ein sog. txt-Format ist, also problemlos in jedem beliebigen Editor geöffnet werden kann. Zudem bietet er meistens sog. „Syntax Highlighting“, zeichnet also Strukturelemente und Befehle einer Programmiersprache farbig aus und bietet verschiedene Hilfestellungen für das Schreiben des Programmcodes. Zudem spielt der Druck eine untergeordnete Rolle: Die Länge des Textes orientiert sich nicht an Seiten, sondern an Zeilen. Wenn aus der Text- oder Programmstruktur eine logische Hierarchie ableitbar ist, hat diese Auswirkungen auf die verschiedenen Visualisierungen des Textes: Zeilen, die hierarchisch einer anderen Zeile untergeordnet sind, können z.B. ein- und ausgeklappt werden.
Ganz anders die Textverarbeitung: Sie zeigt noch immer Spuren der mechanischen Schreibmaschine: Es gibt einzustellende Ränder, Tabulatoren und eine grundsätzliche Orientierung an Seiten. Sie widerspiegeln jedoch auch die Bedürfnisse des Satzes und Drucks: Auszeichnungen spielen eine grosse Rolle: Fettdruck, kursiv, unterstrichen. Es können Schriftarten und -grössen ausgewählt und der Text gestaltet werden. Die meisten Textverarbeitungen folgen dem WYSIWYG-Prinzip: What you see is what you get, die Darstellung auf dem Bildschirm entspricht dem Druck. Bravo, von Xerox Parc 1974 veröffentlicht, gilt als erstes Textverarbeitungsprogramm mit grafischer Benutzeroberfläche und WYSIWYG.
Die Textverarbeitung bietet jedoch noch mehr: Formatvorlagen. Ein Konzept, das mit dem Editor mehr gemeinsam hat. Es handelt sich dabei um logische statt grafische Auszeichnungen: Titel 1. Ordnung, 2. Ordnung, Hervorhebung etc. werden Absätzen oder Zeichenketten zugewiesen. Die grafische Darstellung dieser Kategorien kann im Nachhinein beliebig geändert werden und es ist ein Leichtes, aus einem so formatierten Text automatisch die Titel auszulesen und ein Inhaltsverzeichnis zu erstellen.
Die meisten Textverarbeitungen erlauben jedoch einen wilden Mix verschiedener Prinzipien: Absätze können über Formatvorlagen formatiert werden, gleichzeitig jedoch auch grafisch, so dass im schlimmsten Fall nicht sichtbar ist, ob hinter der Formatierung eine logische Information steckt oder nicht.
Textverarbeitungen sind also einerseits Sprösslinge von Editoren und enthalten bis heute bestimmte Elemente von ihnen (logische Auszeichnungen, Suchen- und Ersetzen-Funktion, Anzeige im Entwurfsmodus ohne Paginierung), andererseits sind die Simulationen von Schreibmaschinen und Satz- und Layoutsystemen.
Nach und nach sind aber Unterstützungen hinzugekommen:
- Rechtschreib- und Grammatikkontrolle
- Wörterbücher und Thesauri
- Automatische Indexerstellung (Inhaltsverzeichnisse, Register)
- Bibliographiesoftware in Textverarbeitung eingebettet, um das Zitieren zu erleichtern
- Layouthilfen in Form von Styles, die einem Dokument verpasst und auch wieder geändert werden kann
- Integration von Inhalten aus anderen Programmen wie z.B. eines Diagrams aus einer Tabellenkalkulation mit Live-Update
- etc.
Nicht alle Benutzer:innen verwenden diese Unterstützungen. Ich beobachte bei meinen Studierenden aber auch Kolleg:innen in der Germanistik beispielsweise, dass der Einsatz von einer Bibliographiesoftware wie Zotero alles andere als üblich ist. Und das hängt wahrscheinlich damit zusammen, dass Textverarbeitung heute noch immer auf zwei völlig unterschiedlichen Kulturen beruht: Entweder der Schreibmaschinenkultur oder der Programmierkultur. Letztere möchte möglichst viele Routineaufgaben an die Maschine delegieren und nimmt dafür in Kauf, Daten strukturiert aufzunehmen (z.B. eine Bibliographiesoftware zu benutzen). Erstere kommt gar nicht auf die Idee, dass die Maschine sehr viel an Routineaufgaben übernehmen könnte und findet es zu aufwändig, einen Initialaufwand zu tätigen, um dann hinterher effizienter arbeiten zu können.
Nun gibt es aber mit den Möglichkeiten moderner „Künstlicher Intelligenz“ neue Möglichkeiten. Diese Systeme beruhen auf Sprachmodellen, die anhand sehr grosser Datenmengen gelernt haben, Wissensbestände zu reproduzieren und auf neue Daten anzuwenden. Ein Beispiel ist das neuste OpenAI-Modell, mit dem über das Interface ChatGPT kommuniziert werden kann.
Damit sind erstaunliche Dinge möglich. Ich kann zum Beispiel fragen:
Frage: Wie veränderte sich das Schreiben von Texten mit der Schreibmaschine im Vergleich zu heute? Was waren die entscheidenden Erfindungen, die das Schreiben verändert haben?
Antwort: Mit der Erfindung der Schreibmaschine im 19. Jahrhundert wurde das Schreiben von Texten deutlich schneller und einfacher. Durch die Möglichkeit, Buchstaben auf einem Blatt Papier mithilfe von Tasten statt mühsam mit der Hand zu schreiben, konnten Schriftstücke schneller verfasst werden. Die Schreibmaschine war auch ein wichtiger Fortschritt in Bezug auf die Lesbarkeit von Texten, da die Schrift durch die Nutzung der Maschine im Vergleich zur Handschrift klarer und deutlicher wurde.
Eine weitere wichtige Erfindung in Bezug auf das Schreiben von Texten war der Computer. Durch den Einsatz von Computern und Schreibprogrammen konnten Texte noch schneller und einfacher verfasst werden. Auch die Möglichkeit, Texte zu bearbeiten und zu korrigieren wurde deutlich verbessert.
Insgesamt hat sich das Schreiben von Texten durch die Nutzung von Schreibmaschinen und Computern deutlich verändert und ist heute ein viel schnellerer und einfacherer Prozess als noch vor Jahrzehnten.
ChatGPT, Dialog vom 6. Dezember 2022
Der Dialog kann fortgeführt werden und dabei kann das System auf die vergangenen Sequenzen zugreifen.
Es ist aber auch Folgendes möglich:
Frage: Ich möchte ein Script, das ein grosses Korpus als Text-Datei einliest, mit word2vec ein Modell berechnet und es dann clustert.
Antwort: Hier ist ein einfaches Beispiel für ein Python-Script, das ein großes Korpus als Textdatei einliest, mit dem Word2Vec-Modell von Gensim berechnet und anschließend clustert.
import gensim from gensim.models import Word2Vec from gensim.utils import simple_preprocess # Einlesen des Korpus als Textdatei with open("korpus.txt", "r") as f: text = f.read() # Tokenisieren des Korpus (Aufteilen des Textes in einzelne Wörter oder "Tokens") tokens = simple_preprocess(text) # Berechnen des Word2Vec-Modells model = Word2Vec(tokens, size=100, window=5, min_count=5, workers=4) # Berechnen der Word2Vec-Vektoren für die Wörter im Korpus vectors = [model[word] for word in model.wv.vocab] # Clustern der Word2Vec-Vektoren mithilfe des K-Means-Algorithmus kmeans = KMeans(n_clusters=10) kmeans.fit(vectors) # Ausgabe der zugewiesenen Cluster für jedes Wort im Korpus clusters = kmeans.predict(vectors) for i, word in enumerate(model.wv.vocab): print(f"{word}: {clusters[i]}")
Das Script berechnet das Word2Vec-Modell für das gegebene Korpus und clustert anschließend die Vektoren der Wörter mithilfe des K-Means-Algorithmus. Die zugewiesenen Cluster für jedes Wort werden dann ausgegeben.
Bitte beachte, dass dieses Beispiel sehr einfach gehalten ist und möglicherweise nicht für alle Anwendungsfälle geeignet ist. Für eine genauere und zuverlässigere Berechnung von Word2Vec-Modellen und Clustern könnten weitere Schritte wie die Feinabstimmung der Modellparameter oder die Verwendung anderer Clustering-Algorithmen erforderlich sein. Es wäre immer empfehlenswert, sich im Detail mit der Materie auseinanderzusetzen und gegebenenfalls professionelle Hilfe in Anspruch zu nehmen.
ChatGPT, Dialog vom 7. Dezember 2022
Viele Experimente mit ChatGPT testen, ob das Sprachmodell inhaltlich sinnvolle und interessante Texte produzieren kann. Das geht bis zu einem gewissen Grad, ist jedoch primär ein recht langweiliges Paraphrasieren von bestehenden Wissensbeständen. Viel interessanter ist es jedoch, damit die Brücke zwischen Schreibmaschinenkultur und Programmierkultur zu überwinden. Mögliche Aufgaben, die an eine KI ausgelagert werden könnten sind zum Beispiel (* = bereits möglich mit ChatGPT):
- Fasse mir bitte den Forschungsstand zum Thema XY der letzten fünf Jahre zusammen.
- Erstelle ein Abstract meines Textes. *
- Nenne mir Definitionen von XY in der Fachliteratur. (*)
- Paraphrasiere bitte diese Tabelle mit den statistischen Werten in drei Sätzen. *
- Beschreibe, was im Fach unter XY verstanden wird. (*)
Neben solchen Aufgaben, die eher inhaltlicher Natur sind, gibt es aber auch viele eher technische Aufgaben:
- Ich habe hier eine Liste von Aufsätzen in einem unstrukturierten Format: Bitte konvertiere sie in ein strukturiertes Format, so dass ich sie einfach in meine Bibliographiesoftware importieren kann. *
- Überprüfe bitte die Zitate auf ihre Korrektheit und bibliographiere sie richtig.
- Objektsprache sollte kursiv sein, ich habe vergessen, eine entsprechende Formatvorlage zu benutzen. Bitte erstelle eine Formatvorlage „Objektsprache“, finde alle Passagen mit Objektsprache und weise diese Formatvorlage zu. Definiere die Formatvorlage mit Schriftart „kursiv“.
- Zeitschrift XY will in der Bibliographie immer einen Punkt nach den Autor:innennamen und das Jahr am Ende, bitte ändere das entsprechend. (*)
- Erstelle mir ein Python-Script, um diese Wertetabellen in ein Diagramm zu konvertieren. *
Die letzte Aufgabe könnte natürlich auch unter Verwendung einer Bibliographiesoftware leicht erfüllt werden, aber noch bequemer ist es so.
Auch der Forschungs- und Rechercheprozess könnte durch die KI unterstützt werden:
- Überprüfe bitte, wie sich die Verwendung des Ausdrucks „Heimat“ in den letzten fünf Jahren in Schweizer Medien verändert hat. Ich hätte gerne nach Monaten aggregierte relative Häufigkeiten (pro Mio. Wörter) und eine Tabelle der verwendeten Quellen.
- Erstelle ein Script, um diese Textdateien, die alle das Muster XY haben, in XML-Dokumente zu konvertieren, damit ich sie hinterher mit der Software Z verarbeiten kann. *
- Erstelle ein Script, um diese Manuskripte über die API von Transkribus mit dem Modell XY zu bearbeiten.
Folgen
Das Schreiben wird sich unter Einsatz von KI stark verändern – diese Veränderungen stehen aber ein einer langen Tradition der maschinellen Unterstützung des Schreibens vom Papier zum Bildschirm und von der Feder über die Schreibmaschine zum Computer. Endlich bietet sich nun aber die Chance, dass Schreibmaschinenkultur und Programmierkultur auf dem Computer zusammenwachsen.
Allerdings mit Folgen:
- Welche Kompetenzen sind notwendig, um KI zu nutzen? Denn die Aufgabe muss sinnvoll gestellt und das Ergebnis korrekt eingeschätzt werden können – es muss angepasst, korrigiert und erweitert werden. Wir benötigen deshalb Data-Literacy und KI-Literarcy.
- Viele Tätigkeiten wissenschaftlichen Arbeitens, die man bislang als wichtig erachtete, werden unwichtig: Bibliographieren und zitieren nach einem bestimmten Stil, Forschungsstand erarbeiten, viel zitierte Fachliteratur identifizieren und paraphrasieren.
- Daraus folgt zwangsweise, dass in der Lehre neue Bewertungskriterien für die Bewertung von Qualifikationsarbeiten und von wissenschaftlichem Arbeiten gefunden werden müssen. Es macht keinen Sinn, darauf zu pochen, dass das Literaturverzeichnis vollständig ist oder nach Schema X formatiert ist – das ist eine Aufgabe, die wir an den Computer delegieren können. Auch die Paraphrasierung eines Forschungsstandes ist eher uninteressant – dessen Einordnung und die daraus abzuleitenden Folgerungen sind es aber natürlich sehr.
- Was jedoch dringend nötig ist: Die Förderung von Data-Literacy und KI-Literacy: Das Lesen und interpretieren von Daten, ein profundes Verständnis von Digitalität und Künstlicher Intelligenz – deren Chancen, Grenzen und Gefahren.
- Und ganz besonders: KI ist extrem attraktiv, ist jedoch immer stärker in den Händen kommerzieller Unternehmen. Für Universitäten wird es immer schwieriger, technologisch mitzuhalten, weil dafür einerseits viel Geld nötig ist, andererseits sich Universitäten eher an rechtliche und datenschützerische Schranken halten und deshalb an viele Daten gar nicht herankommen. Kommerzielle Unternehmen haben aber das Geld, um das Risiko von rechtlichen Auseinandersetzungen problemlos tragen zu können. Es ist daher schwierig, KI-gestützte Software als OpenSource-Software zu verbreiten.
Das ist aber noch nicht alles. Im nächsten Teil gehe ich darauf ein, warum die Frage zu Publikationssprachen in der Wissenschaft eigentlich vorbei sein sollte, vorausgesetzt wir entwickeln einen besseren Umgang mit Maschineller Übersetzung.
Kontext
Ich unterrichte momentan ein Seminar zum Thema „Stenographie, Schreibmaschine, Computer, Virtual Assistants: Die Kommunikationsgeschichte von Schreibkulturen“, in dessen Rahmen wir ebenfalls bloggen und uns rege austauschen – Dank an die Studierenden! Dadurch beschäftigte ich mich stark mit den medialen und kulturellen Bedingungen und Veränderungen des Schreibens mit Maschinen. Der Medienwissenschaftler Till Heilmann, Autor des Buches Textverarbeitung: Eine Mediengeschichte des Computers als Schreibmaschine, besuchte unser Seminar, ebenso der Linguist Andi Gredig; er verfasste das Buch Schreiben mit der Hand. Begriffe – Diskurs – Praktiken. Im regen Austausch zu medialen Bedingungen des Schreibens und zu maschineller Verarbeitung und Analyse von Text bin ich zudem mit Joachim Scharloth, Philippe Wampfler, Maaike Kellenberger, Julia Krasselt und vielen weiteren Personen. Danke!
Pingback: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Machine Cultures | Maschinenkulturen
Pingback: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 2 | Sprechtakel
Pingback: How we (could) write scientific texts in the future – part 1 | Sprechtakel
Pingback: Gamification-Szenarien in der (Hochschul)Lehre mit ChatGPT unterstützen – Katja Politt
Pingback: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3 | Sprechtakel