Radikale Veränderungen im Zusammenspiel von Maschine und Mensch beim Schreiben von Texten sind im Gang. Künstliche Intelligenz kann automatisch Texte verfassen, übersetzen und redigieren. Im zweiten Teil der Serie möchte ich auf meine zweite These eingehen: Schon bald wird in der Wissenschaft die Frage nach der richtigen Publikationssprache obsolet sein. Ich verfasse meinen wissenschaftlichen Text in der Sprache, in der ich am liebsten schreibe. Die Leser:innen entscheiden selber, in welcher Sprache sie ihn rezipieren möchten.
Englisch ist zweifellos die wichtigste Publikationssprache in den Wissenschaften geworden. Das wird immer wieder kontrovers diskutiert, z.B. von einem Politikwissenschaftler, einem Romanisten und einer Germanistin. Zu recht wird argumentiert, das sprachliche Vielfalt auch in der Wissenschaft wichtig ist – wobei die Meinungen auseinander gehen, ob eine vorherrschende Publikationssprache Englisch unter dem Strich positiv ist, weil sie die Reichweite von Publikationen massiv erhöht.
Ich meine, dass mit den Mitteln der maschinellen Übersetzung eigentlich schon heute die Sprachenfrage für Publikationen in der Wissenschaft obsolet sein könnte. Allerdings nur unter bestimmten Bedingungen und Annahmen:
- Menschliche Übersetzungen werden wahrscheinlich noch sehr lange besser und für viele Zwecke passender sein als maschinelle Übersetzungen. Wobei klar ist, dass auch menschliche Übersetzungen immer auch maschinelle Hilfsmittel nutzen (und auch schon lange benutzten).
- Maschinelle Übersetzungen könnten aber gezielt eingesetzt und dabei an spezifische Bedürfnisse von wissenschaftlichen Publikationen angepasst werden, so dass in der Wissenschaft eine deutlich grössere Sprachpluralität gelebt werden könnte.
- Entscheidend dabei: Wir brauchen in der Wissenschaft dafür nicht primär „covert“, sondern „overt“ Übersetzungen, also nicht „verdeckte“, sondern „offene“ (House 2005). Mit intelligenten, KI-unterstützter maschineller Übersetzung ergeben sich hier ganz neue Möglichkeiten.
Juliane House vergleicht verschiedene Übersetzungskonzepte, die eine lange Tradition haben, und unterscheidet „offene“ (overt) von „verdeckenden“ (covert) Verfahren. Vereinfacht gesagt: Verdeckte Übersetzungen wollen in der Zielsprache einen Text erzeugen, bei dem seine Herkunft und Ausgangssprache im besten Fall gar nicht mehr sichtbar ist. Er soll sich nicht nur sprachlich perfekt an die Zielsprache angeschmiegt haben, sondern auch die Kontexte und kulturellen Besonderheiten der Zielsprache und Zielkultur aufnehmen.
Anders die offene Übersetzung: Sie möchte möglichst transparent machen, was der kulturelle Kontext des Ausgangstextes ist. Dadurch ist die Übersetzung vielleicht schwerer verständlich, gibt jedoch ein deutliches Bild der Entstehensbedingungen des Textes.
Wir kennen diese Tradition der offenen Übersetzungen sehr gut, z.B. in Form der Paralleltexte, der zweisprachigen, kommentierten Ausgaben (oder von Glossen als Übersetzungshilfen in mittelalterlichen lateinischen Handschriften). Hier Beispiele von Piccolominis Euryalus und Lucretia auf Lateinisch und Deutsch, sowie von Aristoteles Poetik Griechisch/Deutsch:
Das ist es, was wir für wissenschaftliche Publikationen benötigen – kombiniert jedoch mit den neuen Möglichkeiten der KI und der maschinellen Übersetzung.
Mit der Verwendung von ChatGPT als Beispiel für eine mächtige KI ist z.B. Folgendes möglich:
Prompt: Übersetze bitte den folgenden Text auf Englisch, füge aber nach jedem Satz das Original hinzu und formatiere nach folgendem Muster: <span lang=“en“>Englischer Satz.</span> <span lang=“de“>Deutsches Original.</span>. Hier der zu übersetzende Text:
[Text]Ausgabe: <span lang=“en“>When it comes to writing scientific texts […] </span> <span lang=“de“>Wenn es um das Schreiben von wissenschaftlichen Texten geht […] </span>
ChatGPT-Dialog vom 15. 12. 2022
Das ist nicht weiter aufregend; geschickt formatiert lässt sich daraus jedoch eine Textansicht generieren, bei der beim Überfahren des Satzes mit der Maus bei Bedarf das Original angezeigt wird.
Interessanter wird es aber mit folgendem Schritt:
Prompt: Sehr gut. Jetzt markiere im Englischen Text zusätzlich Wörter, bei denen die Übersetzung unsicher ist. Markiere sie nach dem folgenden Muster: english expression (dt: deutsches Original). Füge ein span-Element mit title-Attribut hinzu, in das du eine Erklärung gibst, warum die Übersetzung unsicher ist.
Ausgabe (in HTML – hier Ansicht im Browser):
ChatGPT-Dialog vom 15. 12. 2022
Damit ergibt sich ein neuer Umgang mit maschineller Übersetzung in der Wissenschaft, da sich dieser Prozess weitgehend automatisieren lässt. Eine Zeitschrift könnte den Autor:innen erlauben, ihre Texte in einer (fast) beliebigen Sprache einzureichen. Wenn der Text publiziert ist, kann die:der Leser:in selber über die Ausgabesprache entscheiden – bzw. genauer: erhält eine offene Übersetzung im Paralleltext. Darin ist ersichtlich:
- Das Original ist beliebig stark sichtbar oder unsichtbar: Wenn ich als Leser:in die Originalsprache z.B. passiv ganz gut verstehe und nur kleinere Unsicherheiten habe, darf das Original sehr präsent sein. Wenn mir die Originalsprache weitgehend unverständlich ist, dann muss die offene Übersetzung primär sichtbar sein.
- Passagen, Ausdrücke, bei der die maschinelle Übersetzung unsicher ist (oder typischerweise Fehler passieren, vgl. Czulo et al. 2022), werden entsprechend markiert: Hier werde ich gewarnt, über die möglichen Unsicherheiten aufgeklärt und mir wird ein Blick ins Original nahegelegt.
- Bereits die:der Autor:in des Textes markiert im Text wichtige Passagen, z.B. Terminologie, Definitionen o.ä., denen bei der Übersetzung besondere Aufmerksamkeit geschenkt werden muss. Eine KI kann aufgrund der Textstruktur zudem beim Schreiben Vorschläge machen, was solche kritischen Stellen sein könnten.
Die weiteren Möglichkeiten der KI erlauben zudem zusätzliche Hilfestellungen. Zum Beispiel können problemlos Zusammenfassungen in einer anderen Sprache als der Originalsprache erstellt werden.
Natürlich: Das alles ersetzt keine von Menschen erstellte Übersetzungen, egal ob offene oder verdeckte. Angesichts der zahlreichen wissenschaftlichen Publikationen ist dies jedoch ein naheliegender Weg, um die Qualität wissenschaftlichen Arbeitens zu steigern, denn:
- Partizipation wird erhöht, da Sprachschranken fallen.
- Eine sprachliche Auseinandersetzung mit dem eigenen Text (weil die:der Autor:in mit möglichen maschinellen Übersetzungen rechnet) erhöht die Sensibilität für verschiedene kulturelle Kontexte und Bedeutungsunterschiede.
Wahrscheinlich ist sprachliche Diversität nicht für alle wissenschaftlichen Disziplinen gleich wichtig. Für weite Teile der Geistes- und Sozialwissenschaften ist sie es m.E. aber auf jeden Fall.
Bereits erschienen:
- Teil 1, Schreib- und Rechercheunterstützung durch KI: Systeme der Künstlichen Intelligenz zum Generieren von Texten werden keine sinnvollen wissenschaftlichen Texte verfassen, uns aber eine riesige Hilfe beim Schreiben und Recherchieren sein.
Literatur
Stöcklin, Stefan. Wissenschaftssprache: “Sprachliche Diversität ist fruchtbar”. Interview mit Angelia Linke, Peter Fröhlicher und Fabrizio Gilardi. UZH News. https://www.news.uzh.ch/de/articles/2017/englisch-debatte.html. (2017).
House, Juliane. 2005. Offene und verdeckte Übersetzung: Zwei Arten, in einer anderen Sprache ›das Gleiche‹ zu sagen. Zeitschrift für Literaturwissenschaft und Linguistik 35(3). 76–101. https://doi.org/10.1007/BF03379444.
Czulo, Oliver, Venema Victor, Jo Havemann, Jennifer Miller & Dasapta Irawan. Caveats of machine translation – Translate Science Blog. https://blog.translatescience.org/caveats-of-machine-translation/. (18 December, 2022).
Bubenhofer, Noah. 2020. Visuelle Linguistik: Zur Genese, Funktion und Kategorisierung von Diagrammen in der Sprachwissenschaft. De Gruyter. https://doi.org/10.1515/9783110698732.
Pingback: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 1 | Sprechtakel
Pingback: How we (could) write scientific texts in the future – part 2 | Sprechtakel
Pingback: Wie wir in Zukunft wissenschaftliche Texte schreiben (könnten) – Teil 3 | Sprechtakel