Korpora erstellen | Corpus Workbench |
Intro Python | Word Embeddings |
Topic Modeling ist eine sehr verbreitete Methode, um Texte aufgrund ihrer Wortdistribution zu gruppieren: Das Clusteringverfahren findet so Gruppen von ähnlichen Texten, denen man z.B. Themen zuordnen kann.
Die "Programming Historians" bieten eine schöne Erklärung für dieses Clusteringverfahren an: https://programminghistorian.org/en/lessons/topic-modeling-and-mallet. Auf unserer KoDuP-Germanistik-Plattform bieten wir Beispielscripte an, um mit Python Topic Models zu berechnen: https://gitlab.uzh.ch/noah.bubenhofer/kodup-germanistik/-/tree/master/4._Korpusanalyse.
Intro Python | Word Embeddings |
Korpora erstellen | Corpus Workbench |