Forschungsschwerpunkte

Fachgruppe Germanistische Mediävistik

Die Germanistische Mediävistik analysiert Strukturen mittelalterlicher Erzähltexte, vor allem des Parzival Wolframs von Eschenbach. Im Fokus stehen dabei zunächst Figuren und ihre Relationen. Letztere werden mithilfe der sozialen Netzwerkanalyse untersucht, wobei diese aus der Soziologie stammende Methode so modifiziert wird, dass die Beziehungen der Figuren dynamisch, gewichtet und gerichtet dargestellt werden können.
Das konkrete Arbeitsprogramm sieht folgende Schritte vor: Erkennen von Namensentitäten, Erfassen und Auflösen der Koreferenzen; Einteilung der Handlung in Episoden; semantische Analysen zur Klassifikation der Beziehungen; Visualisierung der Netzwerke.

Auf diese Weise soll ein vertieftes Verständnis des Figureninventars und seiner Bedeutung für die Handlung erreicht werden. Das betrifft Fragen wie die nach der Dichte der Beziehungsnetzwerke, der Zentralität einzelner Protagonisten, nach Zusammenhängen zwischen Figureninventar und Tiefe der Figuren.
Der explorativ zu verstehende computergestützte Zugang bietet den Vorteil – und die Herausforderung – ein (bisher) eher intuitives Vorgehen durch ein datengetriebenes zu ersetzen, literaturwissenschaftliche Fragestellungen zu formalisieren und Begriffe zu schärfen. Aus mediävistischer Perspektive verbindet sich mit dem Projekt die Hoffnung, der festgefahrenen Forschung zur Struktur des Artusromans einen neuen Impuls zu geben.

Fachgruppe Theoretische Computerlinguistik

Der Lehrstuhl Theoretische Computerlinguistik am Institut für Maschinelle Sprachverarbeitung erforscht Verarbeitungsmethoden für verschiedenste Aspekte der Bedeutung von Sprache, z.B. der Erkennung von nichtwörtlichen Ausdrücken (z.B. Ironie, Ling & Klinger 2016), Folgerungsbeziehungen zwischen Sätzen (Pado & Dagan 2016), und Mehrsprachigkeit (Peirsman & Pado 2011). Anwendungsgebiete sind zum Beispiel die Extraktion von strukturierte Informationen aus unstrukturiertem Text in verschiedenen Domänen (Faruqui & Pado 2010, Klinger 2011).

Der Lehrstuhl ist in CRETA mit einem Projekt zum Thema Emotionserkennung vertreten, das auf vorhergehenden Arbeiten im Bereich Sentimentanalyse aufbaut (Klinger & Cimiano 2015, Klinger et al. 2016). Dabei geht es um die automatische Identifikation und Visualisierung von emotionaler Information in Texten wie z.B. Literatur. Mit diesen Methoden lassen sich Fragestellungen untersuchen wie: Mit welchen Emotionen sind verschiedene Personen in einem Roman assoziiert? Wie ändert sich die Prominenz verschiedener Emotionen über die Zeit? Bei der Entwicklung der zugrundeliegenden Methoden spielen verschiedene linguistische Aspekte eine Rolle, wie zum Beispiel: Wie stabil sind emotionstragende sprachliche Ausdrücke über die Zeit oder über Sprachen hinweg?

Fachgruppe »Ästhetische Theorie«

Adornos Ästhetische Theorie zählt zweifellos zu den wirkmächtigsten Schriften zur philosophischen Ästhetik des 20. Jahrhunderts. Gleichwohl ist kaum jemandem, der mit ihr arbeitet, bewusst, dass die Textgrundlage in hohem Maße unsicher ist, da Gretel Adorno und Rolf Tiedemann auf der Basis von ca. 2900 Typoskripten posthum einen Lesetext komponiert haben, der vom überlieferten Material hochgradig abstrahiert.

Eine Auswahl dieser Typoskripte soll im Rahmen von CRETA erstmals erschlossen und gegenstandsadäquat ediert werden. Zudem sollen die interpretatorischen Konsequenzen der vorzunehmenden Textrevision demonstriert werden.
Die textkritische Edition verfolgt das Ziel, die ausgewählten Überlieferungsträger nicht nur den Standards jüngerer Archivausgaben entsprechend zu präsentieren, sondern deren computerphilologische Umsetzung zu ermöglichen. Dabei ist die Orientierung an der Materialität der Überlieferungsträger leitend. Für eine derartig orientierte digitale Edition gab es bislang kein überzeugendes Vorbild, das die unterschiedlichen Überarbeitungsstufen in der Transkription visuell sichtbar, als Digitalisat durchsuchbar und computerlinguistisch analysierbar macht. Um dies zu ermöglichen, werden die diplomatischen Transkriptionen von Adornos Überlieferungsträgern mit Hilfe von Adobe InDesign erstellt. Im Unterschied zu gängigen Editionsprogrammen, welche ursprünglich auf Basis von traditionellen, am Lesetext und nicht an der Materialität orientierten Editionsmodellen entwickelt wurden, garantiert die Arbeit mit InDesign eine der Materialität der Überlieferungsträger entsprechende Standgenauigkeit. Diese wird durch die Erstellung von Zeichen- und Absatzformaten gewährleistet, über welche die materialen Eigenschaften der Überlieferungsträger, insbesondere die jeweiligen Schreibinstrumente und Schreiberhände ausgewiesen werden. InDesign garantiert jedoch nicht nur die von uns angestrebte archivarische Genauigkeit, sondern erlaubt es auch die solcherart erstellten Daten mit Hilfe jener Auszeichnungssprache zu erfassen, die von der Text Encoding Initiative als Arbeits- und Speicherformat für digitale Editionen etabliert worden ist: die Auszeichnungssprache XML (eXtensible Markup Language). Diese zeichnet sich insbesondere dadurch aus, dass in ihr verfasste Datensätze leicht in andere Formate transformiert werden können. Die von uns entwickelten Element-Tags werden dafür direkt mit den Zeichen- und Absatzformaten verknüpft und bilden so auch die Grundlage für unterschiedliche computerlinguistische Analysen des solcherart aufbereiteten Materials.

Erste stichprobenartige Interpretationen des neuedierten ›Textes‹ ergaben, dass eine erhebliche Korrektur der bisherigen Deutungen zu erwarten ist, da zahlreiche Stellen nun in ihrem ursprünglichen Argumentationskontext verortet werden können und zudem sehr viele Bezüge auf literarische, künstlerische und philosophische Quellen erstmals nachvollzogen werden können. Zugleich verstehen sich diese Untersuchungen als ein Versuch, das heuristische Potential von DH-Methoden, die ursprünglich zur Analyse größerer Datenmengen entwickelt wurden, in Hinblick auf einen quantitativ kleinen, jedoch in seiner ›Mikrologik‹ hoch spezifizierten XML-Datensatz auszuloten.

Sozialwissenschaftliche Fachgruppe

Wer wir sind

Wir sind die sozialwissenschaftliche Fachgruppe in CRETA und in der Abteilung für Internationale Beziehungen und Europäische Integration des Instituts für Sozialwissenschaften der Universität Stuttgart angesiedelt. Wir interessieren uns für öffentliche politische Kommunikationsprozesse in verschiedenen Arenen, insbesondere in der nationalen und internationalen Presse und in Parlamentsdebatten und kooperieren eng mit der CLARIN Fach AG 8 „Inhaltsanalytische Methoden in den Sozialwissenschaften“.

Was wir können

Durch unsere langjährige Erfahrung mit transdisziplinären Forschungsprojekten in der qualitativen und quantitativen Inhaltsanalyse – zuletzt im BMBF geförderten Projekt e-Identity – kennen wir die Stärken und Schwächen üblicher textanalytischer Tools und sind bestens vertraut mit den wiederkehrenden Routinen der Korpuserstellung, -aufbereitung und -bereinigung sowie der Konzeption von manuellen, semiautomatischen und automatisierten Textanalyseverfahren. In unserer Forschung setzen wir uns intensiv mit der systematischen Verknüpfung quantitativer sowie qualitativer Analyseverfahren zur Identifikation und Klassifikation komplexer sozialwissenschaftlicher Konzepte auseinander. Über die Verknüpfung von Topic Models und maschinellem Lernen sind wir außerdem in der Lage, politisch und sozial bedeutungsvolle Themen semi-automatisch in sehr großen Textkorpora zu identifizieren. Ausgestattet mit diesem Vorwissen tragen wir in CRETA zur Formulierung von Kriterien für das Zusammenspiel von quantifizierenden und hermeneutischen Verfahren sowie zur Entwicklung neuer Textanalysetools bei.

Was wir in CRETA machen

Wir interessieren uns für die vielfältigen und komplexen Thematisierungsweisen nationaler, sowie trans- und internationaler Probleme, Akteure, Institutionen und Organisationen, news-breaking Events und internationaler Krisenereignisse im politischen und sozialen Raum. Hierfür untersuchen wir das e-Identity Korpus, ein bereinigtes Zeitungstextkorpus von insgesamt über 500.000 Zeitungsartikeln zu politischen Debatten über Kriege und humanitäre militärischen Interventionen für den Zeitraum 1990 – 2012, sowie das PolMine-Korpus, das die gesamten Plenarprotokolle des Deutschen Bundestages umfasst. Perspektivisch werden wir systematische vergleichende Analysen zwischen Bundestags- und Zeitungstextkorpora durchführen, Themenstrukturen von Bundestagsdebatten im Wandel identifizieren und die Repräsentation der verschiedenen Parteien analysieren. Die Entwicklung neuer interdisziplinärer Forschungsprojekte ist kontinuierliches Anliegen unserer Forschungsarbeit.

Fachgruppe Neuere Deutsche Literatur

Die Projektgruppe der Neueren Deutschen Literatur setzt sich mit der digitalen Analyse der produktiven Rezeption von Johann Wolfgang von Goethes Die Leiden des jungen Werthers auseinander. Nicht nur in der deutschsprachigen Literaturgeschichte, sondern auch international rezipierten Kritiker, Übersetzer und Autoren den Roman mit Verve. Nach der Veröffentlichung des Briefromans 1774 erschienen über 160 deutsche und u.a. 30 englische Texte, sogenannte Wertheriaden, die sich formal, thematisch oder strukturell an Goethes Originalwerk orientieren. Diese Adaptationen bilden das Untersuchungs-Korpus für CRETA, wobei hier die deutschsprachigen Texte im Mittelpunkt stehen.

Mittels computergestützter Verfahren setzt sich die Gruppe mit den Fragen auseinander, anhand welcher Kriterien eine Wertheriade als solche definiert wird und wie sich entsprechende strukturelle, inhaltliche und motivische Gemeinsamkeiten in den Adaptationen identifizieren und vergleichen lassen. Als entscheidend begreift die Forschung in diesem Zusammenhang bislang Referenzen zu Goethes Text, die sich u.a. in der Form des Briefromans, der Werther-Figur und dem Motiv der Liebe widerspiegeln. Dieses manifestiert sich in der tragischen Dreiecksbeziehung zwischen dem Protagonisten Werther, der angebeteten Lotte und ihrem Verlobten Albert. Zur automatischen Identifizierung dieser Triade und der Charakterisierung der spezifischen Figurenbeziehungen in den Adaptationen, wird in Zusammenarbeit mit dem Institut für Maschinelle Sprachverarbeitung das Netzwerk-Tool »rCAT« entwickelt.

Die digitale Rezeptionsanalyse wird ergänzt durch die Untersuchung und Bestimmung von Erzählperspektiven, Figuren-Typen und stilistisch-sprachlichen Ähnlichkeiten. Aus dieser Makroperspektive heraus versuchen wir wiederkehrende Strukturen in den Wertheriaden zu erkennen, die der traditionellen Werther-Forschung bisher unzugänglich waren.