Alle Beiträge von Nils Reiter

Der CRETA Verein

Am 23.10.2020 ist das eHumanities-Zentrum CRETA mit der Gründung eines Vereines in eine neue Phase übergegangen. Mit der Vereinsgründung wird einerseits der Tatsache Rechnung getragen, dass über Stuttgart hinaus inzwischen Wissenschaftlerinnen und Wissenschaftler an ähnlichen Zielen arbeiten und CRETA in vielfältiger Weise verbunden sind, etwa durch gemeinsame Projekte. Andererseits sind einige CRETA-Angehörige jetzt oder demnächst nicht mehr an der Universität Stuttgart tätig. CRETA verwandelt sich also in ein dezentrales Zentrum, das künftig als (einzutragender) Verein agiert. Der Verein wird dann viele der Aktivitäten — Coaching, Werkstätten, Hackatorials — weiterführen.

Die neue Adresse (und Webseite) des Vereins ist www.cretaverein.de.

Warum ein Verein?

Da die Förderung durch das BMBF Ende des Jahres ausläuft, stellte sich naheliegenderweise die Frage, wie und ob CRETA weitergeführt wird. Im Zuge der Einrichtung von CRETA an der Universität Stuttgart wurden ja auch ein Masterstudium und eine Professur für Digital Humanities eingerichtet, die institutionell natürlich eine Verdauerung darstellen. Allerdings ist die Institutionalisierung in dieser Form nur die eine Seite. Die andere ist, dass sich in fünf Jahren CRETA ein Netzwerk an Wissenschaftlerinnen und Wissenschaftlern (auch und gerade aus dem wissenschaftlichen Nachwuchs) aus den verschiedenen Disziplinen gebildet hat, das aufeinander eingespielt und in interdisziplinären Aktivitäten geübt ist. Dieses Netzwerk wollen wir erhalten, auch wenn nicht mehr alle Beteiligten im gleichen Projekt arbeiten.

Ein weiterer Punkt ist, dass CRETA in den vergangenen Jahren vielfältige Beziehungen zu Wissenschaftlerinnen und Wissenschaftlern an anderen Einrichtungen aufgebaut hat, durch gemeinsame Projekte, Workshops, Veröffentlichungen oder wilde Ideen. Diese Verbindungen zu stärken und ein wenig zu institutionalisieren ist eine weitere Motivation dafür, nach Ende der BMBF-Förderung etwas zu tun.

Warum also ein Verein? Weil ein Verein von allen Möglichkeiten eine Institution zu erzeugen, die flexibelste und niedrigschwelligste ist — zudem existiert mit dem Institut für Dokumentologie und Editorik ein Beispiel, an dem wir uns auch ein bisschen orientieren. Wie wir in unserem mission statement festgehalten haben, sehen wir nach wie vor viele Baustellen, an denen es sich — gemeinsam — zu arbeiten lohnt. Der Verein bietet dafür eine nicht an eine spezifische Universität gebundene organisatorische und institutionelle Hülle.

Was macht der Verein konkret?

Es gibt einige Aktivitäten, die wir als eHumanities-Zentrum angefangen haben, die auch als Verein weitergeführt werden sollen. Allen voran sind das regelmäßige Werkstätten, bei denen recht frei über die verschiedenen konkreten Projekte diskutiert werden kann. Diese stehen natürlich allen Vereinsmitgliedern offen (und natürlich werden wir in dem Rahmen auch unsere Mitgliederversammlungen abhalten). Voraussichtlich wird die nächste Werkstatt im Herbst 2021 stattfinden.

Eine andere Aktivität, die 2021 auch wiederaufgenommen werden soll, ist das coaching, also die extrem individualiserte Beratung von Nachwuchswissenschaftlerinnen und -wissenschaftlern durch das CRETA-Team. Eine Erweiterung des Portfolios durch Workshops und Tutorials ist ebenfalls angedacht.

Hauptsächlich ist der Verein aber eine Art Dach für konkrete Projekte, denen sich die Vereinsmitglieder widmen. Einige dieser Projekte sind hier verlinkt.

Wer kann Mitglied werden?

Um dem CRETA-Verein beizutreten, muss man keine Verbindungen nach Stuttgart haben. Voraussetzung ist ein Interesse an Aspekten der reflektierten Textanalyse, wie sie z.B. im mission statement festgehalten sind, und die Bereitschaft, sich etwa im Rahmen von Werkstätten ein wenig einzubringen.

Reflektierte algorithmische Textanalyse

Buchcover "Reflektierte Algorithmischen Textanalyse" Im Juli erscheint der open-access-Sammelband „Reflektierte algorithmische Textanalyse“, der mit einer Reihe von Aufsätzen Einblick in die interdisziplinären Arbeiten des Center for Reflected Text Analytics (CRETA) gibt. Die in CRETA entstandenen und hier veröffentlichen Arbeiten reichen von theoretischen Auseinandersetzungen mit allgemeinen komputationellen Arbeitspraktiken über die Entwicklung textanalytischer algorithmischer Methoden hin zu Anwendungen auf geisteswissenschaftliche Untersuchungsgegenstände. Dabei legen sie ein besonderes Augenmerk auf die Nachvollziehbarkeit der Methoden und ihren reflektierten Einsatz auf die Analysegegenstände. Die Beiträge zeugen von den ertragreichen Synergieeffekten, die aus der interdisziplinären Ausrichtung des Projekts hervorgehen und nicht nur zu innovativen Arbeitspraktiken und Methoden führen, sondern auch in die jeweiligen beteiligten Disziplinen zurückwirken.
Insgesamt bietet der Sammelband eine theorie- wie praxisbezogene Einführung in die reflektierte algorithmische Textanalyse und kann damit anderen DH-Projekten mit ähnlicher Zielsetzung als Orientierung dienen.

Update vom 28.07.: Jetzt ist es verfügbar

Nils Reiter, Axel Pichler, Jonas Kuhn (Hrsg.): Reflektierte Algorithmische Textanalyse. Interdisziplinäre(s) Arbeiten in der CRETA-Werkstatt. De Gruyter. Erscheinungsdatum: 20.07.2020. URL https://www.degruyter.com/view/title/575959

CRETA-Coaching: Reflektierte Textanalyse und Operationalisierung

Das Zentrum für Reflektierte Textanalyse (CRETA) bietet 2019 erstmals ein spezielles Coaching an, das sich an Nachwuchswissenschaftlerinnen und -wissenschaftler aus den Geistes- und Sozialwissenschaften richtet. Ziel des Coachings ist es einerseits, Grundlagen der maschinellen Textanalyse zu vermitteln, andererseits sollen konkrete Operationalisierungsmöglichkeiten für die vorliegenden Forschungsfragen gemeinsam erarbeitet werden, insbesondere im Hinblick auf die Kombination maschineller und manueller Textanalyse.
Zum Coaching gehört die Teilnahme an mehreren Veranstaltungen, die zwischen dem 9. und 17. September 2019 in Stuttgart stattfinden, sowie eine Beihilfe zu den Reisekosten.

Bewerbungen werden bis zum 15. Juni01. Juli erbeten.

Weitere Informationen finden sich auf der Webseite https://www.creta.uni-stuttgart.de/coaching/, Rückfragen können auch gerne direkt an nils.reiter@ims.uni-stuttgart.de gerichtet werden.

Update, 22.11.2019

Das CRETA-Coaching hat erfolgreich stattgefunden, zwei Berichte von Teilnehmerinnen können hier nachgelesen werden:
Svenja Guhr: Erfahrungsbericht über ein Schlaraffenland für NachwuchswissenschaftlerInnen, 30.09.19
Anna Schmidt: Das Creta-Coaching an der Universität Stuttgart, 22.11.19

Der Fontane-Code

Ein CRETA-Team nimmt am kommenden Wochenende am Fontane-Hackathon „Der Fontane-Code“ teil. Das Team besteht aus Sandra Murr, Sarah Schulz, Tim Strohmeyer und Nils Reiter und arbeitet an den Besonderheiten Fontanes im Vergleich mit seinen Zeitgenossen:

Als wiederkehrende Charakteristika werden in den Werken Theodor Fontanes gerne die historischen Referenzräume, die vertikalen Handlungsentwicklungen, der auktoriale Erzählgestus, die Charakterisierung der Figuren im Dialog sowie die Ironie und Humor als Stilmittel herausgestellt.
In unserem Projekt möchten wir uns mithilfe von computergestützten Analysen der Auffindung von diesen und weiteren Aspekten des Erzählstils Fontanes auf Textebene annähern. Wir fokussieren dabei Sprachstrukturen, linguistische Eigenschaften sowie sprach-strukturelle und semantisch-inhaltliche Merkmalen. Um die Besonderheit dieser Aspekte für die Werke Fontanes herauszuarbeiten, ziehen wir Texte zeitgenössischer Autoren wie Wilhelm Raabe und Gottfried Keller zum Vergleich heran und erwirken so eine quantitative und kontrastive Charakterisierung fontanespezifischer Stilmittel.

Kurs: Reflektierte Textanalyse in den Digital Humanities

Im Rahmen der European Summer University in Digital Humanities geben Sarah Schulz und Nils Reiter einen Kurs zur reflektierten Textanalyse:

Der Workshop gibt einen Einblick in die reflektierte Textanalyse und deckt verschiedene, dafür relevante Themen ab. Kernidee dabei ist, den “Vorhang zu Lüften”: Die Teilnehmerinnen und Teilnehmer lernen dabei, wie reflektierte Textanalyse praktisch funktioniert, so dass sie im Anschluss an den Workshop auch angewendet werden kann. Themen des Workshops werden sein: Annotation und Konzeptentwicklung durch Annotation, Programmieren mit Python, Maschinelles Lernen in Theorie und Praxis. Die Teilnehmerinnen und Teilnehmer werden an ihren eigenen Programmen und Daten arbeiten können, und selbst programmieren und statistische Modelle trainieren. Vorkenntnisse sind nicht erforderlich, aber ein Laptop und eine Internetverbindung.

Stuttgart auf der DHd 2018

Logo DHd 2018

Auf der in knapp zwei Wochen stattfindenden DHd-Konferenz 2018 kommen erfreulicherweise eine ganze Reihe Beiträge aus Stuttgart, viele davon sind CRETA-Beiträge:

  • Mo., 26.02., 14-17:30, Workshop: Maschinelles Lernen lernen: Ein CRETA-Hackatorial zur reflektierten automatischen Textanalyse (Nils Reiter, Nora Ketschik, Gerhard Kremer, Sarah Schulz)
  • Mi, 28.02., 9:00-10:30, Vortrag: A Reporting Tool for Relational Visualization and Analysis of Character Mentions in Literature (Florian Barth, Evgeny Kim, Sandra Murr, Roman Klinger)
  • Mi., 28.02., 11:00-12:30, Vortrag: Was Lesende denken: Assoziationen zu Büchern in Sozialen Medien (Jens Beck, Marcus Willand, Nils Reiter)
  • Do., 01.03., 9:00-10:30, Vortrag: Quantitatives „close reading“? Vier mikroanalytische Methoden der digitalen Dramenanalyse im Vergleich (Benjamin Krautter)
  • Do., 01.03., 11:00-12:30, Vortrag: Digitale Modellierung von Figurenkomplexität am Beispiel des Parzival von Wolfram von Eschenbach (Manuel Braun, Roman Klinger, Sebastian Padó, Gabriel Viehhauser)
  • Do., 01.03., ab 17:45, Poster: SustainLife – Erhalt lebender, digitaler Systeme für die Geisteswissenschaften (Johanna Barzen, Jonathan Blumtritt, Uwe Breitenbücher, Simone Kronenwett, Frank Leymann, Brigitte Mathiak)
  • Do., 01.03., ab 17:45, Poster: Entitäten im Fokus am Beispiel von Captivity Narratives (Linda Kessler, Tamara Braun, Tanja Preuß)
  • Do., 01.03., ab 17:45, Poster: NLP meets RegNLP meets Regesta Imperii (Andre Blessing, Andreas Kuczera)
  • Do., 01.03., ab 17:45, Poster: Verhaltensmuster in Massendiskursen: Ein Opinion Dynamics – Modell (Malte Heckelen)
  • Do., 01.03., ab 17:45, Poster: Die Max-Bense-Collection. Digitale Re-Publikation von Erstausgaben mit erweiterten Plattformfunktionen (Claus-Michael Schlesinger)
  • Fr., 02.03., 11:00-12:30, Vortrag: SANTA: Systematische Analyse Narrativer Texte durch Annotation (Evelyn Gius, Nils Reiter, Jannik Strötgen, Marcus Willand)

Maschinelles Lernen lernen: Ein CRETA- Hackatorial zur reflektierten automatischen Textanalyse

Logo DHd 2018

Wir freuen uns, dass unser Hackatorial im Rahmen der DHd 2018 stattfinden kann, und laden herzlich dazu ein mitzumachen! Die Veranstaltung findet statt am Montag, 26.02.2018, von 14 bis 17:30 Uhr.

Ziel unseres Hackatorials ist es, den Teilnehmerinnen und Teilnehmern konkrete und praktische Einblicke in einen Standardfall automatischer Textanalyse zu geben. Am Beispiel der automatischen Erkennung von Entitätenreferenzen gehen wir auf allgemeine Annahmen, Verfahrensweisen und methodische Standards bei maschinellen Lernverfahren ein. Die Teilnehmerinnen und Teilnehmer können beim Bearbeiten von lauffähigem Programmiercode den Entscheidungsraum solcher Verfahren ausleuchten und austesten. Es werden keinerlei Vorkenntnisse zu maschinellem Lernen oder Programmierkenntnisse vorausgesetzt.

Es gibt keinen Grund, den Ergebnissen von maschinellen Lernverfahren im Allgemeinen und NLP-Tools im Besonderen blind zu vertrauen. Durch die konkreten Einblicke in den „Maschinenraum“ von maschinellen Lernverfahren wird den Teilnehmenden ermöglicht, das Potenzial und die Grenzen statistischer Textanalysewerkzeuge realistischer einzuschätzen. Mittelfristig hoffen wir dadurch, den immer wieder auftretenden Frustrationen beim Einsatz automatischer Verfahren für die Textanalyse und deren teilweise wenig zufriedenstellender Ergebnis-Daten zu begegnen, aber auch die Nutzung und Interpretation der Ergebnisse von maschinellen Lernverfahren (d.h. in erster Linie von automatisch erzeugten Annotationen) zu fördern. Zu deren adäquater Nutzung, etwa in hermeneutischen Interpretationsschritten, ist der Einblick in die Funktionsweise der maschinellen Methoden unerlässlich. Insbesondere ist die Art und Herkunft der Trainingsdaten für die Qualität der maschinell produzierten Daten von Bedeutung, wie wir im Tutorial deutlich machen werden.

Neben einem Python-Programm für die automatische Annotierung von Entitätenreferenzen, mit und an dem während des Tutorials gearbeitet werden wird, stellen wir ein heterogenes, manuell annotiertes Korpus sowie die Routinen zur Evaluation und zum Vergleich von Annotationen zu Verfügung. Das Korpus enthält Entitätenreferenzen, die im „Center for Reflected Text Analytics“ (CRETA) in den letzten zwei Jahren annotiert wurden, und deckt Texte verschiedener Disziplinen und Sprachstufen ab.

CUTE Evaluationsdaten

Die CUTE-Evaluationsdaten sind nun verfügbar. Im zip-Archiv befindet sich ein Unterordner namens eval mit neuen Texten zu den vier Genres (Briefroman, mittelhochdeutscher Artusroman, Parlamentsdebatte, Philosophischer Text).

Das Paket kann hier heruntergeladen werden (ohne Adorno, wegen Copyright). Wer sich vorher schon für das komplette Datenset (inkl. Adorno) registriert hat, kann den Download-Link aus der E-Mail wiederverwenden oder sich hier einen neuen besorgen.

Submissions

Evaluationsdaten für den CUTE shared task (track 1) sollten entweder im XMI oder CoNLL-Format eingereicht werden. Bitte schicken Sie die annotierten Daten bis inkl. Montag, 5. Dezember, an <cute@ims.uni-stuttgart.de>. Bitte geben Sie auch an, welche Genres und Entitätentypen annotiert wurden (wenn nicht alle).