Abstract
In diesem Beitrag stellen wir eine Methode vor, um Informationen über Figurenrelationen in dramatischen Texten, die innerhalb der dramatis personae (Figurenverzeichnis) sprachlich kodiert sind, zu extrahieren und maschinenlesbar im TEI/XML vorzuhalten
Das Verfahren ist auch für in Zukunft digitalisierte Dramen anwendbar, und wird von uns als quelloffene Software zur Verfügung gestellt. Es ist vergleichsweise einfach auf neue Sprachstufen oder Genres anpassbar und liefert eine gute Vorlage. Eine Evaluation des Verfahrens erfolgt auf ungesehenen Testdaten. Außerdem veröffentlichen wir einen Datensatz mit extrahierten Figurenrelationen aus deutschsprachigen Dramen, die manuell validiert und korrigiert wurden. Diese Daten werden zur einfachen und breiten Nutzung im TEI-Format in das GerDraCor eingespeist. Schlussendlich beschreiben wir beispielhaft zwei Analyseszenarien in denen die Daten neue Einblicke bieten (können).
BibTeX
@inproceedings{ Wiedmer2020aa,
Title = { { Romeo, Freund des Mercutio: Semi-Automatische Extraktion von Beziehungen zwischen dramatischen Figuren } },
Address = { Paderborn, Germany },
Author = { Nathalie Wiedmer and Janis Pagel and Nils Reiter },
Booktitle = { DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts },
Pages = { 194-200 },
Month = { March },
Doi = { 10.5281/zenodo.3666690 },
Year = { 2020 }
}
RIS
TY - TI - Romeo, Freund des Mercutio: Semi-Automatische Extraktion von Beziehungen zwischen dramatischen Figuren AU - Nathalie Wiedmer AU - Janis Pagel AU - Nils Reiter PY - 2020 CY - Paderborn, Germany DO - 10.5281/zenodo.3666690 ID - Wiedmer2020aa J2 - DHd 2020 Spielräume: Digital Humanities zwischen Modellierung und Interpretation. Konferenzabstracts ER -