Tools

Hier findet sich eine Übersicht der Tools, die im Rahmen von QuaDramA entwickelt werden.

CorefAnnotator

CorefAnnotator ist ein Tool zum annotieren von Koreferenz-Ketten. Es wurde entwickelt um lange Texte mit vielen unterschiedlichen Ketten zu verarbeiten. Die Grundidee ist, dass nicht binäre Relationen zwischen Mentions (z.B. Kataphorizität) annotiert werden, sondern dass alle Mentions als einer Äquivalenzklasse zugehörig aufgefasst werden. Dem folgend präsentiert das Tool eine Liste aller Entitäten auf der rechten Seite und ermöglicht so eine freie Zuordnung von Textabschnitten zu diesen Entitäten.

https://github.com/nilsreiter/CorefAnnotator

Citation

Nils Reiter. CorefAnnotator - A New Annotation Tool for Entity References. In Abstracts of EADH: Data in the Digital Humanities, December 2018.

DramaAnalysis

DramaAnalysis ist ein R-Paket, das eine Sammlung von häufig genutzten Funktionen für die Analyse von dramatischen Texten enthält. Der Input ist ein CSV-Format, das von DramaNLP vorgegeben wird. DramaAnalysis-Funktionen können leicht kombiniert und ihr Output mit einer von Rs Plotting-Möglichkeiten graphisch dargestellt werden.

https://github.com/quadrama/DramaAnalysis

DramaNLP

DramaNLP ist eine NLP-Pipeline, basierend auf Apache UIMA Komponenten und kann dramatische Texte verarbeiten. DramaNLP ist in der Lage, verschiedene TEI Dialekte zu importieren und mittels DKPro Komponenten zu verarbeiten. Der Output ist eine Vielzahl von Formaten wie etwa XMI, CoNLL Varianten sowie ein eigenes CSV-Format. Diese Formate enthalten Metainformationen aus den TEI-Dateien, wie etwa Author und Titel, sowie NLP-Output, wie zum Beispiel der tokenisierte Text, Wortarten- und Sprecher-Informationen.

https://github.com/quadrama/DramaNLP