Shakespeare Statistics


Autorschaft von Marlowes The Jew of Malta

UK-Flagge in English               Alle Daten wurden mit R Stylo generiert Siehe:


Rolling delta ist ein Programmteil von R Stylo, das mit stilometrischen Analysen Fragen der Autorschaft von Dramen oder deren Kollaborationen untersucht. Delta wurde als Maß der stilistischen Distanz zwischen Referenztexten und dem Untersuchungstext 2002 von John Burrows vorgestellt. Maciej Eder, Jan Rybicki und Mike Kestemont entwickelten seit ca 2012 Rolling Delta, das die Deltawerte von Wortfenstern bestimmter Größe errechnet und dann überlappend zum nächsten Wortfenster übergeht. So wird der ganze Text durchlaufen, und die niedrigsten Werte ergeben eine Kurve, die zu dem Autor oder den Autoren gehört, die das Drama verfasst haben. Um nicht durch die zufällige Zusammenstellung von Referenztexten unzureichende Ergebnisse zu erhalten, kamen alle gesammelten Referenztexte zur Anwendung, so dass die niedrigsten Deltawerte quasi objektive Messungen darstellen. Die Anzahl der mehr als 150 Referenztexte (ohne Apokryphen und anonyme Texte) überfordern den Arbeitsspeicher eines normalen PC. Daher wurde der methodische Rahmen auf die Untersuchung eines 5000-Wortfensters mit einer Überlappung von 250 Worten reduziert. Untersucht wurden Buchstabentrigramme. In einem Tabellenkalkulationsprogramm enthielt Spalte A die Dramentitel, Spalte B das Delta-Messergebnis des ersten 5000-Wortfensters bei 2500 Worten. Spalte C die nächste Messung bei 2750 Worten. Je nach Länge des Untersuchungstexts setzt sich die Spaltenzahl nach rechts fort, wobei der Messpunkt sich um jeweils 250 Worte erhöht. In jeder Spalte (außer A) wurden die drei niedrigsten Deltawerte markiert und alle Datensätze ohne jegliche Markierung gelöscht. Die verbleibenden Texte mit ihren Werten fanden mit einer 90° Drehung in der nachfolgenden Tabelle ihren Ort. Der niedrigste Deltawert pro Fenstermessung (Wortzahl in Spalte A) wurde grün markiert, der zweitniedrigste gelb, der drittniedrigste grün. Ab Spalte B sind die durch den Algorithmus ermittelten Texte notiert. Die beiden rechten Spalten geben die Szenenabfolge und die akkumulierten Wortlängen an, die an die Abfolge der Messpunkte (250 Wortabstand) angepasst wurden.




Vergleiche die Rolling delta Ergebnisse mit der Einordnung durch die General Imposters Methode.