Shakespeare Statistics
Autorschaft von The Life and Death of Jack Straw
in English
Alle Daten wurden mit R Stylo generiert.
Siehe: 
Rolling delta ist ein Programmteil von R Stylo, das mit stilometrischen Analysen Fragen der Autorschaft von Dramen oder
deren Kollaborationen untersucht. Delta wurde als Maß der stilistischen Distanz zwischen Referenztexten und dem
Untersuchungstext 2002 von John Burrows vorgestellt. Maciej Eder, Jan Rybicki und Mike Kestemont entwickelten seit ca 2012
Rolling Delta, das die Deltawerte von Wortfenstern bestimmter Größe errechnet und dann überlappend zum
nächsten Wortfenster übergeht. So wird der ganze Text durchlaufen, und die niedrigsten Werte ergeben eine Kurve,
die zu dem Autor oder den Autoren gehört, die das Drama verfasst haben. Um nicht durch die zufällige Zusammenstellung
von Referenztexten unzureichende Ergebnisse zu erhalten, kamen alle gesammelten Referenztexte zur Anwendung, so dass die
niedrigsten Deltawerte quasi objektive Messungen darstellen. Die Anzahl der mehr als 150 Referenztexte (ohne Apokryphen und
anonyme Texte) überfordern den Arbeitsspeicher eines normalen PC. Daher wurde der methodische Rahmen auf die Untersuchung
eines 5000-Wortfensters mit einer Überlappung von 250 Worten reduziert. Untersucht wurden Buchstabentrigramme (mf3c). In einem
Tabellenkalkulationsprogramm enthielt Spalte A die Dramentitel, Spalte B das Delta-Messergebnis des ersten 5000-Wortfensters
bei 2500 Worten. Spalte C die nächste Messung bei 2750 Worten. Je nach Länge des Untersuchungstexts setzt sich die
Spaltenzahl nach rechts fort, wobei der Messpunkt sich um jeweils 250 Worte erhöht. In jeder Spalte (außer A) wurden
die drei niedrigsten Deltawerte markiert und alle Datensätze ohne jegliche Markierung gelöscht. Der niedrigste Deltawert pro Fenstermessung
(Wortzahl in Spalte A) wurde grün markiert, der zweitniedrigste gelb, der drittniedrigste grün. Ab Spalte B sind nach rechts die
durch den Algorithmus ermittelten Textwerte notiert.

R Stylo wirft eine eigene Grafik aus, wobei eine Überlappung von 125 Worten gewählt wurde und die beiden untersten Kurven
die niedrigsten Deltawerte besitzen, das heißt, diese beiden Texte haben die geringste stilistische Differenz zum Suchtext:

Auf der Basis der verwendeten Parameter weist Rolling Delta dieses frühe Beispiel eines historischen Dramas als einen
Text von William Shakespeare aus. Allerdings ist es unerlässlich,
darauf hinzuweisen, dass frühere Ergebnisse, die
den elektronischen Text von 'archive.org' verwendet hatten, Henry Chettle als Autor angaben. Der von Palmer herausgegebene Dramentext
hatte jedoch eine so schlechte OCR Umsetzung, dass die gleichermaßen beeinträchtigte Fassung von Chettles
The Tragedy of Hoffman als stilistisch nächst liegender Text angezeigt wurde. Sowohl The Life and Death of Jack Straw
als auch Chettles Referenztext wurden inzwischen aktualisiert. Weitere Messungen sind in jedem Fall
unerlässlich. Worthäufigkeiten, Häufigkeiten der Buchstabenbigramme und veränderte Fenstergrößen helfen
bei der Präzisierung. An Methoden stehen die Klassifikationen mit nsc, svm und delta an. Diese beinhalten jeweils Differenzierungen
nach mf1w, mf2c und mf3c. Eine Annäherung ergibt sich auch aus der Referenzierung mit allen in Frage kommenden Referenztexten und
und mit den Texten des 5000er mf3c-Fensters. Ebenso sind die Ergebnisse der General Imposters Methode zu beachten.
Vergleiche diese Auswertung mit den Ergebnissen von Rolling Classify und der General Imposters Methode.