Shakespeare Statistics


Autorschaft von 2 Henry IV

UK-Flagge in English Alle Daten wurden mit R Stylo generiert (. Siehe: ).

In bisherigen Rolling Delta Untersuchungen sind nacheinander alle Wortfenstergrößen zwischen 1000 und 5000 Worten ausgewertet worden, wobei die geringste stilistische Differenz zwischen den Referenztexten und dem zu analysierenden Text auf der Basis der häufigsten Funktionswörter sowie der häufigsten Buchstabenbi- und trigramme gemessen wurde. Obwohl das Verfahren stimmig ist und gute Ergebnisse aufwies, bestand ein Schwachpunkt darin, dass die Auswahl der Referenztexte subjektiv war. Abhilfe ergab sich durch die methodische Verbesserung der Verwendung einer Gesamtheit von Referenztexten, die nur einen Autor haben und die eindeutig zugeordnet sind. Allerdings braucht ein PC um die vier Stunden, um eine einzige Fenstergröße auszuwerten. Daher wurde ein Fenster von 5000 Worten gewählt (siehe Zeile 12 die Messung des ersten Fensters bei 2500 Worten) und als Variable Buchstabentrigramme, die statistisch verlässlicher sind als andere Variablen. Die Überlappung der Fenster beträgt 250 Worte, so dass ein enges Netz an Messpunkten entsteht (angezeigt durch Spalte A). Die Deltawerte eines jeden Durchgangs wurden in ein Tabellenkalkulationsprogramm übertragen und mithilfe bedingter Formatierung wurden pro Fenstermessung die drei niedrigsten Deltawerte gekennzeichnet. Sodann wurden alle Deltawerte und Texte gelöscht, die stilistisch nicht in Frage kamen. Mit einer 90°-Drehung sind die verbliebenen Referenztexte mit ihren Fenstermessungen ab B12 unten abgebildet. Die niedrigste stilistische Differenz ist grün, gefolgt von gelb und rot. Die beiden rechten Spalten geben die Akt- und Szeneneinteilung wieder – mit der akkumulierten Wortanzahl optimal angepasst an die Mittelpunkte der ausgewerteten Fenster von Spalte A. Die Spaltenzuordnung zu den stilistisch am nächsten stehenden Referenztexten befindet sich am Ende der Tabelle.




Vergleiche diese Auswertung mit den Ergebnissen der Klassifikatoren nsc, svm und delta.