Shakespeare Statistics


Autorschaft von The Life and Death of Jack Straw

UK-Flagge in English Alle Daten wurden mit R Stylo generiert. Siehe:


Die Rolling Classify Untersuchung verwendet die Klassifikatoren nsc (nearest shrunken centroid), svm (support vector machine) und delta, die jeweils auf die häufigsten Funktionswörter (words) und auf die häufigsten Buchstabenbi- und trigramme (mf2c, mf3c) angewendet wurden. Eine Präzisierung der Ergebnisse ergab sich wiederum durch die methodische Verbesserung der Verwendung einer Gesamtheit von Referenztexten, die nur einen Autor haben und die eindeutig zugeordnet sind. Der Rückgriff auf wenige Kerntexte größerer Korpora verhindert mögliche Beeinträchtigungen durch die Textmenge. Als Fenstergrößen eigneten sich wegen der geringen Textlänge jeweils 1000 bis 6000 Worte im Abstande von 1000 Worten. Entsprechend ihres mathematischen Kerns gewichten die Klassifikatoren unterschiedlich. Nsc hat einen niedrigen Entscheidunglevel, svm einen sehr hohen und ist im allgemeinen zu bevorzugen. Buchstabentrigramme sind oft genauer als Wort- und Bigrammklassifikationen. Die deutliche Mehrheit aller zugeordneten 250-Wort-Segmente verweist auf Rowley und William Shakespeare.





Im Unterschied zu Rolling Delta werfen die unterschiedlich wertenden Klassifikatoren je nach Variablenauswahl (mf1w, mf2c und mf3c) und nach Fenstergröße eine große Zahl an in Frage kommenden Autoren aus.
Es sind die größeren Fenster, die genauer werten und ein Shakespeare Übergewicht anzeigen.

Vergleiche diese Auswertung mit den Ergebnissen von Rolling Delta und der GI Methode.