Shakespeare Statistics
Autorschaft von Fedele and Fortunio
in English
Alle Daten wurden mit R Stylo generiert (.
Siehe:
).
Wenn mehrere voneinander unabhängige Methode zu ähnlichen oder gleichen Ergebnissen kommen,
kann von einer Verfestigung einer Theorie ausgegangen werden. Klassifizierungen haben sich in der
Vergangenheit als verlässliche Diskriminierungsverfahren erwiesen. Die Klassifikatoren nsc
(nearest shrunken centroid), svm (support vector machine) und delta (nach Burrows) eignen sich
gleichermaßen gut, wenn die Entscheidung zwischen zwei Autorenkandidaten zu treffen ist.
Die Auswertungen der Klassifikatoren nsc, svm und delta mit Fenstergrößen zwischen 1000 und 8000
Worten im Abstand von 1000 Worten wurden in der nachfolgenden Tabelle für jedes 250-Wortsegment
zusammengefasst. Als Variable standen das Vokabular (mf1w) in den Spalten B bis I, sowie Buchstabenbi-
und -trigramme in den Spalten J bis Q und R bis Y bereit (mf2c, mf3c). Die erste Messung des 1000er
Fenster ist in dessen Mitte bei 500 Worten verzeichnet (B2), die erste Messung des 8000er Fensters analog
bei 4000 Worten (I16). Das gleiche Schema gilt für mf2c und mf3c.








Hier geht es zur statistischen Auswertung der Zuordnungstabelle
Vergleiche diese Auswertung mit den Ergebnissen von Rolling Delta.