Shakespeare Statistics


Theorie der quantitativen Dramenanalyse / Theory of quantitative drama analysis

Mathematische Verfahren und Darstellungen / Mathematical procedures and their presentation

Die einfache Summenbildung / summing up figures

An erster Stelle ist die einfache Summenbildung zu nennen. Bezogen auf Worte, Repliken, Vorkommen in Konfigurationen usw. lassen sich an ihr die quantitativen Dominanzrelationen des dramatischen Personals ablesen. / Summing up figures is the first procedure. As far as number of words, speeches, and presence of figures in configurations is concerned, quantitative relations of dominance of the dramatis personae can be established.

Das arithmetische Mittel / Mean values

Die Bildung des arithmetischen Mittels bildet ein weiteres Verfahren, das geeignet ist, Figuren mit unterschiedlich großer Datenbasis miteinander zu vergleichen. So kann z.B. die durchschnittliche Replikenlänge in Worten unabhängig von der Gesamtsumme der Repliken zweier Figuren verglichen werden. Aussagekraft entwickelt dieser Parameter wiederum durch das Erstellen von Kontrastbezügen zu anderen Figuren. / Mean values are a further means to compare figures whose amount of data is different. For example you can compare the average speech lengths of figures (in no of words/letters) even if their no of speeches is different. The comparison with other figures tells you whether someone is talkative or rather reticent.

Die Standardabweichung / standard deviation

Die Standardabweichung einer Wertereihe gibt an, wie stark die einzelnen Werte um das arithmetische Mittel schwanken. Sie wird gebildet als gemittelter Wert aller Abweichungen vom arithmetischen Mittel und kann somit Auskunft darüber geben, ob eine Figur eher statisch konzipiert ist, oder ob ihre Replikenlänge innerhalb der Textbasis stark oszilliert. Generell gilt, daß sich das dramatische Personal in der Abfolge seiner Standardabweichungen tendenziell von Haupt- zu Nebenfiguren gruppiert./ Standard deviation is a measurement of variability or diversity. It tells you whether a figure is rather static or has more diversity in its speech length. In most cases the sequence of standard deviations of the dramatis personae gives you the importance of figures in a play. The main personnel has high values, servants and attendants low figures.

Verlaufs- und Entwicklungskurven

In der Figurenkonzeption eines Dramas ist mit Tiefe das Verhältnis zwischen äußeren Umständen und innerer Entwicklung gemeint, mit Länge die zurückgelegte Wegstrecke. Durch die fortlaufende Dokumentation eines Parameters ergeben sich Kontrastbezüge einer Figur im Vergleich der einzelnen Textabschnitte.

Ablesbare Entwicklungen einer Figur innerhalb der dramatischen Handlung zeigen sich in der Replikensumme, der durchschnittlichen Replikenlänge in Worten wie auch in Mittelwerten und Standardabweichungen.

Eine weitere Methode zur Erstellung von Verlaufsdarstellungen liegt in der Abbildung eines gleitenden Mittelwerts. Bei diesem Verfahren werden zur Berechnung des Mittelwertes zu einem Punkt (z.B. der durchschnittlichen Replikenlänge in Worten zum Zeitpunkt der Replik x) jeweils die umliegenden Werte herangezogen (die Replikenlänge der 10 Repliken vor und nach der Replik x). Auf diese Weise ergeben sich Verlaufskurven, die geeignet sind, prozessuale Vorgänge deutlich zu machen.

Häufigkeitsverteilung

Anhand einer Häufigkeitsverteilung gibt man an, mit welcher Frequenz ein einzelnes Element einer Menge innerhalb eines Gesamtdatenbestandes vorkommt. Nimmt man z.B. als Menge alle Buchstaben des Alphabets, so läßt sich für jeden Text (Datenbasis) die Anzahl der Erscheinungen eines jeden Buchstaben bestimmen. Anhand solcher Häufigkeitsverteilungen läßt sich bei entsprechend großer Datenbasis ein Profil erstellen, das z.B. die Normalverteilung der Buchstaben für die Sprache Englisch bezeichnet.

Eine andere Möglichkeit besteht darin, die Worte eines Textes als die Elemente zu betrachten. Nun wird für eine Textbasis bestimmt, mit welcher Frequenz ein jedes Wort auftritt. Fucks nutzt Häufigkeiten des Vokabulars und auch Häufigkeiten von Satzlängen, um Autorenprofile zu erstellen und somit Autorenschaften zu bestimmen.

Das gleiche Ziel verfolgt auch G. Herdan in seinem Buch "Quantitative Linguistics": "Objective results of this kind can be of great assistance in the investigation of certain philological problems, e.g. disputed authorship or chronological order of texts, this represents just another instance of how linguistic statistics, or the role of the quantitative element in language, is capable of freeing the mind"

Analyse interfiguraler Beziehungen durch Kreuztabellen

Mit der Kreuztabelle erzeugt das Programm DRAMALYS eine Übersichtsdarstellung der Konfrontation aller Figurenpaare eines Dramas. Abgebildet wird hierbei die Anzahl der Repliken, die eine Figur A und eine Figur B innerhalb des Dramas gemeinsam haben. Die so abgebildeten Werte können als ein Maß für die szenische Gegenüberstellung zweier Figuren gewertet werden.

Zusätzlich hierzu erfolgt eine auf jede einzelne Figur bezogene Summenbildung, die alle Gegenüberstellungen einer Figur zusammenfaßt. Diese Summe kann somit als Maß der Einbindung einer Figur in das Gesamtgeschehen aufgefaßt werden.

Die Konfigurationsstruktur

Die Einführung der Konfigurationsmatrix zur Analyse von Dramentexten geht auf den rumänischen Mathematiker Solomon Marcus zurück.

Bei der Konstruktion der Konfigurationsmatrix geht Marcus von der Arbeitshypothese des "originellen Zuschauers" aus: "Die Information, die unser Zuschauer empfängt, nennen wir die Szenenstruktur des Stückes. Ein solcher Zuschauer ist also nicht imstande, die Raumstruktur des Stückes (Szenerie und Kostüme, Bewegungen der Schauspieler auf der Bühne, Gesten usw.) und seine Klangstruktur (alles auf der Bühne Hörbare, also auch die Wortstruktur des Stückes) zu erfassen." Aus der Sicht dieses Zuschauers wäre das Stück somit eine Binär-Matrix, deren Spaltenzahl der Anzahl der Figuren des Gesamtstückes entspräche und deren Zeilenzahl gleich der Gesamtzahl der Szenen des Stückes sei. Je nach An- oder Abwesenheit einer Figur innerhalb einer Szene kann in die zugehörige Matrix-Zelle eine 1 (anwesend) oder 0 (abwesend) gesetzt werden. Eine Zeile von Nullen und Einsen zu einer bestimmten Szene wird als Konfiguration bezeichnet: "Unter Konfiguration verstehen wir die Teilmenge des Personals, die jeweils an einem bestimmten Punkt des Textverlaufs auf der Bühne präsent ist; durch den Wechsel der Konfiguration wird ein neuer Auftritt, eine neue scène konstituiert."

Der Begriff der "Szene" bedarf hierbei noch einer genaueren Erläuterung. Er ist nicht im Sinne der herkömmlichen Szeneneinteilung des Stückes zu verstehen, sondern bezeichnet eine "Zeitspanne [...], während der kein Bühnenauftritt oder -abgang stattfindet."

Die Konfigurationsdichte

Ein einfacher Parameter, der aus der Konfigurations-Matrix isoliert werden kann, ist die "Bevölkerungsdichte", auch als Konfigurationsdichte bezeichnet. Sie gibt das Verhältnis von belegten (1) zu unbelegten (0) Zellen der Matrix an. Dieser Parameter kann in seinem Verlauf Entwicklungen innerhalb des Dramas verdeutlichen, aber auch typologische und ästhetische Eigenschaften ausdrücken.

Beziehungen innerhalb der Konfigurationsmatrix

Aus der Erstellung der Konfigurationsmatrix ergeben sich nach Marcus weitere Möglichkeiten der Beschreibung einer interfiguralen Beziehung. So läßt sich für jede Figur eine Menge A von Zahlen definieren, die alle Konfigurationsnummern enthält, in denen die Figur anwesend ist. Ist eine Figur x also in der ersten, dritten und achten Konfiguration präsent, so enthält ihre Menge die Zahlen Ax={1;3;8}. Aus dem Vergleich dieser Mengen erschließen sich vier mögliche Beziehungstypen:

- szenisch konkomitant
Figuren, deren Menge A identisch ist, die also gleichzeitig auf- und abtreten.

- szenisch dominant

Wenn die Menge Ax einer Figur x die Menge Ay einer Figur y beinhaltet.
Die Figur x die Figur y somit dominiert.

- szenisch unabhängig

Wenn die Figuren weder konkomitant noch dominant sind.

- szenisch alternativ

Ein Sonderfall der szenischen Unabhängigkeit, bei dem Ax und Ay keine gemeinsamen Elemente beinhalten, die Figuren sich demnach nicht begegnen.

Die meisten Figuren erfüllen bezogen auf den Gesamttext des Dramas das Kriterium szenischer Unabhängigkeit. Marcus bezeichnet sie auch als "[...] die am häufigsten zwischen zwei Charakteren bestehende Beziehung."

Um so gewichtiger sind somit Abweichungen von dieser Regel, die als Ausdruck des gestalterischen Willens des Autors gewertet werden müssen.

Szenischer Abstand eines Figurenpaares

Unter dem szenischen Abstand eines Figurenpaares versteht Marcus die Länge der Kette von Figuren, die nötig sind, um eine Figur x und eine Figur·y innerhalb der Konfigurationsmatrix zu verbinden. Dies läßt sich am einfachsten am konkreten Beispiel verdeutlichen:

Stehen sich zwei Figuren x und y während des Dramas an einem Punkt direkt gegenüber, haben sie den szenischen Abstand 1.

Ist dies nicht der Fall, so ist eine dritte Figur z zu suchen, die sowohl mindestens eine Konfiguration mit x und eine mit y gemeinsam hat. Da x und y nicht direkt, sondern nur über z miteinander verbunden werden können, haben x und y den szenischen Abstand 2 (z.B. Laertes und Rosencrantz / Guildenstern, die sich nie begegnen und nur über eine dritte Figur, wie Hamlet oder Claudius, verbunden werden können).

Es kann vorkommen, daß das Zwischenschalten einer weiteren Figur zur Bildung der Kette nötig ist, was zu einer entsprechenden Erhöhung des szenischen Durchmessers führt.

Ist die Bildung einer Kette unmöglich, spricht Marcus von einem unend-lichen szenischen Abstand. Dies wäre der Fall, wenn zwei Lager von Figuren existierten, die sich zu keiner Konfiguration überschneiden würden.

Nach Marcus ist ein "[...] hoher Wert des szenischen Durchmessers [...] gewöhnlich das Zeichen einer relativ schwachen Gegenüberstellung der Charaktere."

Aus der gleichen Tabelle errechnet Marcus durch Summenbildung der einzelnen Spalten einen figurenbezogenen Wert für die szenische Gegenüberstellung.

Die Darstellung dieses Wertes für das gesamte Personal ermöglicht eine einfache Einteilung in Haupt- und Nebenfiguren. Marcus beschreibt noch zwei ähnliche Parameter. Der eine wird durch das Maximum des szenischen Abstandes einer Figur angegeben. Da die Werte jedoch nur zwischen 2 und 4 schwanken, stellt der Parameter ein zu grobes Raster für eine Analyse dar. Der zweite ergibt sich aus einer Analyse der gemeinsamen Konfigurationen eines Figurenpaares, die jedoch schon im Rahmen der Kreuztabellen besprochen wurden.

Die Hammingdistanz

Ein weiteres Verfahren zur Berechnung der szenischen Entfernung zweier Figuren ist nach Marcus die Hammingdistanz, die ihren Ursprung in der Informationstheorie findet. "Der Abstand zwischen zwei Worten eines Binärcodes ist nach Hamming gleich der Anzahl der Positionen, in denen die beiden Worte verschiedene Ziffern haben."

Das Wort eines Binärcodes wird hierbei durch eine Spalte der Konfigurationsmatrix repräsentiert, die die An- und Abwesenheit einer bestimmten Figur über alle Konfigurationen hinweg dokumentiert. Ein einfaches Beispiel erläutert die Berechnung:

Gegeben seien vier Figuren F(1-4), deren Auftritte wie folgt über ein fiktives Stück von 4 Konfigurationen K(1-4) Länge verteilt sind:

F(1): Konfiguration K(1), K(2) und K(4).

F(2): Konfiguration K(2) und K(4).

F(3): Konfiguration K(3).

F(4): Konfiguration K(1), K(2) und K(4).

Hieraus entsteht folgende Konfigurationsmatrix:

       K(1) K(2) K(3) K(4)

F(1) 1       1       0      1

F(2) 0       1       0      1

F(3) 0       0       1       0

F(4) 1       1       0       1

Die so entstehende Reihung von 0 und 1 wird als binäres Wort verstanden. Die Reihung der Figur F(1) ist somit R(1)= 1 1 0 1.

Um nun die Differenz zweier solcher binären Worte zu errechnen, wird die Anzahl der Stellen des Wortes summiert, an denen sich die Worte voneinander unterscheiden:

F(3) mit Reihung R(3)= 0 0 1 0

F(2) mit Reihung R(2)= 0 1 0 1

Distanz F(2) und F(3)= 0+ 1+ 1+ 1 = 3

oder:

F(1) mit Reihung R(3)= 1 1 0 1

F(2) mit Reihung R(2)= 0 1 0 1

Distanz F(2) und F(3)= 1+ 0+ 0+ 0 = 1

Nach diesem Muster lassen sich Distanzwerte für die einzelnen Figurenpaare bilden. Hierbei bildet die Gesamtzahl der Konfigurationen den maximalen Distanzwert, ein Wert von 0 stünde für maximale szenische Nähe.

Wahrscheinlichkeitsrechnung

Um einen detaillierteren Parameter zur Beschreibung interfiguraler Beziehungen zu finden, bedient sich Marcus der Möglichkeiten der Wahrscheinlichkeitsrechnung.

Zunächst läßt sich hierbei für jede Figur x die relative Häufigkeit _(x) bestimmen, mit der sie innerhalb der Konfigurationen eines Dramas erscheint. Diese wird gebildet als Quotient der Anzahl von einer Figur besuchten Konfigurationen A(x) und der Gesamtzahl n der Konfigurationen:

Als Beispiel wurde Hamlet gewählt:

Gesamtzahl der Konfigurationen: n=115

Davon ist die Figur Hamlet anwesend: A(Ham)=63

relative Häufigkeit des Auftretens: _(Ham)=0,548

Ist die Gesamtzahl n groß, so ist _(x) eine gute Näherung für die Wahrscheinlichkeit des Auftretens einer Figur P(x). Somit gilt, daß die Figur Hamlet mit einer Wahrscheinlichkeit von P=0,548 innerhalb einer der Konfigurationen auftritt, während eine Nebenfigur, wie die der Ophelia, nur mit einer Wahrscheinlichkeit von P=0,156 innerhalb einer Konfiguration erscheint. Da das Maximum der Wahrscheinlichkeit bei P=1 liegt, läßt sich P durch Verschiebung des Kommas auch als Prozentangabe lesen. Für die Figur der Ophelia spricht man dann von einer 15,6%igen Wahr-scheinlichkeit.

Aus den Einzelwahrscheinlichkeiten P des Auftretens zweier Figuren läßt sich die Wahrscheinlichkeit der gemeinsamen Bühnenpräsenz erschließen. Hierbei gilt nach der Wahrscheinlichkeitsrechnung, daß die Gesamt-wahrscheinlichkeit P(x,y) eines Auftrittes der Figuren x und y gleich dem Produkt der Einzelwahrscheinlichkeiten ist:

Auftrittswahrscheinlichkeit der Figur Hamlet:

P(Ham) = 0,548

Auftrittswahrscheinlichkeit der Figur Ophelia:

P(Oph) = 0,156

Wahrscheinlichkeit des gemeinsamen Auftretens:

P(Oph,Ham) = 0,548 * 0,156 = 0,086

Aus dieser Wahrscheinlichkeit P(x,y) des gemeinsamen Auftretens zweier Figuren errechnet Marcus nun durch Multiplikation mit der Gesamtzahl der Konfigurationen n die theoretische Anzahl gemeinsamer Konfigurationen eines Figurenpaares. Diese theoretische Anzahl gemeinsamer Konfi-gurationen spiegelt einen Zustand statistischer Normalverteilung wieder, ein Maximum an Entropie, das bei rein zufälliger Verteilung vorliegen müßte.

In einem letzten Schritt errechnet Marcus die Differenz dieser theoretischen Zusammenkünfte mit den tatsächlichen Zusammenkünften: "Die Differenz [...] drückt die Abweichung der effektiven Anzahl der Begegnungen von x und y gegenüber derjenigen aus, die sich im Falle einer absolut zufälligen Verteilung ihrer Anwesenheiten in der Handlung ergäbe. Sie spiegelt also das Ausmaß eines absichtlichen Eingreifens des Autors in die Handlung wieder."

Der so berechnete Wert _(x,y) wird <0, wenn die Figuren x und y seltener auftreten, als es bei statistischer Normalverteilung der Fall wäre. Der Wert _ wird >0, wenn zwei Figuren in zahlreicheren Konfigurationen vorkommen, als es wahrscheinlich ist; "die natürliche Verteilung der Charaktere ändert sich also, um das betreffende Paar möglichst häufig in Kontakt zu bringen."

Konfigurationswahrscheinlichkeit

Die weiter oben beschriebenen Verfahren zur Berechnung der Wahrscheinlichkeit des gemeinsamen Auftretens zweier Figuren können nach Marcus auf die Wahrscheinlichkeit des Auftretens ganzer Figurenkonstellationen (Konfigurationen) ausgedehnt werden: "Der Vergleich derselben mit den Formationen, die tatsächlich auf der Bühne erscheinen, ermöglicht es uns, diejenigen Gruppen herauszufinden, die der Autor vermeidet, obwohl sie sehr wahrscheinlich wären, und auch die wenig wahrscheinlichen, überraschenden, mit geringen Auftrittschancen, die herangezogen werden, um der Handlung eine unerwartete Wendung zu geben."

Die Gesamtwahrscheinlichkeit Pges des Entstehens einer bestimmten Konfiguration errechnet sich auch hierbei als Produkt der Einzel-wahrscheinlichkeiten. Hierbei gilt, daß für den Zustand "abwesend" (0) einer Figur x innerhalb einer Konfiguration eine Wahrscheinlichkeit von 1 minus der Anwesenheitswahrscheinlichkeit P(x) berechnet wird. Dies ergibt sich aus der Reduktion möglicher Zustände auf an- oder abwesend. Ein Beispiel:

Gegeben seien vier Figuren F(1-4) mit den folgenden Einzelwahr-scheinlichkeiten des Auftretens (Anwesenheitswahrscheinlichkeit):

P(1)=0,324

P(2)=0,502

P(3)=0,020

P(4)=0,800

Zu berechnen sei die Wahrscheinlichkeit des Erscheinens der folgenden Konfiguration: F(1)=0 (abwesend) = 1 - 0,324 = 0,676

F(2)=1 (anwesend) = 0,502

F(3)=0 (abwesend) = 1 - 0,020 = 0,980

F(4)=1 (anwesend) = 0,800

Damit errechnet sich die Gesamtwahrscheinlichkeit als Produkt der Zustandswahrscheinlichkeiten Pzus(x) der einzelnen Figuren: Pges = Pzus(1) * Pzus(2) * Pzus(3) * Pzus(4)

Pges = 0,676 * 0,502 * 0,980 * 0,800 = 0,266

Damit wäre die Wahrscheinlichkeit des Auftretens dieser Konfiguration mit Pges=0,266 zu benennen, anders ausgedrückt mit einer Wahrschein-lichkeit von 26,6%.

Problematisch wird dieses Verfahren in seiner Anwendung, da die Zahl der möglichen Konfigurationen exponentiell mit der Anzahl der Figuren eines Dramas nach der Formel 2(Figurenzahl) steigt.

Für Hamlet ergibt sich hieraus eine Gesamtzahl von 34,36 Milliarden möglicher Konfigurationen. Auch Marcus kann die Berechnung seines 12-Personen Stückes nur durch das Zusammenlegen von Figuren und die Zuhilfenahme einer Rechenmaschine bewerkstelligen. Doch auch bei der drastischen Entwicklung der Computertechnik der letzten Jahrzehnte seit Marcus bleibt eine Berechnung in der obengenannten Größenordnung eher Rechenzentren vorbehalten.

Die Aufgabe läßt sich dennoch lösen, indem man die Anzahl der in Betracht gezogenen Konfigurationen auf ein zu bearbeitendes Maß reduziert. Hierzu ist es zunächst notwendig, die Figuren ihrer Auftrittswahrscheinlichkeit P(x) nach zu sortieren. Bezogen auf die Figuren F(1-4) aus dem obigen Beispiel bedeutet dies:

P(3)=0,020 P(1)=0,324 P(2)=0,502 P(4)=0,800

also : F(3), F(1), F(2), F(4)

Ordnet man die Figuren in dieser Art an, so kann man ein einfaches Programm erstellen, das systematisch alle denkbaren Konfigurationen zwischen den Figuren durchspielt. Hierzu werden die Zustände anwesend (1) und abwesend (0) der einzelnen Figuren "durchgezählt": F(3) F(1) F(2) F(4)

1. Konfiguration 0 0 0 0

2. Konfiguration 0 0 0 1

3. Konfiguration 0 0 1 0

4. Konfiguration 0 0 1 1

5. Konfiguration 0 1 0 0

6. Konfiguration 0 1 0 1

7. Konfiguration 0 1 1 0

8. Konfiguration 0 1 1 1

9. Konfiguration 0 1 1 1

10.Konfiguration 1 0 0 0

...

Tabelle 1: Durchzählen aller möglichen Konfigurationen.

Auf diese Weise werden alle theoretisch denkbaren Konfigurationen systematisch berechnet. Durch die Sortierung von unwahrscheinlichen zu wahrscheinlichen Figuren werden bei diesem Verfahren zunächst die Figuren einbezogen, deren Auftrittswahrscheinlichkeit am höchsten ist.

Auf diese Art läßt sich die Menge der zu untersuchenden Konfigurationen auf ca. 10 Millionen Konfigurationen begrenzen, da alle weiteren Konfigurationen nur noch eine Wahrscheinlichkeit weit unter 1% aufweisen.

Auch für die Berechnung dieser verbleibenden 10 Millionen Konfigurationen benötigte der PC immerhin 30 Stunden.

Das Konzept der elektiven Entropie

Als letztes soll nun das von Felix von Cube und Rul Gunzenhäuser entwickelte Konzept der elektiven Entropie erläutert werden.

In einem Aufsatz mit dem Titel "Das Drama als Forschungsobjekt der Kybernetik" entwickelt von Cube den Begriff der elektiven Entropie ausgehend von der Shanon'schen Informationstheorie. Diese bezieht sich zunächst auf den Informationsgehalt von Zeichenfolgen. "Es läßt sich zeigen, daß die Information eines endlichen Schemas mit n Zeichen dann am größten ist, wenn die Wahrscheinlichkeiten der verschiedenen Elemente gleich groß sind, bzw. diese Elemente gleichmäßig verteilt sind; die Information ist Null, wenn nur ein einziges Element auftritt."

Dieser Zustand, in dem die Information Null ist, stellt laut von Cube gleichzeitig den Zustand maximaler Ordnung dar, da von einem Repertoire vieler verschiedener Zeichen nur ein einziges zur Bildung einer Zeichenkette gewählt wurde. Gegenpol zu dieser maximalen Ordnung stellt die maximale Entropie dar, daher die gleichmäßige Verteilung der Zeichen des Zeichenrepertoires auf die Zeichenkette. Der aus der Thermodynamik stammende Begriff der Entropie, der den Zustand der maximalen Durchmischung (z.B. von Gasen verschiedener Dichte oder Flüssigkeiten verschiedener Temperatur) und somit den Stillstand eines Systems beschreibt wird somit im von Cube'schen Sinne zu einem Zustand der maximalen Informationsvergabe.

Den so gewandelten Begriff der Entropie bezieht von Cube nun auf die von Moreno durchgeführten Untersuchung von Gruppenstrukturen. Moreno versucht durch seine soziometrischen Untersuchungen Strukturen von sozialen Gruppen (wie z.B. Schulklassen) zu durchleuchten. Hierzu müssen alle Individuen einer Gruppe positive und negative Wahlen abgeben. Dies kann zum Beispiel in der Form geschehen, daß Schüler ihre drei "Wunschnachbarn" für die Sitzordnung angeben sollen, sowie auch die Mitschüler, die sie lieber meiden wollen. Aus diesen Wahlen entwickelt Moreno Netze von Sympathien und Antipathien innerhalb der Gesamt-gruppe.

Nun kann nach von Cube auch ein soziales System, wie die Gruppen Morenos, in seiner konfliktreichen oder konfliktarmen Ausprägung einen Zustand hoher oder niedriger Entropie besitzen. Da in diesem Kontext die Einzelelemente nicht feste Zeichen sind, sondern die einzelnen Wahlen verschiedener Individuen, spricht von Cube von "elektiver Entropie".

Ein Maximum der elektiven Entropie liegt demnach vor, wenn, um beim Beispiel unserer Schulklasse zu bleiben, jedes Mitglied der Gruppe die gleiche Anzahl positiver und negativer Wahlen von den Mitschülern bekommen hat.

Bei der Übertragung dieses Modells auf Dramentexte ergibt sich die Schwierigkeit, daß die einzelnenen Figuren nicht nach ihren Sympathien und Antipathien befragt werden können. Daher werden ihre Wahlen aus Repliken abgeleitet, in denen eine Figur eine eindeutig positive oder negative Position gegenüber einer anderen Figur bezieht.

Um die elektiven Entropiewerte verschiedener Dramentexte vergleichbar zu gestalten, setzt von Cube den maximalen Entropiewert eines Dramas gleich Eins. Dieser normierte elektive Entropiewert (EEN) eines Dramas kann somit direkt dem eines anderen Dramas gegenübergestellt werden.

Zudem wendet von Cube auf die von ihm bearbeiteten Dramen ein Verfahren an, bei dem er den Text in verschiedene Phasen unterteilt: "Vom Standpunkt der Entropie aus hat sich die Einteilung der Dramen in Akte und Szenen nicht als zweckmäßig erwiesen, da einerseits die kommunikativen Strukturen über mehrere Szenen hinweg unverändert bleiben können und andererseits in einer einzigen Szene eine starke Veränderung erfolgen kann." Der EEN-Wert wird somit immer nur für einen bestimmten Textabschnitt bestimmt.

Mit diesem Verfahren gelang von Cube zu einer grafischen Darstellung der elektiven Entropie eines Dramas:

Ausgewählte Literatur:

Fucks, Willhelm. Nach allen Regeln der Kunst. Stuttgart: Deutsche Verlags-Anstalt, 1968.

______. "Über den Gesetzesbegriff einer exakten Literaturwissenschaft, erläutert an Sätzen und Satzfolgen." Zeitschrift für Literaturwissenschaft und Linguistik I/II (1971). 113-37.

Herdan, G. Quantitative Linguistics. London: Butterworths, 1964.

Marcus, Solomon. Mathematische Poetik. Frankfurt: Athenäum, 1973.

______. "Ein mathematisch-linguistisches Dramenmodell" Zeitschrift für Literaturwissenschaft und Linguistik I/II (1971): 139-52.

Pfister, Manfred. Das Drama: Theorie und Analyse. 9. ed. München: Fink, 1997.

von Cube, Felix. "Das Drama als Forschungsobjekt der Kybernetik." Mathematik und Dichtung. Ed. Kreuzer, Helmut und Gunzenhäuser, Rul. München: Nymphenburger, 1969. 333-345.
 
 
 
 
 
 

Die Zusammenstellung erfolgte auf der Textbasis der Hausarbeit im Rahmen der Ersten Staatsprüfung für das Lehramt an Gymnasien, vorgelegt von: Sven Hansen. Quantitative Analyse eines ausgewählten Shakespeare Dramas, Englisches Seminar der Universität Hannover, 1997