Wirkung starker Faktoren im Vergleich
Um die Wirkung einzelner Faktoren abzuschätzen, benutzen wir im Folgenden je nach Bedarf drei Methoden. Sie leisten Unterschiedliches: Die erste ist die einfache, bereits oben verwendete und für den Leser voraussetzungslose Berechnung des Anteils der ES-Token an der Gesamtheit der Token mit einer Endung (ES und S) bzw. die in Prozent angegebene Wahrscheinlichkeit des Auftretens von ES unter einer bestimmten Bedingung (vgl. Abbildung 1 unten). Sie zeigt die „Durchschlagskraft“ eines Faktors an, und bezieht sich nur auf denjenigen Datenbereich, in dem der Faktor auch tatsächlich greifen kann. Das heißt z. B., dass beim Faktor ‚Auslaut auf einen s-Laut‘ nur diejenigen Lexeme in Betracht gezogen werden, die auf einen s-Laut enden. Welchen Anteil Token dieser Lexeme an der Gesamtheit aller Genitivnomen haben, ist dann ohne Bedeutung. Die zweite Methode ist mit der ersten verwandt und in der Korpuslinguistik bestens etabliert: Die Berechnung der logarithmierten (log10) Odds Ratio1 ermöglicht nicht nur die Vergleichbarkeit von Effektstärken verschiedener Faktoren, sondern macht auch die Richtung eines Effekts auf Anhieb erkennbar (vgl. Abbildung 2 unten). Die dritte Methode, die Wirkung eines Faktors zu quantifizieren, ist die aus der Statistik bekannte Berechnung von Cramérs V, in unserem Fall – bei 2x2-Kontingenztafeln – identisch mit dem Korrelationskoeffizienten Phi.2Phi liefert zwar keine Informationen zur Effektrichtung, dafür aber standardisierte Werte zwischen 0 und 1 (vgl. Abbildung 3 unten), die gut interpretierbar sind. Seine Chi-Quadrat-basierte Berechnung lässt sich auch praktisch mit einer Signifikanzprüfung verbinden. Die beiden letzteren Methoden berücksichtigen über die erste hinaus die „Reichweite“ eines Faktors: Sie zeigen mit an, wie sehr der Faktor die Gesamtheit der untersuchten Token beeinflusst, denn die Verhältnisse in demjenigen Teil der Daten, in dem der Faktor nicht greifen kann, werden mit einkalkuliert. Das heißt z. B., dass beim Faktor ‚Auslaut auf einen s-Laut‘ für die Effektstärkeberechnung auch Lexeme herangezogen werden, die nicht auf einen s-Laut enden. Jedes der drei Maße hat seine Eigenheiten, ein übergreifender Zusammenhang kann dennoch festgehalten werden: Bei Faktoren mit einem ähnlichen Anteil der ES-Endung an der Gesamtheit der Endungen (ähnliche Durchschlagskraft), hat derjenige eine größere positive/negative logarithmierte Odds Ratio und auch einen größeren Phi-Koeffizienten, der in einem größeren Teil der Daten theoretisch möglich ist. Besonders gut lassen sich Unterschiede in der Reichweite von Faktoren an den Werten des Phi-Koeffizienten ablesen.
Abb. 1: Anteil der ES-Endung: Durchschlagskraft starker Faktoren im Vergleich
1Die Odds Ratio (auch Quotenverhältnis genannt) gibt an, wie viel Mal wahrscheinlicher eine Konstruktion beim Vorliegen einer Bedingung ist als beim Unterbleiben dieser Bedingung. Die Unabhängigkeit von der Bedingung führt zu Odds Ratio = 1. Durch das Logarithmieren (log10 1 = 0) resultiert der positive bzw. negative Einfluss der Bedingung in entsprechenden positiven bzw. negativen Werten, die miteinander vergleichbar sind (vgl. Gries 2008: 179).
2Phi ergibt sich aus der Wurzel des Quotienten aus X2 und der Stichprobengröße.
Alle Ergebnisse aus Abbildung 1 beziehen sich auf unser Material unter Ausschluss der in Lexikalische Faktoren bestimmten Sondergruppen3 – mit einer Ausnahme, eben des Ergebnisses für die besagten Sondergruppen, das hier zum Vergleich mit abgebildet wurde und dessen Säule abgeblendet erscheint. Die beiden anderen abgeblendeten Säulen können als Bezugspunkte zur Bestimmung der Wirkungsrichtung und zur Einschätzung der Durchschlagskraft von Faktoren dienen: Mit ‚Nomen ohne starke Faktoren‘ sind Fälle gemeint, in denen die positiven Ausprägungen der Faktoren nicht vorliegen – d. h. diejenigen 1.733.983 Token, deren Lemmata weder auf Suffix -chen, -lein ausgehen, noch auf eine Schwa-Silbe enden, noch einen s-Auslaut aufweisen etc. und die in Schwache Faktoren und frei variierende Nomen der Untersuchung schwacher Faktoren zugrunde liegen. ‚Nomen ohne Sondergruppen‘ (4.585.236 Token) schließen sowohl Nomen, bei denen die starken Faktoren (mit Ausnahme der Sondergruppen) vorliegen, als auch ‚Nomen ohne starke Faktoren‘ ein.
In einigen wenigen Fällen ergeben sich zwischen den Faktoren Korrelationen. So haben Nomen auf Suffix -chen gleichzeitig einen Schwa-Reim (-en) und Nomen auf Suffix -ling den Wortausgang -ing. Die möglichen Interaktionen sind aber im großen Ganzen als randständig einzustufen und verzerren hier in jedem Fall nicht das Gesamtbild. Die Abbildung berücksichtigt alle wichtigen Faktoren, die der Spezialliteratur zufolge tendenziell zur Ausnahmslosigkeit einer der Endungen führen. Die Werte der sowohl von S- als auch von ES-Faktoren betroffenen Nomen zeigen jeweils einen beträchtlichen Abstand zu den Werten von ‚Nomen ohne starke Faktoren‘. Die Abstände innerhalb der S- bzw. ES-Gruppe sind dafür deutlich kleiner, was eigentlich die übliche Praxis stützt, diese Faktoren als bei positiver Ausprägung (tendenziell) zu nur einer Endung führend zu behandeln. Zusammen mit den in der Forschung bereits anerkannten Faktoren wird hier auch der bisher nicht etablierte Faktor hoher Frequenz (Häufigkeitsklasse < 8, vgl. Frequenz als starker Faktor) abgebildet, der seine Aufnahme in die Gruppe starker Faktoren durch die Position im Gesamtbild rechtfertigt.
Abbildung 2 macht die Wirkungsrichtung der Faktoren deutlicher und stuft ihre Effektstärken untereinander deutlich ab.4
Abb. 2: Logarithmierte Odds Ratios für die ES-Endung: Richtung und Effektstärke starker Faktoren im Vergleich
4Für den Faktor ‚Nomen auf -chen, -lein‘ wurden übrigens keine Belege für -es gefunden. Unter solchen Umständen ist die Odds Ratio = 0 und unbrauchbar (daher die Kennzeichnung NA). Um die Position dieses Faktors in der Faktorenkonstellation dennoch zu veranschaulichen, wurde bei der Berechnung für die Abbildung von einem (fiktiven) Beleg für die ES-Endung ausgegangen.
Der Abbildung zufolge wirken Faktoren mit besonders starken Effekten bei positiver Ausprägung zugunsten von S. Sie liegen vor, wenn Nomen auf eine unbetonte Silbe, insbesondere mit einem Schwa, bzw. auf Diminutivsuffixe -chen und -lein enden.
Die in Abbildung 3 zusammengefassten Phi-Werte erlauben uns schließlich die Reichweite der Faktoren genauer einzuschätzen und ihre Effektstärke auf einen untersuchungsunabhängigen Standard zu beziehen.
Abb. 3: Korrelationskoeffizient Phi: Reichweite und Effektstäke starker Faktoren im Vergleich
Beim Korrelationskoeffizienten Phi, der Werte zwischen 0 und 1 annehmen kann, ist der Effekt umso stärker, je näher Phi an 1 liegt. In den Sozialwissenschaften gilt der Wert 0,1 als klein, 0,3 als mittelgroß und 0,5 als groß. Diese Konvention lässt sich auf unseren Fall als Orientierung dafür übertragen, wie stark ein Faktor die Gesamtheit untersuchter Nomen „aus dem Gleichgewicht bringt“. Wie Abbildung 3 zeigt, übt keiner der Faktoren einen großen Effekt in diesem Sinne aus. Vier Faktoren überschreiten aber immerhin die Marke ‚mittelgroß‘ (0,3). Es sind: ‚Wortausgang auf Schwa-Reim‘, ‚Auslaut auf -s‘, ‚Nomen der Sondergruppe‘ und ‚HK < 8‘.5 Die entgegengesetzten Enden von Abbildung 3 sind interessanterweise von zwei Faktoren mit einer sehr ähnlichen, beinahe 100%igen Durchschlagskraft zugunsten von S markiert: ‚Wortausgang auf -ich, -ig, -ing‘ und ‚Wortausgang auf Schwa-Reim‘. Dass die beiden hinsichtlich der Effektstärke hier so weit auseinanderliegen, ist dadurch zu erklären, dass Nomen auf -ich, -ig, -ing mit 6.392 Token nur etwa 0,1% der hier relevanten 4.585.236 Genitivnomen (ohne Sondergruppen) ausmachen, die Nomen auf einen Schwa-Reim mit 1.088.840 Token dagegen etwa 24%. Nomen auf einen Schwa-Reim wie auch Nomen auf s-Laut erreichen sogar eine größere Effektstärke als Nomen der Sondergruppen. Allerdings ist die Effektstärke Letzterer auf die Gesamtheit der Nomen mit einer Endung (6.568.151 Token) zu beziehen, in der sie ca. 30% (1.982.911 Token) ausmachen. Ob eine relativ hohe Effektstärke eines Faktors eine psychologische Relevanz im Sinne einer Sogwirkung haben kann, sodass sie zu Analogiebildungen bei Nomen führt, bei denen die Faktorenvoraussetzungen eigentlich nicht vorliegen, muss hier offenbleiben und scheint angesichts der differenzierten Sachlage zurzeit nicht aufklärbar zu sein.6
5 Für den Faktor ‚Suffix -chen, -lein‘ erfolgte die Berechnung auch für die Abbildung 3 unter der Annahme eines (fiktiven) Belegs für -es, daher ist die entsprechende Säule mit NA gekennzeichnet.
6 Gemeint sind hier denkbare Hypothesen wie etwa die, dass die eventuelle allgemeine Zunahme von Fremdwörtern, Abkürzungen, Neologismen etc., die bekanntermaßen auf die S-Endung und die Nullendung spezialisiert sind, zur Abnahme der ES-Endung auch im Grundwortschatz führt.