Fazit und Ausblick zur Fugenvorhersage

Mit den im letzten Kapitel definierten linguistischen Regeln können die Fugen von etwa 75% der 407.865 Komposita vorausgesagt werden. Für weitere 25% enthält der komplette Entscheidungsbaum ebenfalls Regeln, die es dem Modell möglich machen, insgesamt für 95% der Komposita die Fugen vorauszusagen, allerdings erschließen sich uns bei diesen 25% keine linguistisch sinnvollen Regeln (vgl. zu den Details das Kapitel "Evaluation"). Das kann einerseits am Unvermögen unsererseits liegen, andererseits resultiert der Verzicht auf die Formulierung linguistischer Regeln in vielen Fällen daraus, dass ein komplexes Zusammenspiel vieler Eigenschaften im Modell zu Gruppen von Komposita führt, die nur wenige Exemplare enthalten (auch zusätzlich mit nur wenigen unterschiedlichen Erstgliedern) und somit ‚Regeln’ für letztlich lexikalisch definierte Kompositagruppen wirksam zu sein scheinen, die nicht weiter linguistisch abstrahierbar sind.

Demnach stellt sich die Frage: „Gibt es (womöglich nur schwach ausgeprägte) Regularitäten und Systematiken bei der Bildung der Kompositionsfuge“ (Michel 2009, S. 336)? Im Folgenden soll anhand des dargestellten Modells ein Versuch zur Beantwortung dieser Frage (für nominale Komposita) unternommen werden.

Da unser Entscheidungsbaum das Auftreten der jeweiligen Kompositionsfuge mit einer erstaunlich hohen Wahrscheinlichkeit von 95% voraussagt – und die von uns davon abgeleiteten linguistisch sinnvollen Regeln etwa 75% abdecken – , kann die Verteilung der Fugenelemente nicht völlig willkürlich sein, sondern muss auf einer gewissen Systematik basieren. Andernfalls wären derart genaue Voraussagen anhand eines Entscheidungsbaums des geschilderten Typs nicht möglich.

Auch wenn eine gewisse Systematisierbarkeit des Phänomens somit eindeutig bejaht wird, sagt dies noch nicht zwingend etwas darüber aus, ob die Voraussagen unseres Modells aufgrund der Wirksamkeit von Regeln möglich sind, oder ob die Fugenelementverteilung nicht doch zum Teil auf Konventionen – wenn auch gut systematisierbaren Konventionen – basiert. In Verbindung mit den aufgrund unseres Modells formulierbaren Regularitäten muss zudem prinzipiell berücksichtigt werden, dass in den Entscheidungsbaum nur solche Kriterien eingeflossen sind, die wir messen konnten und der Baum dementsprechend anders aussehen könnte, wenn weitere – oder einfach andere – Kriterien gemessen würden. Darüber hinaus darf im Rahmen der Beschäftigung mit der Regeln-oder-Konventionen-Frage nicht unerwähnt bleiben, dass die erfolgte Berücksichtigung von Merkmalen wie ‚Suffix‘ oder ‚Letztlaut‘ in unserem Modell möglicherweise zu einer Überlagerung anderer zugrundeliegender Regeln geführt haben könnte – schließlich lässt sich eine Fuge mit ‚Wortmaterial’ am besten voraussagen, da somit das tatsächliche Lexem bestimmt wird.

Insgesamt kann aufgrund unserer Modellierung, die relativ zu den gemessenen Kriterien ist, weder für die völlige Regelhaftigkeit noch für die ausschließliche Gebundenheit der Fugenelemente an sprachliche Konventionen plädiert werden. Auf der einen Seite spricht die Tatsache, dass bestimmte Gruppen von Erstgliedern, die im Kompositum mit demselben Fugenelement auftreten, durch abstrakte gemeinsame Eigenschaften miteinander verbunden sind, für die Wirksamkeit von Regeln – durch die Tatsache, dass die auf der Grundlage des Entscheidungsbaums formulierbaren linguistischen Regeln ca. 75 % der ca. 400.000 berücksichtigten Komposita abdecken, wird dieser Eindruck noch verstärkt. Auf der anderen Seite enthält unser Entscheidungsbaum aber auch Fälle, in denen für eine Gruppe von Erstgliedern zwar ein identisches Fugenelement vorhergesagt wird, die Erstglieder selbst aber nicht über gemeinsame abstrakte Eigenschaften verfügen. In solchen Fällen ist keine eindeutige linguistische Regel formulierbar, sondern es können – wenn überhaupt – allenfalls gewisse Tendenzen ausgemacht werden. Als Beispiel sei auf die Voraussage der Null-Fuge für konsonantisch auslautende, suffigierte Erstglieder verwiesen. Auch wenn für eine Teilmenge, genauer gesagt für ca. ein Drittel der entsprechenden Erstglieder, eine abstrakte Regel formuliert werden konnte (Null-Fuge für adjektivische und adverbiale suffigierte Erstglieder), sind für die Gesamtgruppe keine gemeinsamen abstrakten Eigenschaften feststellbar. Da keine linguistisch sinnvolle Regel gefunden wurde, die Erstgliedlexeme wie z.B. sozial, Anerkenntnis und Agrarier gleichermaßen erfasst, ist an dieser Stelle (zumindest teilweise) eher von einer konventionell begründeten Wahl des Fugenelements auszugehen. Die Formulierung einer allgemeinen Regel wird hier, und auch an anderen Stellen im Modell, noch dadurch erschwert, dass die entsprechende Erstglied-Gruppe nicht nur Suffixe im morphologisch engen Sinne enthält, sondern zum Teil auch über einfache ‚Endungen‘ (die noch weniger abstrakt beschrieben werden können), definiert ist.

Die zum Teil festgestellte ‚Regelbasiertheit‘ der Fugenelemente soll außerdem nicht den Eindruck erwecken, dass innerhalb unseres Modells keine Ausnahmen existieren. Auch wenn der Fokus im Vorhergegangenen eher auf der Beschreibung unserer Fugenmodellierung als auf der Thematisierung von Abweichungen lag, muss erwähnt werden, dass es innerhalb des Entscheidungsbaums keine Regel gibt, zu der keine abweichenden Beispiele generiert wurden. Beispielsweise finden sich im Entscheidungsbaum Bildungen wie Firmengründer oder Themenkomplex, obwohl für vokalisch auslautende, nicht auf Schwa endende Erstglieder beobachtet werden konnte, dass diese in der Regel ohne Fugenelement auftreten. Als weiterer Abweichungstyp sind zudem Komposita mit variierender Fuge zu nennen, z.B. Bildungen mit dem Erstglied Unternehmer (Unternehmersohn vs. Unternehmerssohn), das aufgrund seiner er-Endung gemäß unseres Modells eigentlich ohne Fuge in ein Kompositum integriert werden sollte.

Da die Abweichungen innerhalb unseres Modells jedoch nur im Randbereich (5%) liegen und für die Modellierung allgemein daher nicht problematisch sind, sind wir dennoch zu dem Ergebnis gekommen, dass sich „ – bei allen noch bestehenden Schwankungen – einige generelle Regelungen fixieren [lassen], mit denen die Wahlmöglichkeiten stark eingeschränkt werden, wenn auch nicht in jedem Fall eine eindeutige Voraussagbarkeit der Fugengestaltung gegeben ist“ (Fleischer/Barz 1995, S. 137f.) .

Abgesehen von der Konventionen-versus-Regeln-Frage können anhand unseres Entscheidungsbaums auch Aussagen über die Relevanz einzelner linguistischer Merkmale für das Auftreten von Fugenelementen getroffen werden. Dabei muss zwischen konsonantisch und vokalisch auslautenden Erstgliedern unterschieden werden. Wie bereits erwähnt, sind die Fugenvorhersagen für konsonantisch auslautende Erstglieder deutlich weniger komplex als die für vokalisch auslautende Erstglieder: Es wurde gezeigt, dass bei Ersteinheiten mit einem Konsonanten als Letztlaut allein aufgrund der ‚Endung‘ relativ verlässliche, unmittelbare Aussagen über die Gestaltung der Kompositionsfuge getroffen werden können. Darüber hinaus ist festzustellen, dass lautliche Aspekte hier eine recht dominante Rolle spielen. Für Ersteinheiten mit einem Vokal als Letztlaut gestalten sich die Prognosen insofern generell schwieriger, als dass die Fugenvorhersagen nur mit Hilfe von relativ komplexen Verkettungen von Regeln getroffen werden können. Abgesehen von lautlichen Aspekten, die auch hier eine wichtige Rolle spielen, stellt das Flexionsparadigma des Erstglieds ein sehr ‚mächtiges‘ Merkmal dar. Für beide ‘Erstgliedtypen’ zeigt unser Modell deutlich, dass die Wahl des Fugenelements – zumindest für die hier betrachteten, nominalen Komposita – in so gut wie keinem Zusammenhang mit Eigenschaften des Zweitglieds steht, sondern – um mit Lohde (2006, S. 22) zu sprechen – „grundsätzlich vom Charakter des Erstgliedes der Komposition“ abhängig ist.

Die Erforschung der Fugen in Komposita mit Methoden des maschinellen Lernens steht erst am Anfang. Vor allem was die Auswahl der gemessenen Eigenschaften betrifft, sind weitere Analysen notwendig: Basierend auf den Hypothesen der bisherigen Forschung zu den Fugenelementen ließen sich noch weitere Eigenschaften integrieren, z.B. aus dem Bereich der Semantik. Zudem könnten Eigenschaften, die in unserer Studie nur indirekt gemessen wurden, wie z.B. die Frage, ob eine bestimmte Fuge für ein Erstglied paradigmisch ist, direkt in die Modellierung einbezogen werden, was die Interpretation des Entscheidungsbaumes vereinfachen würde.

In der vorliegenden Studie beschränkten wir uns zudem auf Komposita, die bezüglich Fuge nicht (oder kaum) variieren. In einer Folgestudie soll aber genau der Aspekt der Variation genauer untersucht werden: Welche Faktoren sind es, die zu Variation führen und mit welchen Faktoren lässt sich eine bestimmte Variation voraussagen?

Wir sehen die Chance des maschinellen Lernens darin, eine sehr große Menge von Phänomenen systematisch untersuchen und so zu grammatischen Regeln kommen zu können, die eine breite empirische Basis beschreiben. Dabei besteht die Möglichkeit, sowohl bestehende Hypothesen zu überprüfen als auch durch die komplexe Kombination mehrerer Eigenschaften der Phänomene auf neue Regeln zu stoßen.

Korpusgrammatik

Fazit und Ausblick zur Fugenvorhersage

Zum Text

Weiterführend