Evaluation des Entscheidungsbaums

Im Folgenden werden die Evaluationsmaße für einen Entscheidungsbaum mit zehnfacher Kreuzvalidierung und einem Stoppkriterium von mindestens zwei Fällen pro Blatt dargestellt. Der im Interpretationsabschnitt präsentierte Baum ist aus Gründen der Interpretierbarkeit mit einem groberen Stoppkriterium trainiert (ein Blatt muss dort mindestens 500 Fälle umfassen) und aus Gründen der Übersichtlichkeit vereinfacht.

Tabelle 6 gibt eine Übersicht über die Evaluationsmaße Genauigkeit (Precision), Trefferquote (Recall) und F-Maß (F-Score) für den auf allen Erstglied-Zweitglied-Folgen trainierten Entscheidungsbaum. Wenn die Erstglied-Zweitglied-Folge ein variables Fugenelement hat, werden alle Fälle als korrekte Vorhersage gewertet, die mindestens eins der möglichen Fugenelemente vorhersagen. Wenn also das Fugenelement ‚s’ oder ‚0’ (=Null-Fuge) sein kann, so werten wir die drei Voraussagen ‚s’, ‚0’ und ‚[var_0_s]’ als korrekt. Insgesamt werden durchschnittlich 95% der Testdaten korrekt klassifiziert, vgl. Tabelle 6 (F-Maß). Die häufigsten Fugen, die Null- und die s-Fugen, werden in 97% bzw. 96,5% der Fälle korrekt vorausgesagt, die ebenfalls häufige n- und en-Fugen allerdings nur zu 89 bzw. 87% der Fälle. Besonders schlecht wird die Tilgung von e (z.B. in Mietwohnung; Miete + Wohnung) vorausgesagt (65%).

Tabelle 6 zeigt darüber hinaus auch die Verteilung der Komposita auf die unterschiedlichen Fugenelemente. Obwohl die Verteilung tendenziell anderen Analysen ähnelt (vgl. für eine Übersicht Donalies 2011, S. 32), gibt es Differenzen, die mit den unterschiedlichen Korpuszusammensetzungen und Berechnungs- bzw. Erhebungsmethoden zusammenhängen. Insbesondere die Unterschiede zur Verteilung, die in Donalies (2011, S. 32) dargestellt ist und die eigentlich auf die gleiche Datenbasis zurückgeht, können auf die differierenden Auswahlkriterien der vorliegenden Studie zurückgeführt werden. So berücksichtigten wir nur zweigliedrige Komposita, deren Glieder in CELEX vorhanden sind (vgl. Kapitel "Datenaufbereitung"). Gleichwohl zeigt sich auch in unseren Daten, dass die Null-Fuge den größten Anteil ausmacht, gefolgt von der s- und der (e)n-Fuge.

FugenelementAnzahl FälleAnteil in %GenauigkeitTrefferquoteF-Maß
0247.21760,61%0,9760,9760,971
s87.18621,38%0,9530,9790,965
n37.9339,30%0,8430,9330,866
en10.7522,64%0,9100,8300,868
variables Fugenelement7.9851,96%0,9520,9790,966
-e (=Tilgung des e)6.8741,69%0,7250,5820,646
es3.0760,75%0,6480,9220,761
er2.9060,71%0,8290,7120,766
e2.5040,61%0,7290,7490,739
um --> en1.1130,27%0,9750,9800,978
nen1670,04%0,9060,9820,943
ns1520,04%0,8491,0000,918
alle407.865100,00%0,9410,9580,950

Tabelle 6: Evaluationsmaße für den ersten Entscheidungsbaum aufgeteilt nach Fugenelement

Doch nun zurück zu den Daten der Evaluation: Einen besseren Überblick über die problematischen Voraussagen bieten Konfusionsmatrizen. Sie stellen im vorliegende Fall dar, welche Fugenelemente vorausgesagt und welche Fugenelemente in den Komposita dann tatsächlich gefunden wurden.

Tabelle 7: Konfusionsmatrix vorhergesagte vs. tatsächliche Fugenelemente

In der Diagonalen von Tabelle 7 ist erwartungsgemäß ersichtlich, dass in den meisten Fällen das vorhergesagte auch dem tatsächlichen Fugenelement entspricht.1 Es sind aber auch die kritischsten Verwechslungen sichtbar: So wird für eine Null-Fuge oder eine e-Tilgung des Erstglieds oft stattdessen eine n-Fuge oder statt einer Null-Fuge fälschlicherweise eine s-Fuge vorausgesagt.2 Und umgekehrt sind vorausgesagte Null-Fugen in den Daten oft n-, s-, en-, er- oder e-Fugen.

Wie bereits erwähnt, haben wir für die linguistische Interpretation nicht mit dem kompletten Entscheidungsbaum gearbeitet, da dieser viel zu komplex ist, um daraus linguistisch sinnvolle Regeln abzuleiten. Der im Folgenden interpretierte Baum umfasst pro Blatt mindestens 500 Fälle und wurde im Prozess der Interpretation so zurückgeschnitten, dass sich linguistisch beschreibbare Zusammenhänge erkennen lassen.

Das hat zur Folge, dass der so zurückgestutzte Baum auch nicht mehr 95% der Komposita voraussagen kann, sondern – wie weiter unten detailliert ausgeführt werden wird – etwa 75%.



1 Die Konfusionsmatrix umfasst nur diejenigen 399.488 Fälle, in denen das Fugenelement nicht variabel ist. [zurück]

2 Die Voraussage der n-Fuge statt der korrekten e-Tilgung des Erstglieds war bereits oben in Tabelle 6 sichtbar, wo wir feststellten, dass die Tilgung von e generell schlecht vorausgesagt wird. Das statistische Modell würde also z.B. im Fall von Mietwohnung aufgrund der linguistischen Merkmale der Glieder eher davon ausgehen, dass es Mietenwohnung heißen müsste. [zurück]

Zum Text

Schlagwörter
Autor(en)
Noah Bubenhofer, Katrin Hein, Caren Brinckmann
Bearbeiter
Roman Schneider
Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen