Faktorenübersicht und Datenbasis

Zu behandeln sind Faktoren unterschiedlicher Provenienz. Sie beziehen sich alle auf Nomen, die auf Konsonanten enden. Berücksichtigt werden hier fast ausschließlich sprachimmanente Faktoren. Nur der mit Letzteren eng verzahnte Faktor ‚Frequenz‘ kommt an einigen Stellen zusätzlich ins Spiel. In der folgenden Übersicht werden die Faktoren(gruppen), die in die Untersuchung eingehen, unter Angabe der in der Literatur postulierten Wirkungsrichtung der positiven Ausprägung (Faktor -> Wirkungsrichtung) aufgelistet:

  • lautliche Faktoren:
  • prosodische Faktoren:
  • Silbenanzahl: Einsilber -> -es, Mehrsilber -> (mit der Anzahl der Silben zunehmend) -s
  • Betonung: Ultima -> - es, Pänultima -> -s
  • Wortbildungsfaktoren:
  • Komposition -> -s
  • s-Fuge im Kompositum -> -es
  • transparente Komposition -> Grundwortpräferenz
  • randständige lexikalische Faktoren:
  • Maskulinum -> -es
  • Neutrum -> -s


Über die Wirkungsrichtung der Faktoren besteht in den Fachquellen fast immer Einigkeit. Nur für den kurzen Vokal vor Einzelkonsonant am Wortende wird sie unterschiedlich angegeben (vgl. Vergleich bisheriger Forschungsansätze oben sowie Vokallänge).

Die obige Auswahl zeigt Faktoren unterschiedlicher Beschaffenheit. Die meisten können direkt als Ausprägungen binärer Variablen behandelt werden. Die Gruppen Sonoritätshierarchie und Silbenanzahl erscheinen mehrstufig, jedoch lassen sich die einzelnen Stufen – z. B. auf der Sonoritätsskala: Nasal, Liquid, Frikativ, Affrikate, Plosiv – auch als binäre Dummy-Variablen modellieren, was zunächst wegen der Verbgleichbarkeit mit anderen Faktoren praktisch erscheint. Anders als bei starken Faktoren gibt es hier einige Abhängigkeiten bzw. Korrelationen, die beachtet werden müssen, z. B.: Einsilber können als automatisch ultimabetont betrachtet werden, Simplizia sind fast immer Einsilber, Komposita sind immer Mehrsilber. Es ist daher auch mit zahlreichen Faktoreninteraktionen zu rechnen, denn z. B. Lexeme auf Konsonantengruppe können gleichzeitig auf einen Plosiv enden und zusätzlich noch relativ transparente, mit s verfugte, maskuline Komposita sein wie Lebensort, Arbeitsmarkt oder Vereinsvorstand. Derartige Korrelationen und mögliche Interaktionen kann es auch zwischen einem starken und mehreren schwachen Faktoren geben, z. B. Nomen auf st-Gruppe („starker“ Faktor) enden gleichzeitig auf eine Konsonantengruppe und auf einen Plosiv („schwache“ Faktoren) und können im Weiteren Einsilber sein und einen Kurzvokal aufweisen (ebenfalls „schwache“ Faktoren), wie Mast, Hengst oder Nest. Um wenigstens die letztgenannten Korrelationen und Interaktionen einigermaßen zu kontrollieren und Verzerrungen bei der Darstellung der Wirkung schwacher Faktoren zu vermeiden, werden in den folgenden Analysen wie bereits anvisiert alle Nomen ausgeschlossen, die durch die in Datenüberblick und strukturierende Rolle der sog. starken Faktoren behandelten „starken“ Faktoren beeinflusst werden. Es handelt sich dabei um Nomen, die folgenden Gruppen angehören:

  • Sonderwortschatz-Gruppen Konversion, Neologismus, Fremdwort, Abkürzung und Eigenname
  • Nomen auf eine unbetonte Silbe mit dem Reim -el, -em, -en, -end, -er, -ich, -ing, -ig,
  • Nomen auf das Suffix -chen, -lein, -ling, -mal, -sal, -sam, -tum
  • Nomen auf einen Vokal (einschließlich Diphthong)
  • Nomen, die auf s-Laut, sch-Laut oder st-Gruppe enden
  • Nomen der Häufigkeitsklassen < 8

Diese Einschränkung ist nicht die einzige, die notwendig war, um schwache Faktoren effizient zu untersuchen. Für das zu untersuchende Material mussten Nomeneigenschaften wie Art und Anzahl der abschließenden Konsonanten, Anzahl der Silben, Betonung etc. kodiert und automatisch extrahierbar gemacht werden. Eine solche Aufarbeitung des Materials war nur für diejenigen Nomen möglich, die gleichzeitig in CELEX erfasst sind, einer Datenbank, die phonetische, morphologische und prosodische Eigenschaften eines Grundstocks deutscher Wörter aufführt (dazu genauer Häufigkeitsklassen, CELEX-Angaben und extralinguistische Informationen). Das nach Ausschluss der von „starken“ Faktoren betroffenen und in CELEX nicht verzeichneten Lexemen verbleibende Material umfasst 1.733.983 Genitivtoken bzw. 37.104 (Lexemen sehr nahestehende) Lemmata, die den folgenden Analysen zu „schwachen“ Faktoren zugrunde liegen.

Zum Text

Schlagwörter
Autor(en)
Marek Konopka
Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen