Metadaten der Genitivdatenbank

Die Inhalte der Genitivdatenbank sind in Spalten und Zeilen organisiert. Jeder Datensatz (d. h. jeder Genitivbeleg) umfasst eine Zeile. Die Inhalte der einzelnen Attribute sind darin mit Semikolon (;) in Spalten aufgeteilt und ggf. in Anführungszeichen (") eingeschlossen. Es sind leere Spalteninhalte möglich. Ja-/Nein-Werte sind meist numerisch kodiert (1/0).

Die erste Zeile enthält ausschließlich die Spaltennamen. Deren Bedeutungen sind wie folgt:

NomenGenitiv-Nomen
LemmaGrundform
EndungMarkierung der Genitivendung
Satzkontextfünf Wörter/Satzzeichen vor und hinter dem Genitiv-Nomen
MorphGenGenitiv-Aussagewahrscheinlich (Xerox)
FemWahrscheinlichkeit für Femininum (Xerox)
MaskWahrscheinlichkeit für Maskulinum (Xerox)
NeutWahrscheinlichkeit für Neutrum (Xerox)
Schwachschwache Flexionsklasse (Xerox)
PlPlural (Xerox/TreeTagger)
Artadjazenter Artikel unmittelbar vor Nomen
ArtDistArtikel in bestimmter Distanz vor Nomen
ArtDistValNennung des Distanzartikels
PraepPraeDistGenitiv-Präposition in Distanz vor Nomen
PraepPraeDistValNennung der Genitiv-Präposition
PraepPraeadjazente Genitiv-Präposition unmittelbar vor Nomen
PraepPostadjazente Genitiv-Präposition unmittelbar nach Nomen
PraepPostValNennung der Genitiv-Präposition danach
PropNEigenname
PropNPraeEigenname adjazent vor Nomen
PropNPraeValNennung des Eigennamens vor Nomen
AdjENAdjektiv auf -en adjazent davor
AdjENValNennung des Adjektivs davor
TruncTrunkierung
GenVerbPraeGenitiv-Verb davor
GenVerbPraeValNennung des Genitiv-Verbs
GenVerbPostGenitiv-Verb danach
GenVerbPostValNennung des Genitiv-Verbs danach
GenAdjPraeGenitiv-Adjektiv davor
GenAdjPraeValNennung des Genitiv-Adjektivs davor
GenAdjPostGenitiv-Adjektiv danach
GenAdjPostValNennung des Genitiv-Adjektivs danach
NNPraeNomen adjazent davor
NNPraeValNennung des Nomens davor
NNPostNomen adjazent danach
NNPostValNennung des Nomens danach
TitelPersonen- oder Berufstitel
Konversionsiehe weiter unten zur Liste der Ausdrücke
Stilsiehe weiter unten zur Liste der Ausdrücke
TitelPraePersonen- oder Berufstitel adjazent davor
TitelPraeValNennung des Personen- oder Berufstitels davor
ZeitausdruckGenitiv ist ein Monatsname, Wochentag, Tageszeit (Morgen, Mittag, ...) oder eine Kombination davon
AbkGenitiv ist eine Abkürzung (Abkürzungsliste elexiko-Projekt IDS)
NeoGenitiv ist ein Neologismus (Liste Neologismen-Projekt IDS)
ToponymGenitiv ist ein geografischer Ausdruck
KompositumGenitiv ist ein Kompositum
FugeFuge des Kompositums
EGErstglied des Kompositums
ZGZweitglied des Kompositums
FremdwGenitiv ist ein Fremdwort (Fremdwortliste von elexiko-Projekt IDS)
HKHäufigkeitsklasse der Grundform über alle Kasus hinweg (gemäß DeReWo-Grundformenliste)
HKZGbei Komposita Häufigkeitsklasse des Zweitglieds über alle Kasus hinweg
HKZGQuotQuotient HK Kompositum / HK Zweitglied bei Komposita
CelexCELEX-Angaben vorhanden (1), nur fürs Zweitglied (2) oder gar nicht vorhanden (0)
AnzsilbAnzahl der Silben
ErstlautDISCPhonetische Umschrift des ersten Lautes im DISC-Format
ErstlautartArtikulationsart des ersten Lautes bzw. "n.a." bei Vokalen (Plosiv, Nasal, Frikativ, Affrikate, Liquid, Approximant)
ErstlautortArtikulationsort des ersten Lautes bzw. "n.a." bei Vokalen (labial, alveolar, palato-alveolar, palatal, velar, uvular, glottal)
ErstlautstimmStimmhaftigkeit des ersten Lautes bzw. "n.a." bei Vokalen
Erstlauttyperster Laut ist Vokal (V) oder Konsonant (C)
Erstsilbbetonterste Silbe betont
FlexparFlexionsparadigma
LetztlautDISCPhonetische Umschrift des letzten Lautes im DISC-Format
LetztlautartArtikulationsart des letzten Lautes bzw. "n.a." bei Vokalen (Plosiv, Nasal, Frikativ, Affrikate, Liquid, Approximant)
LetztlautortArtikulationsort des letzten Lautes bzw. "n.a." bei Vokalen (labial, alveolar, palato-alveolar, palatal, velar, uvular, glottal)
LetztlautstimmStimmhaftigkeit des letzten Lautes bzw. "n.a." bei Vokalen
Letztlauttypletzter Laut ist Vokal (V) oder Konsonant (C)
LetztreimDISCReim der letzten Silbe im DISC-Format
LetztsilbDISCletzte Silbe im DISC-Format
Letztsilbbetontletzte Silbe betont
Morphstatmorphologischer Status
OrthoOrthographie/Lemma (Celex)
PosbetontPosition der betonten Silbe
PrecodeWortartkombicode des Präfix bzw. "n.a." wenn es kein Präfix gibt (Celex)
PreorthoOrthographie des Präfix bzw. "n.a." wenn es kein Präfix gibt (Celex)
SepaPraeabtrennbares Präfix
SuffcodeWortartkombicode des Suffix bzw. "n.a." wenn es kein Präfix gibt (Celex)
SufforthoOrthographie des Suffix bzw. "n.a." wenn es kein Präfix gibt (Celex)
Vorletztsilbbetontvorletzte Silbe betont
WortartWortart (Celex)
JahrPublikationsjahr
LandPublikationsland (D, D-W, D-O, CH. A)
RegionGroßregion
RegisterGebrauchstext, Literatur oder Pressetext
Domainthematische Klassifizierung
MediumBücher, Gesprochenes, Publikumspresse oder Sonstiges
KorpusDeReKo-Subkorpus
PunkteScore points für Genitivklassifikation

Als Artikel (Art) wurden folgende Formen in Klein- und Großschreibung berücksichtigt, die im Genitiv stehen können:
des, dieses, eines, meines, jedes, jeden, keines, deines, seines, ihres, deines, unseres, eures, jenes, manches, desjenigen, desselben, irgendeines, irgendwelches, jedwedes, jedweden.
Unberücksichtigt bleiben einige Artikel/Artikelwörter, die zwar vor einem Genitiv-Nomen stehen können, aber für den Zweck der Genitivvorhersage wenig geeignet sind, weil sie nicht flektieren (z. B. allerlei) oder zu oft in anderen Kasus stehen. Bei letzteren Ausdrücken handelt es sich vor allem um zwei Artikelwörter, die sowohl im Genitiv als auch im Akkusativ (evtl. auch Nominativ) stehen können:
alles, sämtliches bzw. allen, sämtlichen; vgl. alles Erlebnisses, allen Ernstes (Gen.) und alles Erlebnis (Nom./ Akk.), allen Aufwand (Akk.).

Als mögliche Genitiv-Präpositionen (Praep) wurden folgende Formen in Klein- und Großschreibung berücksichtigt:
(a) vor dem Genitiv-Nomen - abseits, abzüglich, angesichts, anhand, anlässlich, anstatt, anstelle, aufgrund, ausschließlich, ausweislich, behufs, außerhalb, beiderseits, beidseits, betreffs, bezüglich, binnen, dank, diesseits, eingangs, eingedenk, einschließlich, entlang, fern, fernab, hinsichtlich, infolge, inklusive, inkl., incl., inmitten, innerhalb, innert, jenseits, kraft, längs, längsseits, links, mangels, mittels, mittelst, mithilfe, nahe, oberhalb, rechts, seitens, seitlich, seitwärts, statt, trotz, uneingedenk, unfern, ungeachtet, unterhalb, unweit, vermittels, vermittelst, vonseiten, voll, voller, vorbehaltlich, vorbehältlich, während, wegen, weitab, zeit, zuhanden, zulasten, zugunsten, zuungunsten, zuzüglich, zwecks,
(b) nach dem Genitiv-Nomen - anlässlich, ausschließlich, eingedenk, fern, fernab, halber, infolge, mangels, unfern, ungeachtet, unweit, vorbehaltlich, zugunsten, zuungunsten, wegen, willen.
Eine Reihe dieser Präpositionen schwankt zwischen Genitiv und anderen Kasus, vor allem Dativ, z. B. statt, trotz, wegen.

Als mögliche Genitiv-Adjektive (GenAdj) wurden folgende Adjektive berücksichtigt:
ansichtig, bedürftig, bewusst, fähig, gewiss, gewärtig, habhaft, kundig, ledig, schuldig, sicher, teilhaftig, überdrüssig, verdächtig, verlustig, wert, würdig.

Als mögliche Genitiv-Verben (GenVerb) wurden folgende Verben berücksichtigt:
(a) nicht reflexiv - belehren, berauben, entheben, anklagen, beschuldigen, bezichtigen, verdächtigen, verurteilen, überführen, zeihen, bedürfen, gedenken, entbehren, frönen, harren, kommen, gehen, sterben, spotten,
(b) reflexiv - annehmen, bedienen, befleißigen, befreien, bemächtigen, besinnen, brüsten, enthalten, entledigen, entziehen, erbarmen, erwehren, erfreuen, erinnern, rühmen, schämen, vergewissern, versichern, wehren.
Einige Verben zeigen mit einem Bedeutungsunterschied Valenzrahmen mit und ohne ein Genitivobjekt (z. B. entbehren, vgl. die Kinder wollten ihre Arbeiten nicht länger entbehren vs. Dieser Vorschlag entbehrt jeglichen Sinns für die Realität), bei anderen konkurriert die Genitivrektion mit der Rektion einer Präposition (z. B. jemand eines Verbrechens/für ein Verbrechen anklagen), noch andere schließlich regieren das Genitivobjekt nur noch in festen Wendungen (z. B. des Weges kommen).

Als Konversionen wurden folgende Nomen berücksichtigt:
Ab, Allerlei, Blau, Blond, Braun, Chic, Dasein, Deutsch, Dunkelgrau, Dutzend, Eigen, Einerlei, Er, Gelb, Gestern, Grau, Grün, Hallo, Hell, Hellgrau, Heute, ICH, Ja, Jemand, Komplex, Mehr, Naseweis, Nass, Negativ, Nein, Nicht, NICHT, Nichts, Ob, Och, Patt, Platt, Rosa, Rot, Schick, Schwarz, Souverän, Super, Weh, Weiß, Wo, Wozu, Zuviel, Zuwenig, Zwischendurch.

Der Spaltenname Stil bezieht sich auf folgende Epochenbezeichnungen, Stilbezeichnungen u. Ä.:
Andante, Art déco, Art Nouveau, Barock, Bauhaus, Bebop, Biedermeier, Blues, BossaNova, Country, Dada, De Stijl, Dub, Empire, Fado, Fin des Siècle, Folk, Funk, Gamelan, Gospel, Hip-Hop, Internationaler Stil, Jazz, Jodler, Jugendstil, Klezmer, Lambada, Landler, Latin, Louis-quatorze, Louis-quinze, Louis-seize, Metal, Modernisme, Pop, Punk, Ragtime, Rap, Reggae, Rock, rock'n'roll, Rokoko, Samba, Soul, Sturm und Drang, Swing, Taiko, Tango, Techno, Tex-Mex, Trip-Hop, Verismo, Walzer, Zen.

Als Zeitausdrücke wurden folgende Lemmalisten berücksichtigt:
liste_jahreszeit:=('frühling','frühjahr','sommer','herbst','winter'),
liste_monat:=('jänner','januar','februar','märz','april','mai','juni','juli','august','september','oktober','november','dezember'),
liste_feiertag:=('neujahr','karneval','fasching','fastnacht','pfingst','pfingsten','karfreitag','karsamstag','oster','ostern','allerheiligen','advent','weihnacht','weihnachten','silvester'),
liste_tag:=('montag','dienstag','mittwoch','donnerstag','freitag','samstag','sonnabend','sonntag'),
liste_tageszeit:=('morgen','vormittag','mittag','nachmittag','abend','nacht').
Weiterhin wurden komplexe Wörter gemäß folgender Kombinationsregeln als Zeitausdrücke markiert:
liste_jahreszeit + liste_tag,
liste_jahreszeit + liste_tageszeit,
liste_monat + liste_tag,
liste_monat + liste_tageszeit,
liste_feiertag + liste_tageszeit,
liste_feiertag + liste_tag,
liste_tag + liste_tageszeit.