Genitivmarkierung (Datenbank)
Die Inhalte der Genitivdatenbank sind in Spalten und Zeilen organisiert. Jeder Datensatz (d. h. jeder Genitivbeleg) umfasst eine Zeile. Die Inhalte der einzelnen Attribute sind darin mit Semikolon (;) in Spalten aufgeteilt und ggf. in Anführungszeichen (") eingeschlossen. Es sind leere Spalteninhalte möglich. Ja-/Nein-Werte sind meist numerisch kodiert (1/0).
Die erste Zeile enthält ausschließlich die Spaltennamen. Deren Bedeutungen sind wie folgt:
Nomen | Genitiv-Nomen |
Lemma | Grundform |
Endung | Markierung der Genitivendung |
Satzkontext | fünf Wörter/Satzzeichen vor und hinter dem Genitiv-Nomen |
MorphGen | Genitiv-Aussagewahrscheinlich (Xerox) |
Fem | Wahrscheinlichkeit für Femininum (Xerox) |
Mask | Wahrscheinlichkeit für Maskulinum (Xerox) |
Neut | Wahrscheinlichkeit für Neutrum (Xerox) |
Schwach | schwache Flexionsklasse (Xerox) |
Pl | Plural (Xerox/TreeTagger) |
Art | adjazenter Artikel unmittelbar vor Nomen |
ArtDist | Artikel in bestimmter Distanz vor Nomen |
ArtDistVal | Nennung des Distanzartikels |
PraepPraeDist | Genitiv-Präposition in Distanz vor Nomen |
PraepPraeDistVal | Nennung der Genitiv-Präposition |
PraepPrae | adjazente Genitiv-Präposition unmittelbar vor Nomen |
PraepPost | adjazente Genitiv-Präposition unmittelbar nach Nomen |
PraepPostVal | Nennung der Genitiv-Präposition danach |
PropN | Eigenname |
PropNPrae | Eigenname adjazent vor Nomen |
PropNPraeVal | Nennung des Eigennamens vor Nomen |
AdjEN | Adjektiv auf -en adjazent davor |
AdjENVal | Nennung des Adjektivs davor |
Trunc | Trunkierung |
GenVerbPrae | Genitiv-Verb davor |
GenVerbPraeVal | Nennung des Genitiv-Verbs |
GenVerbPost | Genitiv-Verb danach |
GenVerbPostVal | Nennung des Genitiv-Verbs danach |
GenAdjPrae | Genitiv-Adjektiv davor |
GenAdjPraeVal | Nennung des Genitiv-Adjektivs davor |
GenAdjPost | Genitiv-Adjektiv danach |
GenAdjPostVal | Nennung des Genitiv-Adjektivs danach |
NNPrae | Nomen adjazent davor |
NNPraeVal | Nennung des Nomens davor |
NNPost | Nomen adjazent danach |
NNPostVal | Nennung des Nomens danach |
Titel | Personen- oder Berufstitel |
Konversion | siehe weiter unten zur Liste der Ausdrücke |
Stil | siehe weiter unten zur Liste der Ausdrücke |
TitelPrae | Personen- oder Berufstitel adjazent davor |
TitelPraeVal | Nennung des Personen- oder Berufstitels davor |
Zeitausdruck | Genitiv ist ein Monatsname, Wochentag, Tageszeit (Morgen, Mittag, ...) oder eine Kombination davon |
Abk | Genitiv ist eine Abkürzung (Abkürzungsliste elexiko-Projekt IDS) |
Neo | Genitiv ist ein Neologismus (Liste Neologismen-Projekt IDS) |
Toponym | Genitiv ist ein geografischer Ausdruck |
Kompositum | Genitiv ist ein Kompositum |
Fuge | Fuge des Kompositums |
EG | Erstglied des Kompositums |
ZG | Zweitglied des Kompositums |
Fremdw | Genitiv ist ein Fremdwort (Fremdwortliste von elexiko-Projekt IDS) |
HK | Häufigkeitsklasse der Grundform über alle Kasus hinweg (gemäß DeReWo-Grundformenliste) |
HKZG | bei Komposita Häufigkeitsklasse des Zweitglieds über alle Kasus hinweg |
HKZGQuot | Quotient HK Kompositum / HK Zweitglied bei Komposita |
Celex | CELEX-Angaben vorhanden (1), nur fürs Zweitglied (2) oder gar nicht vorhanden (0) |
Anzsilb | Anzahl der Silben |
ErstlautDISC | Phonetische Umschrift des ersten Lautes im DISC-Format |
Erstlautart | Artikulationsart des ersten Lautes bzw. "n.a." bei Vokalen (Plosiv, Nasal, Frikativ, Affrikate, Liquid, Approximant) |
Erstlautort | Artikulationsort des ersten Lautes bzw. "n.a." bei Vokalen (labial, alveolar, palato-alveolar, palatal, velar, uvular, glottal) |
Erstlautstimm | Stimmhaftigkeit des ersten Lautes bzw. "n.a." bei Vokalen |
Erstlauttyp | erster Laut ist Vokal (V) oder Konsonant (C) |
Erstsilbbetont | erste Silbe betont |
Flexpar | Flexionsparadigma |
LetztlautDISC | Phonetische Umschrift des letzten Lautes im DISC-Format |
Letztlautart | Artikulationsart des letzten Lautes bzw. "n.a." bei Vokalen (Plosiv, Nasal, Frikativ, Affrikate, Liquid, Approximant) |
Letztlautort | Artikulationsort des letzten Lautes bzw. "n.a." bei Vokalen (labial, alveolar, palato-alveolar, palatal, velar, uvular, glottal) |
Letztlautstimm | Stimmhaftigkeit des letzten Lautes bzw. "n.a." bei Vokalen |
Letztlauttyp | letzter Laut ist Vokal (V) oder Konsonant (C) |
LetztreimDISC | Reim der letzten Silbe im DISC-Format |
LetztsilbDISC | letzte Silbe im DISC-Format |
Letztsilbbetont | letzte Silbe betont |
Morphstat | morphologischer Status |
Ortho | Orthographie/Lemma (Celex) |
Posbetont | Position der betonten Silbe |
Precode | Wortartkombicode des Präfix bzw. "n.a." wenn es kein Präfix gibt (Celex) |
Preortho | Orthographie des Präfix bzw. "n.a." wenn es kein Präfix gibt (Celex) |
SepaPrae | abtrennbares Präfix |
Suffcode | Wortartkombicode des Suffix bzw. "n.a." wenn es kein Präfix gibt (Celex) |
Suffortho | Orthographie des Suffix bzw. "n.a." wenn es kein Präfix gibt (Celex) |
Vorletztsilbbetont | vorletzte Silbe betont |
Wortart | Wortart (Celex) |
Jahr | Publikationsjahr |
Land | Publikationsland (D, D-W, D-O, CH. A) |
Region | Großregion |
Register | Gebrauchstext, Literatur oder Pressetext |
Domain | thematische Klassifizierung |
Medium | Bücher, Gesprochenes, Publikumspresse oder Sonstiges |
Korpus | DeReKo-Subkorpus |
Punkte | Score points für Genitivklassifikation |
Als Artikel (Art) wurden folgende Formen in Klein- und Großschreibung berücksichtigt, die
im Genitiv stehen können:
des, dieses,
eines, meines, jedes, jeden,
keines, deines, seines, ihres,
deines, unseres, eures, jenes,
manches, desjenigen, desselben,
irgendeines, irgendwelches, jedwedes,
jedweden.
Unberücksichtigt bleiben einige Artikel/Artikelwörter, die
zwar vor einem Genitiv-Nomen stehen können, aber für den Zweck der Genitivvorhersage wenig geeignet
sind, weil sie nicht flektieren (z. B. allerlei) oder zu oft in anderen Kasus
stehen. Bei letzteren Ausdrücken handelt es sich vor allem um zwei Artikelwörter, die sowohl im
Genitiv als auch im Akkusativ (evtl. auch Nominativ) stehen können:
alles, sämtliches bzw. allen,
sämtlichen; vgl. alles Erlebnisses, allen
Ernstes (Gen.) und alles Erlebnis (Nom./ Akk.), allen
Aufwand (Akk.).
Als mögliche Genitiv-Präpositionen (Praep) wurden folgende Formen in Klein- und
Großschreibung berücksichtigt:
(a) vor dem Genitiv-Nomen - abseits,
abzüglich, angesichts, anhand,
anlässlich, anstatt, anstelle,
aufgrund, ausschließlich, ausweislich,
behufs, außerhalb, beiderseits,
beidseits, betreffs, bezüglich,
binnen, dank, diesseits,
eingangs, eingedenk, einschließlich,
entlang, fern, fernab,
hinsichtlich, infolge, inklusive,
inkl., incl., inmitten,
innerhalb, innert, jenseits,
kraft, längs, längsseits,
links, mangels, mittels,
mittelst, mithilfe, nahe,
oberhalb, rechts, seitens,
seitlich, seitwärts, statt,
trotz, uneingedenk, unfern,
ungeachtet, unterhalb, unweit,
vermittels, vermittelst, vonseiten,
voll, voller, vorbehaltlich,
vorbehältlich, während, wegen,
weitab, zeit, zuhanden,
zulasten, zugunsten, zuungunsten,
zuzüglich, zwecks,
(b) nach dem Genitiv-Nomen -
anlässlich, ausschließlich, eingedenk,
fern, fernab, halber, infolge,
mangels, unfern, ungeachtet,
unweit, vorbehaltlich, zugunsten,
zuungunsten, wegen, willen.
Eine Reihe
dieser Präpositionen schwankt zwischen Genitiv und anderen Kasus, vor allem Dativ, z. B.
statt, trotz, wegen.
Als mögliche Genitiv-Adjektive (GenAdj) wurden folgende Adjektive berücksichtigt:
ansichtig, bedürftig, bewusst,
fähig, gewiss, gewärtig,
habhaft, kundig, ledig,
schuldig, sicher, teilhaftig,
überdrüssig, verdächtig, verlustig,
wert, würdig.
Als mögliche Genitiv-Verben (GenVerb) wurden folgende Verben berücksichtigt:
(a) nicht reflexiv - belehren, berauben,
entheben, anklagen, beschuldigen,
bezichtigen, verdächtigen, verurteilen,
überführen, zeihen, bedürfen,
gedenken, entbehren, frönen,
harren, kommen, gehen, sterben,
spotten,
(b) reflexiv - annehmen,
bedienen, befleißigen, befreien,
bemächtigen, besinnen, brüsten,
enthalten, entledigen, entziehen,
erbarmen, erwehren, erfreuen,
erinnern, rühmen, schämen,
vergewissern, versichern, wehren.
Einige Verben zeigen mit einem Bedeutungsunterschied Valenzrahmen mit und ohne ein Genitivobjekt
(z. B. entbehren, vgl. die Kinder wollten ihre Arbeiten nicht länger
entbehren vs. Dieser Vorschlag entbehrt jeglichen Sinns für die
Realität), bei anderen konkurriert die Genitivrektion mit der Rektion einer Präposition
(z. B. jemand eines Verbrechens/für ein Verbrechen anklagen), noch andere
schließlich regieren das Genitivobjekt nur noch in festen Wendungen (z. B. des Weges
kommen).
Als Konversionen wurden folgende Nomen berücksichtigt:
Ab,
Allerlei, Blau, Blond, Braun,
Chic, Dasein, Deutsch,
Dunkelgrau, Dutzend, Eigen,
Einerlei, Er, Gelb, Gestern,
Grau, Grün, Hallo, Hell,
Hellgrau, Heute, ICH, Ja,
Jemand, Komplex, Mehr,
Naseweis, Nass, Negativ, Nein,
Nicht, NICHT, Nichts, Ob,
Och, Patt, Platt, Rosa,
Rot, Schick, Schwarz, Souverän,
Super, Weh, Weiß, Wo,
Wozu, Zuviel, Zuwenig,
Zwischendurch.
Der Spaltenname Stil bezieht sich auf folgende Epochenbezeichnungen,
Stilbezeichnungen u. Ä.:
Andante, Art déco, Art
Nouveau, Barock, Bauhaus, Bebop,
Biedermeier, Blues, BossaNova,
Country, Dada, De Stijl, Dub,
Empire, Fado, Fin des Siècle,
Folk, Funk, Gamelan, Gospel,
Hip-Hop, Internationaler Stil, Jazz,
Jodler, Jugendstil, Klezmer,
Lambada, Landler, Latin,
Louis-quatorze, Louis-quinze, Louis-seize,
Metal, Modernisme, Pop, Punk,
Ragtime, Rap, Reggae, Rock,
rock'n'roll, Rokoko, Samba,
Soul, Sturm und Drang, Swing,
Taiko, Tango, Techno, Tex-Mex,
Trip-Hop, Verismo, Walzer, Zen.
Als Zeitausdrücke wurden folgende Lemmalisten berücksichtigt:
liste_jahreszeit:=('frühling','frühjahr','sommer','herbst','winter'),
liste_monat:=('jänner','januar','februar','märz','april','mai','juni','juli','august','september','oktober','november','dezember'),
liste_feiertag:=('neujahr','karneval','fasching','fastnacht','pfingst','pfingsten','karfreitag','karsamstag','oster','ostern','allerheiligen','advent','weihnacht','weihnachten','silvester'),
liste_tag:=('montag','dienstag','mittwoch','donnerstag','freitag','samstag','sonnabend','sonntag'),
liste_tageszeit:=('morgen','vormittag','mittag','nachmittag','abend','nacht').
Weiterhin wurden komplexe Wörter gemäß folgender Kombinationsregeln als Zeitausdrücke
markiert:
liste_jahreszeit + liste_tag,
liste_jahreszeit +
liste_tageszeit,
liste_monat + liste_tag,
liste_monat +
liste_tageszeit,
liste_feiertag + liste_tageszeit,
liste_feiertag +
liste_tag,
liste_tag + liste_tageszeit.