Stellung des adnominalen Genitivs und Variation von Genitiv- und von-Attributen (Datensatz)

Version vom 24.11.2021

Zum Downloadbereich

Quelle

Der Datensatz umfasst 16572 Belege. Die Zeitungsdaten wurden aus dem Korpusgrammatik-Untersuchungskorpus (KoGra-UK) erhoben (vgl. Bubenhofer et al. 2014), basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010, Kupietz et al. 2018), Release 2017-II. Die Internetdaten wurden aus dem DECOW16B-Korpus erhoben (Schäfer & Bildhauer 2012). Die Annotationen stammen teilweise aus den Korpora, teilweise wurden sie manuell vorgenommen.

Spalten

NameErläuterungWert(e)
Rnd_nrZufalls-ID x ∈ ℕ
Corpus_ID Dokument-ID im jeweiligen Korpus DeReKo-Sigle/COW-ID
ReferenceQuellenangabe für Zitationstring
Source_typeMediumstring ∈ {newspaper, forum}
CountryLandstring ∈ {de, at, ch}
DecadeDekade{1990, 2000, 2010}
Sentence_idSatz-ID aus dem KoGra-Korpus bzw. DECOW16Bx ∈ ℕ
TypeKonstruktionstypstring ∈ {post, pre, von}
Type2Konstruktionstyp (zusammengefasst)string ∈ {gen, von}
beforelinker Kontext des Treffersstring
Hit Trefferstring
afterrechter Kontext des Treffersstring
LeftHeadvom Kopf (Head) abhängige Elemente, die links stehenstring
HeadKopf (Wortform)string
RightHeadvom Kopf (Head) abhängige Elemente, die rechts stehenstring
vonWortform von *von*string ∈ {von, vom, (leer)}
LeftAttrvom Attribut (Attr) abhängige Elemente, die links stehenstring
AttrAttribut (Wortform)string
RightAttrvom Attribut (Attr) abhängige Elemente, die rechts stehenstring
POSLeftHead Wortarten der linken abhängigen Elemente des Kopfs (Head)string ∈ STTS-POSTags
POSRightHeadWortarten der rechten abhängigen Elemente des Kopfs (Head)string ∈ STTS-POSTags
POSLeftAttrWortarten der linken abhängigen Elemente des Attributs (Attr)string ∈ STTS-POSTags
POSRightAttrWortarten der rechten abhängigen Elemente des Attributs (Attr)string ∈ STTS-POSTags
NameHeadNamenstatus des Kopfs (Head) nach Stanford (unklare Fälle aufgelöst)string ∈ {app, misc, org, loc, per}
LemmaHeadLemma des Kopfs (Head)string
WordformationHeadWortbildungsregeln des Kopfs (Head) nach Canoostring ∈ KoGra-Worbildungscodes
ExtendedHeadLemma des Kopfs (Head) inklusive Appositionenstring
AppositionNPGesamt-NP ist Teil einer Appositionstring ∈ {y, n, not_checked}
AnimacyHeadBelebtheit des Kopfs (Head)string ∈ {a, c, h, i}
DefinitenessHeadDefinitheit des Kopfs (Head)string ∈ {d, i}
DeterminerHeadDefinitartikel oder ein anderer Artikel (z. B. Demonstrativ){d, other, name_g, irrelevant}
NumberAttrNumerus des Attributs (Attr)string ∈ {sg, pl, unumber}
GenderAttrGenus des Attributs (Attr)string ∈ {fem, neut, masc, ugender}
NameAttrNamenstatus des Attributs (Attr) nach Stanford (unklare Fälle den klaren zugewiesen)string ∈ {app, misc, org, loc, per}
LemmaAttrLemma des Attributs (Attr)string
WordformationAttrWortbildungsregeln des Attributs (Attr) nach Canoostring ∈ KoGra-Wortbildungscodes
ExtendedAttrLemma des Attributs (Attr) inklusive Appositionenstring (einschließlich {0, not_checked})
ExtendedTypeAttrAppositionstyp bei Namenstring ∈ {nn, tn, x}
StructureAttrAttribut strukturell native oder fremdstring ∈ {native, nonnative, not_checked}
PersonNameAttrNamentyp des Attributs (nur Personen)string ∈ {given, pet, family, given+family, title+given, title+family, title+given+family, irrelevant}
LengthNameAttrBuchstabenzahl des Attributs (Spalte ExtendedAttr) (nur wenn NameGrammarAttr=bare_name)number, {irrelevant}
SyllablesAttrSilbenzahl des Attributs (Spalte ExtendedAttr) (nur wenn NameGrammarAttr=\bare_name)x ∈ ℕ oder string ∈ {irrelevant}
SemNameAttrNamentyp des Attributs, feiner, nach Tokens (nur wenn NameGrammarAttr=bare_name und DefinitenessHead=d)string ∈ {band, misc, country, place, person, product, sports_club, organization, irrelevant}
FinalAttrAuslaut des Attributs (nur wenn NameGrammarAttr=bare_name)string ∈ {other, s, irrelevant}
InflGenSgAttrGenitivmarkierung des Attributsnomens (nur wenn NameGrammarAttr=common_noun und NumberAttr=sg)string ∈ {0, 0=0, 0=s, n, n=n, s, s=s, s=0, s=n, adj, irrelevant}
InflDatPlAttrDativmarkierung des Attributsnomens (nur wenn NameGrammarAttr=common_noun und NumberAttr=pl)string ∈ {0, n, adj, irrelevant}
InflClassAttrFlexionsklasse des Attributsnomens (nur wenn NameGrammarAttr=common_noun)string ∈ {(pl), adj, fem, strong, weak, irrelevant}
POSInflInitialAttrWortart erstes flektierendes Element der Attributsphrase (nur wenn nicht NameGrammarAttr=bare_name)string ∈ {ADJ, ARTDEF, ARTINDEF, NN, PDAT, PIAT, PPOSAT, NUMBER, none, irrelevant}
LeftBeforeInflAttrAnzahl Elemente vor erstem flektierendem Element der Attributsphrase (nur wenn nicht NameGrammarAttr=bare_name)x ∈ ℕ oder string ∈ {never, irrelevant}
CaseDistinctionDisambigierungsmöglichkeit der Attributsphrase (Eindeutigkeit des Genitivausdrucks)string ∈ {0, 1, 2, 3, (leer)}
NameGrammarAttrGrammatisches Verhalten des Attributsnomensstring ∈ {bare_name, art_name, phrase_name, common_noun}
AnimacyAttrBelebtheit des Attributs (Attr)string ∈ {a, c, h, i}
SemRelSynsemantische Relation zwischen Kopf und Attribut (bei deverbalem Kopf)string ∈ {subj, obj, subjobj, none, other}
SemRelPossPossessivitätstyp (nur Datensatz zur Stellungsvariation)string ∈ {poss, poss_inal, poss_part, poss_rel, poss_abs, a, u, (leer)}
DateAttrZeit- oder Datumsangabe im Attributstring ∈ {adj_year, adj_cent, adj_dec, adj_mon, adj_min, adj_hour, adj_day, adj_timeofday, adj_week, adj_seas, dem_year, dem_mon, dem_day, dem_week, dem_seas, year, year_span, cent, dec, mon, mon_year, hour, day_mon, day_mon_year, day, timeofday, week, seas, seas_year, none}
DefinitenessAttrDefinitheit Attribut (Attr)string ∈ {d, i}
LengthBetweenZahl der Wörter zwischen Head und Attr, basierend auf HitCountx ∈ ℕ
LengthNPHeadLänge des Kopfs (Wörter, ohne Attribut), automatisch NumberOfWordsLeft/RightHeadx ∈ ℕ
LengthNPAttrLänge des Attributs (Wörter), automatisch NumberOfWordsLeft/RightAttrx ∈ ℕ
LengthNPAttr-2Länge des Kopfs (Wörter, ohne Attribut), manuell überprüft (unvollständig)x ∈ ℕ
EmbeddedKonstruktion mit zwei verschachtelten Attributen bzw. Argumentenstring ∈ {gen, von, case, none}
CoordKoordination des Attributsnomens: Artikellosigkeitstring ∈ {j, oj, kj, n, not_checked}
Coord2Koordination des Attributsnomens: Realisierungstring ∈ {ambig, diff, same, xx, n, not_checked}
ArtAttrAttribut hat Artikelwort (alle Artikelwörter, Auswahl nach STTS)string ∈ {art, noart}
SemReplacementSemantische Ersetzbarkeit (Genitiv/von) gegeben oder nichtstring ∈ {y, n, irrelevant}
GroupSemSemantische Sondergruppestring ∈ {expr_class, mens, mens2, orig1, orig2, orig3, orig4, orig5, orig6, emph_head, per_from_org1, per_from_org2, per_from_org3, per_from_org4, phraseologism, (leer)}
GroupStrucStrukturelle Sondergruppestring ∈ {double_gen, uninfl_attr, defect_name, coord_attr, np=name, (leer)}
AnimacyRelrelative Belebtheit von Attribut und Kopfstring ∈ {head, attr, same}
AttrAdjAttributsnomen flektiert adjektivischstring ∈ {y_alone, y_comb, n}
TitleAttrAttribut mit verschiedenen Appositionstypenstring ∈ {y_bare, y_phrase, n, (leer)}
TypeAttrAttribut aus einfachen und komplexen Eigennamenstring ∈ {compl_name, simple_name, (leer)}
CaseNPKasus der Gesamt-NPstring ∈ {nom, other, (leer)}
OriginSemHerkunftsverhältnis zwischen den beiden Nomenstring ∈ {origin, neutral, (leer)}
IncludePosstrukturelle Austauschbarkeit von Genitiv- und von-Attribut (für Studie zur Genitivstellung)string ∈ {y, n, v}
IncludeGenvonstrukturelle Austauschbarkeit von Genitiv- und von-Attribut (für Studie zur Variation Genitiv/von)-Attributstring ∈ {y, n, v}
GenvonPartitionDatensatz GENVON, unterteilt in Development- und Testdatensatz für Statistikstring ∈ {devel, test, (leer)}
GenvonKat Datensatz GENVON_KATstring ∈ {y, n}
GenvonFormDatensatz GENVON_FORMstring ∈ {y, n}
GenvonCatchoiceDatensatz GENVON_CATCHOICEstring ∈ {y, n}
PrepostPartitionDatensatz PREPOST, unterteilt in Development- und Testdatensatz für Statistikstring ∈ {devel, test, (leer)}
GenvonEnDatensatz GENVON_ENstring ∈ {y, n}

Kodierung

Source_type
CodeErläuterung
newspaperBeleg aus DeReKo mit dem Merkmal "Publikumspresse"
forumBeleg aus DECOW16B mit den Merkmalen "Forum" und "quasispontansprachlich"
Country
CodeErläuterung
deQuelle wurde in Deutschland publiziert (DeReKo) bzw. gehört zur Toplevel-Domain de mit Serverstandort Deutschland (DECOW16B)
atQuelle wurde in Österreich publiziert
chQuelle wurde in der Schweiz publiziert
Decade
CodeErläuterung
1990Quelle wurde zwischen 1990 und 1999 publiziert
2000Quelle wurde zwischen 2000 und 2009 publiziert
2010Quelle wurde zwischen 2010 und 2014 publiziert bzw. wurden in dieser Dekade gescrapet (DECOW16B)
Type
CodeErläuterung
postpostnominales Genitivattribut
prepränominales Genitivattribut
von(postnominales) von-Attribut
Type2
CodeErläuterung
gen(post- oder pränominales) Genitivattribut (d.h. Type=post|pre)
von(postnominales) von-Attribut
von
CodeErläuterung
vonvon-Attribut mit der Präposition von
vomvon-Attribut mit der Präposition-Artikel-Klise vom
(leer)kein von-Attribut (Type2=gen)
NameHead
CodeErläuterung
appKopfnomen ist Appellativ
locKopfnomen ist Ortsname
orgKopfnomen ist Name eines menschlichen Kollektivs (beinhaltet auch Familienverbände wie die Nowaks, die Familie Nowak)
perKopfnomen ist Personenname
miscKopfnomen ist Name für anderes (nicht loc, org, per)
Anmerkung:Vgl. Kopf (2021a).
ExtendedHead
CodeErläuterung
0Gesamt-NP hat nur ein Nomen als internen Kopf
not_checkedGesamt-NP hat wahrscheinlich nur ein Nomen als internen Kopf (aber nicht überprüft)
(string)Gesamt-NP hat einen in sich komplexen internen Kopf (z. B. Klasse 1a und 1b, § 61 GG, Free Jazz, Rotes Kreuz)
AppositionNP
CodeErläuterung
yEs liegt sicher eine Apposition vor. Auch potenziell ambige Strukturen wie Justus Neumanns Theaterzirkus "Alzheimer Symphonie" zählen als Gesamtapposition, vgl. Genitivstellungskapitel (in den Daten betrifft das 14 Belege).
nEs liegt sicher keine Apposition vor.
not_checkedDaten wurden nicht auf Appositionsstatus geprüft, weil unwahrscheinlich, dass eine vorliegt. Können für Statistik mit "n" zusammengefasst werden.
AnimacyHead
CodeErläuterung
hKopfnomen (Token) bezeichnet Mensch (individuierbar)
cKopfnomen (Token) bezeichnet menschliches Kollektiv
aKopfnomen (Token) bezeichnet Tier
iKopfnomen (Token) bezeichnet Unbelebtes
Anmerkung:Vgl. Kopf (2021a).
DefinitenessHead
CodeErläuterung
dKopfnomen (=Gesamt-NP) hat einen definiten Determinierer (inkl. Eigenname in Determiniererposition), ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr
iKopfnomen (=Gesamt-NP) hat einen indefiniten oder keinen Determinierer, ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr
DeterminerHead
CodeErläuterung
dKopfnomen hat Definitartikel (nur GENVON_EN)
otherKopfnomen hat anderes Artikelwort (nur GENVON_EN)
name_gKopfnomen hat kein Artikelwort, weil es ein primär artikelloser Eigenname ist (nur GENVON_EN)
irrelevantBeleg gehört nicht zu GENVON_EN
GenderAttr
CodeErläuterung
femAttributsnomen ist Femininum
mascAttributsnomen ist Maskulinum
neutAttributsnomen ist Neutrum
ugenderGenus des Attributsnomens nicht erkennbar/nicht eindeutig (z. B. Partizipien im Plural, Pluralia Tanta wie Leute, Kosten etc.)
NameAttr
CodeErläuterung
appAttributsnomen ist Appellativ
locAttributsnomen ist Ortsname
orgAttributsnomen ist Name eines menschlichen Kollektivs (beinhaltet auch Familienverbände wie die Nowaks, die Familie Nowak)
perAttributsnomen ist Personenname
miscAttributsnomen ist Name für anderes (nicht loc, org, per)
Anmerkung:Vgl. Kopf (2021a).
ExtendedAttr
CodeErläuterung
0Attributs-NP hat nur ein Nomen als internen Kopf
not_checkedAttributs-NP hat wahrscheinlich nur ein Nomen als internen Kopf (aber nicht überprüft)
(string)Attributs-NP hat einen in sich komplexen internen Kopf (z. B. Klasse 1a und 1b, § 61 GG, Free Jazz, Rotes Kreuz)
ExtendedTypeAttr
CodeErläuterung
nnInterner Attributskopf ist ein Name, er besteht aus mehreren Namensbestandteilen und der Name ist ohne sie unvollständig (z. B. Carlo De Benedetti, Lange Nacht der Immobilien, Schulhaus Happerswil)
tnInterner Attributskopf ist ein Name, er besteht aus Titel (im weiteren Sinne) und Name, der Name wäre auch ohne den Titel ein Name (z. B. Stadt Malmö, Ägypter Anwar es-Sadat)
xInterner Attributskopf ist kein Name (z. B. Projekt, Juni 2010) oder ist ein Name, aber besteht nur aus einem Wort (z. B. Roßbach, Schweiz)
StructureAttr
CodeErläuterung
nativeAttribut hat keine Fremdstruktur
nonnativeAttribut hat Fremdstruktur
not_checkedAttribut wurde nicht auf Struktur geprüft (gehört nicht zum Zufallssample)
PersonNameAttr
CodeErläuterung
familyAttribut ist Familienname (z. B. Djindjic)
petAttribut ist Kosename (z. B. Lambo-Manni)
givenAttribut ist Rufname (z. B. Jeanne-Marie)
given+familyAttribut ist Ruf- und Familienname (z. B. Lydia Steinbacher)
title+familyAttribut ist Titel und Familienname (z. B. Frau Glas)
title+givenAttribut ist Titel und Rufname (z. B. Baby Diana)
title+given+familyAttribut ist Titel, Ruf- und Familienname (z. B. Schauspielerin Lindsay Lohan)
irrelevantAttribut ist kein Personenname (NameAttr!=per)
Anmerkung:Nicht annotierte Kombinationen (z. B. pet+family) sind nicht im Korpus belegt.
SemNameAttr
CodeErläuterung
bandAttribut (Token) wird im Kontext als Bandname gebraucht (z. B. Wham)
countryAttribut (Token) wird im Kontext als Ländername gebraucht (z. B. Malta)
placeAttribut (Token) wird im Kontext als Ortsname gebraucht (z. B. Rostock)
personAttribut (Token) wird im Kontext als Personenname gebraucht (z. B. Regine Weingart)
productAttribut (Token) wird im Kontext als Produktname (eines individuellen Produkts) gebraucht (z. B. Bravo)
sports_clubAttribut (Token) wird im Kontext als Sportvereinsname gebraucht (z. B. Boppard 'Fußballverein aus Boppard')
organizationAttribut (Token) wird im Kontext als Name eines menschlichen Kollektivs (Unternehmen oder andere Gruppen, außer Sportvereine) gebraucht (z. B. Planet Hollywood, Familie Mendelssohn)
miscAttribut (Token) wird im Kontext als sonstiger Name gebraucht (z. B. San Marco 'Kirche')
irrelevantBeleg ist nicht NameGrammarAttr=bare_name und/oder nicht DefinitenessHead=d
Anmerkung:Vgl. Kopf (2021a).
FinalAttr
CodeErläuterung
sAttributslemma endet auf [s]; neben <s> auch als <z>, <ß>, <se>, <ce> geschrieben
otherAttributslemma endet nicht auf [s]
irrelevantBeleg ist nicht NameGrammarAttr=bare_name
InflGenSgAttr
CodeErläuterung
0erwartet (für Type2=von): kein Genitivflexiv am Attributsnomen (vorhanden nicht prüfbar, da von-Beleg)
0=0erwartet und vorhanden (für Type2=gen): kein Genitivflexiv am Attributsnomen
0=serwartet (für Type2=gen): kein Genitivflexiv am Attributsnomen, vorhanden: s-Flexiv (inkl. -es)
serwartet (für Type2=von): s-Flexiv am Attributsnomen (vorhanden nicht prüfbar, da von-Beleg)
s=serwartet und vorhanden (für Type2=gen): s-Flexiv (inkl. -es) am Attributsnomen
s=0erwartet (für Type2=gen): s-Flexiv (inkl. -es) am Attributsnomen, vorhanden: kein Genitivflexiv
s=nerwartet (für Type2=gen): s-Flexiv (inkl. -es) am Attributsnomen , vorhanden: n-Flexiv (inkl. -en)
nerwartet (für Type2=von): n-Flexiv am Attributsnomen (vorhanden nicht prüfbar, da von-Beleg)
n=nerwartet und vorhanden (für Type2=gen): n-Flexiv (inkl. -en) am Attributsnomen
adjerwartet und vorhanden: adjektivische Flexion des Attributsnomens
irrelevantBeleg ist nicht NameGrammarAttr=common_noun und/oder nicht NumberAttr=sg
InflDatPlAttr
CodeErläuterung
0erwartet (für Type2=gen) oder vorhanden (für Type2=von): endungsloser Dativ Plural am Attributsnomen
nerwartet (für Type2=gen) oder vorhanden (für Type2=von): Dativ Plural auf -n am Attributsnomen
adjvorhanden: adjektivische Flexion des Attributsnomens
irrelevantBeleg ist nicht NameGrammarAttr=common_noun und/oder nicht NumberAttr=pl
InflClassAttr
CodeErläuterung
(pl)Attributsnomen steht im Plural
adjAttributsnomen steht im Singular und flektiert adjektivisch
femAttributsnomen steht im Singular und ist Femininum (= Nullflexiv)
weakAttributsnomen steht im Singular und flektiert schwach (=n-Flexiv)
strongAttributsnomen steht im Singular und flektiert stark/gemischt (=s-Flexiv)
irrelevantBeleg ist nicht NameGrammarAttr=common_noun
POSInflInitialAttr
CodeErläuterung
ADJerstes (potenziell) flektierendes Element der Attributsphrase ist Adjektiv
ARTDEFerstes (potenziell) flektierendes Element der Attributsphrase ist Definitartikel (der, die, das)
ARTINDEFerstes (potenziell) flektierendes Element der Attributsphrase ist Indefinitartikel (ein/e/s)
NNerstes (potenziell) flektierendes Element der Attributsphrase ist Attributsnomen (Jugendlicher, es handelt sich immer um substantivierte Adjektive)
PDATerstes (potenziell) flektierendes Element der Attributsphrase ist indefiniter Determinierer (z. B. kein)
PIATerstes (potenziell) flektierendes Element der Attributsphrase ist Demonstrativartikel (z. B. dieser)
PPOSATerstes (potenziell) flektierendes Element der Attributsphrase ist Possessivartikel (z. B. mein)
NUMBERerstes (potenziell) flektierendes Element der Attributsphrase ist Zahl (zwei oder drei)
irrelevantBeleg ist NameGrammarAttr=bare_name
nonees ist kein erstes potenziell flektierendes Element vorhanden
LeftBeforeInflAttr
CodeErläuterung
0, 1, 2, 3Zahl der Elemente vor dem ersten flektierenden Element der Attributsphrase
neverkein (potenziell) erstes flektierendes Element der Attributsphrase (außer dem Attributsnomen) vorhanden
irrelevantBeleg ist NameGrammarAttr=bare_name
CaseDistinction
CodeErläuterung
0Keine Kasusdisambiguierung in der Attributsphrase
1Frühe Kasusdisambiguierung in der Attributsphrase
2Späte Kasusdisambiguierung in der Attributsphrase (Nomen)
3Späte Kasusdisambiguierung in der Attributsphrase (kombinierend)
(leer)Beleg gehört nicht zum Variationsbereich von Genitiv- und von- Attribut
NameGrammarAttr
CodeErläuterung
bare_nameAttribut ist Eigenname ohne Proprialartikel ("grammatischer Eigenname") (Gülay)
art_nameAttribut ist Eigenname mit Proprialartikel (das Christkind, die Schweiz)
phrase_nameAttribut ist Eigenname in syntaktisch (über Artikel hinaus) erweiterter Phrase (die kleine Gülay, die Deutsche Post)
common_nounAttribut ist Appellativ
Anmerkung:Vgl. Kopf (2021a).
AnimacyAttr
CodeErläuterung
hKopfnomen (Token) bezeichnet Mensch (individuierbar)
cKopfnomen (Token) bezeichnet menschliches Kollektiv
aKopfnomen (Token) bezeichnet Tier
iKopfnomen (Token) bezeichnet Unbelebtes
Anmerkung:Vgl. Kopf (2021a).
SemRelSyn
CodeErläuterung
subjSubjektsattribut (Attribut ist als Subjekt des Kopfnomens auffassbar)
objObjektsattribut (Attribut ist als Objekt des Kopfnomens auffassbar)
subjobjSubjekts- oder Objektsattribut (nicht entscheidbar)
otherAttribut kann als weitere Ergänzung des (deverbalen) Kopfnomens aufgefasst werden (z. B. Abfahrt vom Carparkplatz)
nonekein S-, O- oder K-Verhältnis von Attribut zu Kopf
SemRelPoss
CodeErläuterung
possPossessivität im engeren Sinne (unbelebtes Objekt, belebter Possessor)
poss_inalinalienable Possession
poss_partpossessive Teil-Ganzes-Beziehung
poss_relPossessum ist inhärent relational
poss_absPossessum ist Abstraktum
{a, u}kein Possessivverhältnis/nicht entscheidbar
(leer)Beleg gehört nicht zum Datensatz GENPOS
Anmerkung:Vgl. Kopf (2021a).
DateAttr
CodeErläuterung
adj_yearAttribut enthält ein Adjektiv und das Nomen Jahr, auch als Kopf von Wortbildungen (z. B. letzten Jahres, neuen Jahres, der vergangenen 30 Jahre, der Jahre 2002 und 2006), Determinierer optional
adj_centAttribut enthält ein Adjektiv und das Nomen Jahrhundert, auch als Kopf von Wortbildungen (z. B. des sich nun neigenden Jahrhunderts, des vorigen Jahrhunderts), Determinierer optional
adj_decAttribut enthält ein Adjektiv und das Nomen Jahrzehnt oder eine Bezeichnung für ein Jahrzehnt, auch als Kopf von Wortbildungen (z. B. des letzten Jahrzehntes), Determinierer optional
adj_monAttribut enthält ein Adjektiv und das Nomen Monat oder eine Monatsbezeichnung, auch als Kopf von Wortbildungen (z. B. vom letzten Juni, der vergangenen Monate), Determinierer optional
adj_minAttribut enthält ein Adjektiv und das Nomen Minute, auch als Kopf von Wortbildungen (z. B. der ersten 45 Minuten, von 2 Minuten), Determinierer optional
adj_hourAttribut enthält ein Adjektiv und das Nomen Stunde, auch als Kopf von Wortbildungen (z. B. der investierten Stunden), Determinierer optional
adj_dayAttribut enthält ein Adjektiv und das Nomen Tag, Wochenende oder eine Tagesbezeichnung, auch als Kopf von Wortbildungen (z. B. des darauffolgenden Tages, vom kommenden Wochenende), Determinierer optional
adj_timeofdayAttribut enthält ein Adjektiv und das Nomen Morgen, Mittag, Nachmittag, Abend, Nacht, auch als Kopf von Wortbildungen (z. B. vom letzten Dienstagabend), Determinierer optional
adj_weekAttribut enthält ein Adjektiv und das Nomen Woche, auch als Kopf von Wortbildungen (z. B. der letzten Wochen), Determinierer optional
adj_seasAttribut enthält ein Adjektiv und eine Jahreszeitbezeichnung, auch als Kopf von Wortbildungen (z. B. des vergangenen Sommers), Determinierer optional
dem_yearAttribut enthält (ausschließlich) ein Demonstrativum und das Nomen Jahr, auch als Kopf von Wortbildungen (z. B. dieses Jahres)
dem_monAttribut enthält (ausschließlich) ein Demonstrativum und das Nomen Monat, auch als Kopf von Wortbildungen oder eine Monatsbezeichnung (z. B. dieses Monats)
dem_weekAttribut enthält (ausschließlich) ein Demonstrativum und das Nomen Woche, auch als Kopf von Wortbildungen (z. B. dieser Woche)
dem_dayAttribut enthält (ausschließlich) ein Demonstrativum und das Nomen Tag, auch als Kopf von Wortbildungen (z. B. dieser Tage)
dem_seasAttribut enthält (ausschließlich) ein Demonstrativum und eine Jahreszeitbezeichnung, auch als Kopf von Wortbildungen (z. B. dieses Sommers)
yearAttribut enthält das Nomen Jahr, auch als Kopf von Wortbildungen (z. B. des Jahres, vom Vorjahr), Determinierer optional
year_spanAttribut enthält das Nomen Jahr, auch als Kopf von Wortbildungen, und eine Zeitspanne (z. B. der Jahre 2002 bis 2009), Determinierer optional
centAttribut enthält das Nomen Jahrhundert, auch als Kopf von Wortbildungen (z. B. des Jahrhunderts), Determinierer optional
decAttribut enthält das Nomen Jahrzehnt oder eine Bezeichnung für ein Jahrzehnt, auch als Kopf von Wortbildungen (z. B. der 1940er-Jahre, der zwanziger Jahre), Determinierer optional
monAttribut enthält das Nomen Monat oder eine Monatsbezeichnung, auch als Kopf von Wortbildungen(z. B. des Monats, vom September, der Monate Juni und Juli), Determinierer optional
mon_yearAttribut enthält eine Monatsbezeichnung mit Jahreszahl (z. B. vom November 1996), Determinierer optional
hourAttribut enthält das Nomen Stunde , auch als Kopf von Wortbildungen (z. B. der Stunde), Determinierer optional
day_monAttribut enthält ein Datum aus Tag und Monat (z. B. vom 10. November), Determinierer optional
day_mon_yearAttribut enthält ein Datum aus Tag, Monat und Jahr (z. B. vom 16. Mai 2006, des 17. Jänner dieses Jahres), Determinierer optional
dayAttribut enthält das Nomen Tag, Wochenende oder eine Tagesbezeichnung, auch als Kopf von Wortbildungen (z. B. vom Wochenende, des Vortages), Determinierer optional
timeofdayAttribut enthält das Nomen Morgen, Mittag, Nachmittag, Abend, Nacht (z. B. des Abends, vom Morgen und Nachmittag), Determinierer optional
weekAttribut enthält das Nomen Woche, auch als Kopf von Wortbildungen (z. B. der Woche), Determinierer optional
seasAttribut enthält eine Jahreszeitbezeichnung, auch als Kopf von Wortbildungen (z. B. des vergangenen Sommers), Determinierer optional
seas_yearAttribut enthält eine Jahreszeitbezeichnung und das Nomen Jahr oder eine Jahreszahl, auch als Kopf von Wortbildungen (z. B. vom Sommer 2013, vom Sommer v. J.), Determinierer optional
noneAttribut enthält keine Zeit- oder Datumsangabe mit den oben gegebenen Strukturen
Anmerkung:Nicht annotierte Kombinationen (z. B. day_span existieren in den Daten nicht, wurden aber geprüft).
DefinitenessAttr
CodeErläuterung
dAttributsnomen (=Attributs-NP) ist definit (= hat einen definiten Determinierer inkl. Eigenname in Determiniererposition), ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr
iAttributsnomen (=Attributs-NP) ist indefinit (= hat einen indefiniten oder keinen Determinierer), ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr
Embedded
CodeErläuterung
genGesamt-NP ist ein Genitivattribut oder hat ein Genitivattribut (z. B. mit Ende [des ersten Quartals (Head) des heurigen Jahres (Attr)], [Regisseur (Head) des Jahres (Attr)] der Zeitschrift Opernwelt, Häufigkeit entspricht der [eines Zweitkarzinoms (Head) der Lunge (Attr)]) oder Gesamt-NP steht im Genitiv und wird von einer Präposition oder einem Verb gefordert oder Attribut hat ein Genitivattribut (z. B. als wäre er sich[des Ernsts der Lage] bewusst, wegen [des Verdachts einer Drogenfahrt])
vonGesamt-NP ist ein von-Attribut oder hat ein von-Attribut (z. B. die Weitergabe von [Namen und Adressen ihrer Kunden], [Am Tag der Sonne] von Swisssolar) oder Gesamt-NP ist Teil einer von-PP, die von einer Präposition oder einem Verb gefordert wird oder Attribut hat ein von-Attribut (z. B. Der Vater (Head) [des verstorbenen Prinzen (Attr) von 2010])
casePotenziell "gen", aber die Phrase wird von einer Präposition gefordet, deren Kasusforderung schwanken kann und hat selbst keine eindeutige Genitivmarkierung (trotz der Auflösung erheblicher Rücklagen)
noneStruktur ist nicht "gen", "von" oder "case"
Coord
CodeErläuterung
jAttributsnomen ist koordiniert
ojAttributsnomen ist koordiniert, Konjunkt ist originär artikellos (möglich) (z. B. Der Rolle der [Städte und Gemeinden], die Rolle von [Schaufler und Diehl])
kjAttributsnomen ist koordiniert, Konjunkt ist nicht originär artikellos (möglich) (z. B. Kunstbegriff des Mittelalters und der Renaissance)
nAttributsnomen ist nicht koordiniert (geprüft)
not_checkedAttributsnomen ist wahrscheinlich nicht koordiniert (nicht geprüft)
Coord2
CodeErläuterung
ambigAttributsnomen ist koordiniert, es ist nicht erkennbar, ob das zweite Konjunkt zur von-Präposition gehört oder im Genitiv steht (die Mischung von Pitch und dazugehöriger Stellung der Rotorblätter)
diffAttributsnomen ist koordiniert, ein Konjunkt ist ein Genitivattribut, das andere ein von-Attribut (eine Folge von Minderausgaben und höherer Steuereinnahmen)
sameAttributsnomen ist koordiniert, beide Konjunkte haben dieselbe Form (der Unterhalt des Leitungsnetzes und der Anlagen, an der Schnittstelle von Gottes- und Nächstenliebe)
xxAttributsnomen ist koordiniert, zweites Konjunkt ist eine NP, die nicht im Genitiv steht (in den bereich der unsichtbaren Grenze, und anderen Zwistigkeiten)
nAttributsnomen ist nicht koordiniert (geprüft)
not_checkedAttributsnomen ist wahrscheinlich nicht koordiniert (nicht geprüft)
ArtAttr
CodeErläuterung
artAttributs-NP weist Determinier, d. h. Artikel (ART), attributives Possessivpronomen (PPOSAT), attributives Demonstrativpronomen (PDAT) oder attributives Indefinitpronomen (PIAT) auf
noartAttributs-NP weist keinen Determinierer auf (die Arbeit [hartnäckiger Frauen]) bzw. der Determinierer ist ein adnominaler Genitiv (die nachträgliche Wirkung von [Walujews angeblich entscheidendem Schlag])
SemReplacement
CodeErläuterung
yAttribut ist semantisch gegen Genitivattribut bzw. von-Attribut austauschbar
nAttribut ist semantisch nicht austauschbar
irrelevantAttribut ist strukturell nicht austauschbar
GroupSem
CodeErläuterung
expr_classGesamtphrase dient der expressiven Klassifikation (dieser arrogante typ von nalbandian)
mensAttribut ist Maßattribut
mens2Attribut entspricht Maßattribut, hat aber kein Zahlwort, sondern ein anderes, flektierendes (z. B. wenige)
orig1Attribut verortet das Kopfnomen temporal, ohne enge Zugehörigkeit auszudrücken (Pressemitteilung vom 4. Januar 2008)
orig2Attribut verortet das Kopfnomen spatial, ohne enge Zugehörigkeit auszudrücken (die Pleite von Amsterdam)
orig3Attribut hat durch die Präposition markierte privative/ablativische Semantik, vom Kopfnomen gestützt (Abschied von, Weg von)
orig4Attribut hat durch die Präposition markierte privative/ablativische Semantik, nicht vom Kopfnomen gestützt (Bilder vom Mond)
orig5wie orig4, aber mit generischer Lesart des Attributs (Tipps vom Fachmann)
orig6Attribut beschreibt eine Strecke, Spanne (Platten von Tortoise bis Rush)
emph_headKopfnomen spielt im genannten Zeitausschnitt eine herausragende Rolle
per_from_org1Attribut ist Kollektiv, Kopfnomen ist Personenname (ersetzbar=nein, wenn Kollektiv nicht artikellos)
per_from_org2Attribut ist Kollektiv, Kopfnomen ist Personenname mit funktionsbezeichnendem Titel (ersetzbar=nein, wenn Kollektiv nicht artikellos)
per_from_org3Attribut ist Kollektiv, Kopfnomen ist Personenbezeichnung (appellativisch) (ersetzbar=nein, wenn Kollektiv nicht artikellos)
per_from_org4Attribut ist Kollektiv, Kopfnomen ist Personenname mit nicht-funktionsbezeichnendem Titel (ersetzbar=nein, wenn Kollektiv nicht artikellos)
phraseologismGesamtphrase oder Phrasenteil ist Phraseologismus (Qual der Wahl, Triathlon-Konkurrenz vom Feinsten)
(leer)Keine semantischen Besonderheiten
Anmerkung:Für Details vgl. Kopf (2021b).
GroupStruc
CodeErläuterung
double_genAttribut hat pränominalen Genitv (die eigentliche Rache von Adornos Diktum)
uninfl_attrAttribut hat unflektierte abhängige Elemente, darunter eines auf -er (den Anordnungen von Schweizer Zivilrichtern, in Analysen Schweizer Großbanken)
defect_nameAttribut ist artikelloser Name (Bandname, Musiktitel, Filmtitel), der sich nicht genitivisch ausdrücken lässt
coord_attrAttribut besteht aus zwei artikellosen Konjunkten, Artikellosigkeit nur durch Koordination möglich
np=nameGesamtphrase ist ein Eigenname
(leer)Keine strukturellen Besonderheiten
Anmerkung:Für Details vgl. Kopf (2021b, 2021c).
AnimacyRel
CodeErläuterung
headKopfnomen ist belebter als Attributsnomen (jeweils tokenbasiert)
attrAttributsnomen ist belebter als Kopfnomen (jeweils tokenbasiert)
sameBeide Nomen sind gleich belebt
AttrAdj
CodeErläuterung
y_aloneAttributsnomen flektiert adjektivisch und es ist kein weiteres flektierendes Element in der Attributsphrase vorhanden (Betreuung Jugendlicher, Betreuung von Jugendlichen)
y_combAttributsnomen flektiert adjektivisch und es ist ein weiteres flektierendes Element in der Attributsphrase vorhanden (Betreuung der Jugendlichen)
nAttributsnomen flektiert nicht adjektivisch
TitleAttr
CodeErläuterung
y_phraseAttribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) in einer Apposition mit einem Titel, es ist ein weiteres flektierendes Element in der Attributsphrase vorhanden (im Hause der Bauernfamilie Nägeli)
y_bareAttribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) in einer Apposition mit einem Titel, es ist kein weiteres flektierendes Element in der Attributsphrase vorhanden (Enzympeeling von Frau Glas)
nAttribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name), aber nicht in einer Apposition mit einem Titel
(leer)Attribut ist kein prototypischer Eigenname
TypeAttr
CodeErläuterung
compl_nameAttribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) aus (mind.) zwei Bestandteilen (Hinrichtung des Russen-Paten Sergej Hodschahmedov)
simpleAttribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) aus einem Bestandteil
(leer)Attribut ist kein prototypischer Eigenname
CaseNP
CodeErläuterung
nomGesamt-NP steht im Nominativ
otherGesamt-NP steht nicht im Nominativ
(leer)Beleg gehört nicht zu GENPOS
OriginSem
CodeErläuterung
originZwischen Kopfnomen und Attribut lässt sich, neben der allgemeineren Relation, ein Herkunftsverhältnis annehmen
neutralZwischen Kopfnomen und Attribut lässt sich kein Herkunftsverhältnis annehmen
(leer)Nicht Teil des annotierten Samples (d. h. GenvonPartition(dataprep)!=test)
IncludePos
CodeErläuterung
yStrukturell austauschbar (Genitivattribut und von-Attribut)
vStrukturell nur von-Attribut möglich
nIrrelevant für den Datensatz GENPOS und GENVON-EN
Anmerkung:Basis für Kopf (2021a), teilweise später erfolgte, minimale Korrekturen bei der Verteilung der drei Ausprägungen sind nicht enthalten. Für neuere Untersuchungen liegt die Spalte "IncludeGenvon" zugrunde.
IncludeGenvon
Anmerkung:S. "IncludePos", aber seither leicht aktualisiert, daher teilweise Unterschiede.
GenvonPartition
CodeErläuterung
develBeleg gehört zum Datensatz GENVON (s. Kopf 2021b) und wurde zur Modellentwicklung verwendet
testBeleg gehört zum Datensatz GENVON (s. Kopf 2021b) und wurde für das endgültige Modell verwendet
(leer)Beleg gehört nicht zum Datensatz GENVON
GenvonKat
CodeErläuterung
yBeleg gehört zum Datensatz GENVON_KAT (s. Kopf 2021b)
nBeleg gehört nicht zum Datensatz GENVON_KAT
GenvonForm
CodeErläuterung
yBeleg gehört zum Datensatz GENVON_FORM (s. Kopf 2021b)
nBeleg gehört nicht zum Datensatz GENVON_FORM
GenvonCatchoice
CodeErläuterung
yBeleg gehört zum Datensatz GENVON_CATCHOICE
nBeleg gehört nicht zum Datensatz GENVON_CATCHOICE
PrepostPartition
CodeErläuterung
develBeleg gehört zum Datensatz PREPOST (s. Kopf 2021a) und wurde zur Modellentwicklung verwendet
testBeleg gehört zum Datensatz PREPOST (s. Kopf 2021a) und wurde für das endgültige Modell verwendet
(leer)Beleg gehört nicht zum Datensatz PREPOST
GenvonEn
CodeErläuterung
yBeleg gehört zum Datensatz GENVON_EN
nBeleg gehört nicht zum Datensatz GENVON_EN

Literatur

  • Bubenhofer, Noah, Marek Konopka & Roman Schneider. 2014. Präliminarien einer Korpusgrammatik. Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache, Bd. 4. Tübingen: Narr. Unter Mitwirkung von Caren Brinckmann, Katrin Hein und Bruno Strecker.
  • Kopf, Kristin. 2021a. Stellung des adnominalen Genitivs. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24420.
  • Kopf, Kristin. 2021b. Genitiv- und von-Attribute: Bestimmung des Variationsbereichs. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24421.
  • Kopf, Kristin. 2021c. Sonderfälle des Genitivattributs. DOI: https://doi.org/10.14618/sondergenitiv.
  • Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).
  • Kupietz, Marc, Harald Lüngen, Paweł Kamocki & Andreas Witt. 2018. The German reference corpus DeReKo: New developments – new opportunities. In Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis & Takenobu Tokunaga (Hgg.),Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018) , 4353–4360. Miyazaki: European Language Resources Association (ELRA).
  • Schäfer, Roland & Felix Bildhauer. 2012. Building Large Corpora from the Web Using a New Efficient Tool Chain. In Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mariani, Asuncion Moreno, Jan Odijk, Stelios Piperidis (Hgg.), Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 12), 486–493. Istanbul: European Language Resources Association (ELRA).

Zum Text

Schlagwörter
Autor(en)
Kristin Kopf, Felix Bildhauer
Bearbeiter
René Boye
Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen