Stellung des adnominalen Genitivs und Variation von Genitiv- und von-Attributen (Datensatz)
Version vom 24.11.2021
Zum Downloadbereich
Quelle
Der Datensatz umfasst 16572 Belege. Die Zeitungsdaten wurden aus dem Korpusgrammatik-Untersuchungskorpus (KoGra-UK) erhoben (vgl. Bubenhofer et al. 2014), basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010, Kupietz et al. 2018), Release 2017-II. Die Internetdaten wurden aus dem DECOW16B-Korpus erhoben (Schäfer & Bildhauer 2012). Die Annotationen stammen teilweise aus den Korpora, teilweise wurden sie manuell vorgenommen.
Spalten
Name | Erläuterung | Wert(e) |
Rnd_nr | Zufalls-ID | x ∈ ℕ |
Corpus_ID | Dokument-ID im jeweiligen Korpus | DeReKo-Sigle/COW-ID |
Reference | Quellenangabe für Zitation | string |
Source_type | Medium | string ∈ {newspaper, forum} |
Country | Land | string ∈ {de, at, ch} |
Decade | Dekade | {1990, 2000, 2010} |
Sentence_id | Satz-ID aus dem KoGra-Korpus bzw. DECOW16B | x ∈ ℕ |
Type | Konstruktionstyp | string ∈ {post, pre, von} |
Type2 | Konstruktionstyp (zusammengefasst) | string ∈ {gen, von} |
before | linker Kontext des Treffers | string |
Hit | Treffer | string |
after | rechter Kontext des Treffers | string |
LeftHead | vom Kopf (Head) abhängige Elemente, die links stehen | string |
Head | Kopf (Wortform) | string |
RightHead | vom Kopf (Head) abhängige Elemente, die rechts stehen | string |
von | Wortform von *von* | string ∈ {von, vom, (leer)} |
LeftAttr | vom Attribut (Attr) abhängige Elemente, die links stehen | string |
Attr | Attribut (Wortform) | string |
RightAttr | vom Attribut (Attr) abhängige Elemente, die rechts stehen | string |
POSLeftHead | Wortarten der linken abhängigen Elemente des Kopfs (Head) | string ∈ STTS-POSTags |
POSRightHead | Wortarten der rechten abhängigen Elemente des Kopfs (Head) | string ∈ STTS-POSTags |
POSLeftAttr | Wortarten der linken abhängigen Elemente des Attributs (Attr) | string ∈ STTS-POSTags |
POSRightAttr | Wortarten der rechten abhängigen Elemente des Attributs (Attr) | string ∈ STTS-POSTags |
NameHead | Namenstatus des Kopfs (Head) nach Stanford (unklare Fälle aufgelöst) | string ∈ {app, misc, org, loc, per} |
LemmaHead | Lemma des Kopfs (Head) | string |
WordformationHead | Wortbildungsregeln des Kopfs (Head) nach Canoo | string ∈ KoGra-Worbildungscodes |
ExtendedHead | Lemma des Kopfs (Head) inklusive Appositionen | string |
AppositionNP | Gesamt-NP ist Teil einer Apposition | string ∈ {y, n, not_checked} |
AnimacyHead | Belebtheit des Kopfs (Head) | string ∈ {a, c, h, i} |
DefinitenessHead | Definitheit des Kopfs (Head) | string ∈ {d, i} |
DeterminerHead | Definitartikel oder ein anderer Artikel (z. B. Demonstrativ) | {d, other, name_g, irrelevant} |
NumberAttr | Numerus des Attributs (Attr) | string ∈ {sg, pl, unumber} |
GenderAttr | Genus des Attributs (Attr) | string ∈ {fem, neut, masc, ugender} |
NameAttr | Namenstatus des Attributs (Attr) nach Stanford (unklare Fälle den klaren zugewiesen) | string ∈ {app, misc, org, loc, per} |
LemmaAttr | Lemma des Attributs (Attr) | string |
WordformationAttr | Wortbildungsregeln des Attributs (Attr) nach Canoo | string ∈ KoGra-Wortbildungscodes |
ExtendedAttr | Lemma des Attributs (Attr) inklusive Appositionen | string (einschließlich {0, not_checked}) |
ExtendedTypeAttr | Appositionstyp bei Namen | string ∈ {nn, tn, x} |
StructureAttr | Attribut strukturell native oder fremd | string ∈ {native, nonnative, not_checked} |
PersonNameAttr | Namentyp des Attributs (nur Personen) | string ∈ {given, pet, family, given+family, title+given, title+family, title+given+family, irrelevant} |
LengthNameAttr | Buchstabenzahl des Attributs (Spalte ExtendedAttr) (nur wenn NameGrammarAttr=bare_name) | number, {irrelevant} |
SyllablesAttr | Silbenzahl des Attributs (Spalte ExtendedAttr) (nur wenn NameGrammarAttr=\bare_name) | x ∈ ℕ oder string ∈ {irrelevant} |
SemNameAttr | Namentyp des Attributs, feiner, nach Tokens (nur wenn NameGrammarAttr=bare_name und DefinitenessHead=d) | string ∈ {band, misc, country, place, person, product, sports_club, organization, irrelevant} |
FinalAttr | Auslaut des Attributs (nur wenn NameGrammarAttr=bare_name) | string ∈ {other, s, irrelevant} |
InflGenSgAttr | Genitivmarkierung des Attributsnomens (nur wenn NameGrammarAttr=common_noun und NumberAttr=sg) | string ∈ {0, 0=0, 0=s, n, n=n, s, s=s, s=0, s=n, adj, irrelevant} |
InflDatPlAttr | Dativmarkierung des Attributsnomens (nur wenn NameGrammarAttr=common_noun und NumberAttr=pl) | string ∈ {0, n, adj, irrelevant} |
InflClassAttr | Flexionsklasse des Attributsnomens (nur wenn NameGrammarAttr=common_noun) | string ∈ {(pl), adj, fem, strong, weak, irrelevant} |
POSInflInitialAttr | Wortart erstes flektierendes Element der Attributsphrase (nur wenn nicht NameGrammarAttr=bare_name) | string ∈ {ADJ, ARTDEF, ARTINDEF, NN, PDAT, PIAT, PPOSAT, NUMBER, none, irrelevant} |
LeftBeforeInflAttr | Anzahl Elemente vor erstem flektierendem Element der Attributsphrase (nur wenn nicht NameGrammarAttr=bare_name) | x ∈ ℕ oder string ∈ {never, irrelevant} |
CaseDistinction | Disambigierungsmöglichkeit der Attributsphrase (Eindeutigkeit des Genitivausdrucks) | string ∈ {0, 1, 2, 3, (leer)} |
NameGrammarAttr | Grammatisches Verhalten des Attributsnomens | string ∈ {bare_name, art_name, phrase_name, common_noun} |
AnimacyAttr | Belebtheit des Attributs (Attr) | string ∈ {a, c, h, i} |
SemRelSyn | semantische Relation zwischen Kopf und Attribut (bei deverbalem Kopf) | string ∈ {subj, obj, subjobj, none, other} |
SemRelPoss | Possessivitätstyp (nur Datensatz zur Stellungsvariation) | string ∈ {poss, poss_inal, poss_part, poss_rel, poss_abs, a, u, (leer)} |
DateAttr | Zeit- oder Datumsangabe im Attribut | string ∈ {adj_year, adj_cent, adj_dec, adj_mon, adj_min, adj_hour, adj_day, adj_timeofday, adj_week, adj_seas, dem_year, dem_mon, dem_day, dem_week, dem_seas, year, year_span, cent, dec, mon, mon_year, hour, day_mon, day_mon_year, day, timeofday, week, seas, seas_year, none} |
DefinitenessAttr | Definitheit Attribut (Attr) | string ∈ {d, i} |
LengthBetween | Zahl der Wörter zwischen Head und Attr, basierend auf HitCount | x ∈ ℕ |
LengthNPHead | Länge des Kopfs (Wörter, ohne Attribut), automatisch NumberOfWordsLeft/RightHead | x ∈ ℕ |
LengthNPAttr | Länge des Attributs (Wörter), automatisch NumberOfWordsLeft/RightAttr | x ∈ ℕ |
LengthNPAttr-2 | Länge des Kopfs (Wörter, ohne Attribut), manuell überprüft (unvollständig) | x ∈ ℕ |
Embedded | Konstruktion mit zwei verschachtelten Attributen bzw. Argumenten | string ∈ {gen, von, case, none} |
Coord | Koordination des Attributsnomens: Artikellosigkeit | string ∈ {j, oj, kj, n, not_checked} |
Coord2 | Koordination des Attributsnomens: Realisierung | string ∈ {ambig, diff, same, xx, n, not_checked} |
ArtAttr | Attribut hat Artikelwort (alle Artikelwörter, Auswahl nach STTS) | string ∈ {art, noart} |
SemReplacement | Semantische Ersetzbarkeit (Genitiv/von) gegeben oder nicht | string ∈ {y, n, irrelevant} |
GroupSem | Semantische Sondergruppe | string ∈ {expr_class, mens, mens2, orig1, orig2, orig3, orig4, orig5, orig6, emph_head, per_from_org1, per_from_org2, per_from_org3, per_from_org4, phraseologism, (leer)} |
GroupStruc | Strukturelle Sondergruppe | string ∈ {double_gen, uninfl_attr, defect_name, coord_attr, np=name, (leer)} |
AnimacyRel | relative Belebtheit von Attribut und Kopf | string ∈ {head, attr, same} |
AttrAdj | Attributsnomen flektiert adjektivisch | string ∈ {y_alone, y_comb, n} |
TitleAttr | Attribut mit verschiedenen Appositionstypen | string ∈ {y_bare, y_phrase, n, (leer)} |
TypeAttr | Attribut aus einfachen und komplexen Eigennamen | string ∈ {compl_name, simple_name, (leer)} |
CaseNP | Kasus der Gesamt-NP | string ∈ {nom, other, (leer)} |
OriginSem | Herkunftsverhältnis zwischen den beiden Nomen | string ∈ {origin, neutral, (leer)} |
IncludePos | strukturelle Austauschbarkeit von Genitiv- und von-Attribut (für Studie zur Genitivstellung) | string ∈ {y, n, v} |
IncludeGenvon | strukturelle Austauschbarkeit von Genitiv- und von-Attribut (für Studie zur Variation Genitiv/von)-Attribut | string ∈ {y, n, v} |
GenvonPartition | Datensatz GENVON, unterteilt in Development- und Testdatensatz für Statistik | string ∈ {devel, test, (leer)} |
GenvonKat | Datensatz GENVON_KAT | string ∈ {y, n} |
GenvonForm | Datensatz GENVON_FORM | string ∈ {y, n} |
GenvonCatchoice | Datensatz GENVON_CATCHOICE | string ∈ {y, n} |
PrepostPartition | Datensatz PREPOST, unterteilt in Development- und Testdatensatz für Statistik | string ∈ {devel, test, (leer)} |
GenvonEn | Datensatz GENVON_EN | string ∈ {y, n} |
Kodierung
Source_type | ||
Code | Erläuterung | |
newspaper | Beleg aus DeReKo mit dem Merkmal "Publikumspresse" | |
forum | Beleg aus DECOW16B mit den Merkmalen "Forum" und "quasispontansprachlich" | |
Country | ||
Code | Erläuterung | |
de | Quelle wurde in Deutschland publiziert (DeReKo) bzw. gehört zur Toplevel-Domain de mit Serverstandort Deutschland (DECOW16B) | |
at | Quelle wurde in Österreich publiziert | |
ch | Quelle wurde in der Schweiz publiziert | |
Decade | ||
Code | Erläuterung | |
1990 | Quelle wurde zwischen 1990 und 1999 publiziert | |
2000 | Quelle wurde zwischen 2000 und 2009 publiziert | |
2010 | Quelle wurde zwischen 2010 und 2014 publiziert bzw. wurden in dieser Dekade gescrapet (DECOW16B) | |
Type | ||
Code | Erläuterung | |
post | postnominales Genitivattribut | |
pre | pränominales Genitivattribut | |
von | (postnominales) von-Attribut | |
Type2 | ||
Code | Erläuterung | |
gen | (post- oder pränominales) Genitivattribut (d.h. Type=post|pre) | |
von | (postnominales) von-Attribut | |
von | ||
Code | Erläuterung | |
von | von-Attribut mit der Präposition von | |
vom | von-Attribut mit der Präposition-Artikel-Klise vom | |
(leer) | kein von-Attribut (Type2=gen) | |
NameHead | ||
Code | Erläuterung | |
app | Kopfnomen ist Appellativ | |
loc | Kopfnomen ist Ortsname | |
org | Kopfnomen ist Name eines menschlichen Kollektivs (beinhaltet auch Familienverbände wie die Nowaks, die Familie Nowak) | |
per | Kopfnomen ist Personenname | |
misc | Kopfnomen ist Name für anderes (nicht loc, org, per) | |
Anmerkung: | Vgl. Kopf (2021a). | |
ExtendedHead | ||
Code | Erläuterung | |
0 | Gesamt-NP hat nur ein Nomen als internen Kopf | |
not_checked | Gesamt-NP hat wahrscheinlich nur ein Nomen als internen Kopf (aber nicht überprüft) | |
(string) | Gesamt-NP hat einen in sich komplexen internen Kopf (z. B. Klasse 1a und 1b, § 61 GG, Free Jazz, Rotes Kreuz) | |
AppositionNP | ||
Code | Erläuterung | |
y | Es liegt sicher eine Apposition vor. Auch potenziell ambige Strukturen wie Justus Neumanns Theaterzirkus "Alzheimer Symphonie" zählen als Gesamtapposition, vgl. Genitivstellungskapitel (in den Daten betrifft das 14 Belege). | |
n | Es liegt sicher keine Apposition vor. | |
not_checked | Daten wurden nicht auf Appositionsstatus geprüft, weil unwahrscheinlich, dass eine vorliegt. Können für Statistik mit "n" zusammengefasst werden. | |
AnimacyHead | ||
Code | Erläuterung | |
h | Kopfnomen (Token) bezeichnet Mensch (individuierbar) | |
c | Kopfnomen (Token) bezeichnet menschliches Kollektiv | |
a | Kopfnomen (Token) bezeichnet Tier | |
i | Kopfnomen (Token) bezeichnet Unbelebtes | |
Anmerkung: | Vgl. Kopf (2021a). | |
DefinitenessHead | ||
Code | Erläuterung | |
d | Kopfnomen (=Gesamt-NP) hat einen definiten Determinierer (inkl. Eigenname in Determiniererposition), ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr | |
i | Kopfnomen (=Gesamt-NP) hat einen indefiniten oder keinen Determinierer, ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr | |
DeterminerHead | ||
Code | Erläuterung | |
d | Kopfnomen hat Definitartikel (nur GENVON_EN) | |
other | Kopfnomen hat anderes Artikelwort (nur GENVON_EN) | |
name_g | Kopfnomen hat kein Artikelwort, weil es ein primär artikelloser Eigenname ist (nur GENVON_EN) | |
irrelevant | Beleg gehört nicht zu GENVON_EN | |
GenderAttr | ||
Code | Erläuterung | |
fem | Attributsnomen ist Femininum | |
masc | Attributsnomen ist Maskulinum | |
neut | Attributsnomen ist Neutrum | |
ugender | Genus des Attributsnomens nicht erkennbar/nicht eindeutig (z. B. Partizipien im Plural, Pluralia Tanta wie Leute, Kosten etc.) | |
NameAttr | ||
Code | Erläuterung | |
app | Attributsnomen ist Appellativ | |
loc | Attributsnomen ist Ortsname | |
org | Attributsnomen ist Name eines menschlichen Kollektivs (beinhaltet auch Familienverbände wie die Nowaks, die Familie Nowak) | |
per | Attributsnomen ist Personenname | |
misc | Attributsnomen ist Name für anderes (nicht loc, org, per) | |
Anmerkung: | Vgl. Kopf (2021a). | |
ExtendedAttr | ||
Code | Erläuterung | |
0 | Attributs-NP hat nur ein Nomen als internen Kopf | |
not_checked | Attributs-NP hat wahrscheinlich nur ein Nomen als internen Kopf (aber nicht überprüft) | |
(string) | Attributs-NP hat einen in sich komplexen internen Kopf (z. B. Klasse 1a und 1b, § 61 GG, Free Jazz, Rotes Kreuz) | |
ExtendedTypeAttr | ||
Code | Erläuterung | |
nn | Interner Attributskopf ist ein Name, er besteht aus mehreren Namensbestandteilen und der Name ist ohne sie unvollständig (z. B. Carlo De Benedetti, Lange Nacht der Immobilien, Schulhaus Happerswil) | |
tn | Interner Attributskopf ist ein Name, er besteht aus Titel (im weiteren Sinne) und Name, der Name wäre auch ohne den Titel ein Name (z. B. Stadt Malmö, Ägypter Anwar es-Sadat) | |
x | Interner Attributskopf ist kein Name (z. B. Projekt, Juni 2010) oder ist ein Name, aber besteht nur aus einem Wort (z. B. Roßbach, Schweiz) | |
StructureAttr | ||
Code | Erläuterung | |
native | Attribut hat keine Fremdstruktur | |
nonnative | Attribut hat Fremdstruktur | |
not_checked | Attribut wurde nicht auf Struktur geprüft (gehört nicht zum Zufallssample) | |
PersonNameAttr | ||
Code | Erläuterung | |
family | Attribut ist Familienname (z. B. Djindjic) | |
pet | Attribut ist Kosename (z. B. Lambo-Manni) | |
given | Attribut ist Rufname (z. B. Jeanne-Marie) | |
given+family | Attribut ist Ruf- und Familienname (z. B. Lydia Steinbacher) | |
title+family | Attribut ist Titel und Familienname (z. B. Frau Glas) | |
title+given | Attribut ist Titel und Rufname (z. B. Baby Diana) | |
title+given+family | Attribut ist Titel, Ruf- und Familienname (z. B. Schauspielerin Lindsay Lohan) | |
irrelevant | Attribut ist kein Personenname (NameAttr!=per) | |
Anmerkung: | Nicht annotierte Kombinationen (z. B. pet+family) sind nicht im Korpus belegt. | |
SemNameAttr | ||
Code | Erläuterung | |
band | Attribut (Token) wird im Kontext als Bandname gebraucht (z. B. Wham) | |
country | Attribut (Token) wird im Kontext als Ländername gebraucht (z. B. Malta) | |
place | Attribut (Token) wird im Kontext als Ortsname gebraucht (z. B. Rostock) | |
person | Attribut (Token) wird im Kontext als Personenname gebraucht (z. B. Regine Weingart) | |
product | Attribut (Token) wird im Kontext als Produktname (eines individuellen Produkts) gebraucht (z. B. Bravo) | |
sports_club | Attribut (Token) wird im Kontext als Sportvereinsname gebraucht (z. B. Boppard 'Fußballverein aus Boppard') | |
organization | Attribut (Token) wird im Kontext als Name eines menschlichen Kollektivs (Unternehmen oder andere Gruppen, außer Sportvereine) gebraucht (z. B. Planet Hollywood, Familie Mendelssohn) | |
misc | Attribut (Token) wird im Kontext als sonstiger Name gebraucht (z. B. San Marco 'Kirche') | |
irrelevant | Beleg ist nicht NameGrammarAttr=bare_name und/oder nicht DefinitenessHead=d | |
Anmerkung: | Vgl. Kopf (2021a). | |
FinalAttr | ||
Code | Erläuterung | |
s | Attributslemma endet auf [s]; neben <s> auch als <z>, <ß>, <se>, <ce> geschrieben | |
other | Attributslemma endet nicht auf [s] | |
irrelevant | Beleg ist nicht NameGrammarAttr=bare_name | |
InflGenSgAttr | ||
Code | Erläuterung | |
0 | erwartet (für Type2=von): kein Genitivflexiv am Attributsnomen (vorhanden nicht prüfbar, da von-Beleg) | |
0=0 | erwartet und vorhanden (für Type2=gen): kein Genitivflexiv am Attributsnomen | |
0=s | erwartet (für Type2=gen): kein Genitivflexiv am Attributsnomen, vorhanden: s-Flexiv (inkl. -es) | |
s | erwartet (für Type2=von): s-Flexiv am Attributsnomen (vorhanden nicht prüfbar, da von-Beleg) | |
s=s | erwartet und vorhanden (für Type2=gen): s-Flexiv (inkl. -es) am Attributsnomen | |
s=0 | erwartet (für Type2=gen): s-Flexiv (inkl. -es) am Attributsnomen, vorhanden: kein Genitivflexiv | |
s=n | erwartet (für Type2=gen): s-Flexiv (inkl. -es) am Attributsnomen , vorhanden: n-Flexiv (inkl. -en) | |
n | erwartet (für Type2=von): n-Flexiv am Attributsnomen (vorhanden nicht prüfbar, da von-Beleg) | |
n=n | erwartet und vorhanden (für Type2=gen): n-Flexiv (inkl. -en) am Attributsnomen | |
adj | erwartet und vorhanden: adjektivische Flexion des Attributsnomens | |
irrelevant | Beleg ist nicht NameGrammarAttr=common_noun und/oder nicht NumberAttr=sg | |
InflDatPlAttr | ||
Code | Erläuterung | |
0 | erwartet (für Type2=gen) oder vorhanden (für Type2=von): endungsloser Dativ Plural am Attributsnomen | |
n | erwartet (für Type2=gen) oder vorhanden (für Type2=von): Dativ Plural auf -n am Attributsnomen | |
adj | vorhanden: adjektivische Flexion des Attributsnomens | |
irrelevant | Beleg ist nicht NameGrammarAttr=common_noun und/oder nicht NumberAttr=pl | |
InflClassAttr | ||
Code | Erläuterung | |
(pl) | Attributsnomen steht im Plural | |
adj | Attributsnomen steht im Singular und flektiert adjektivisch | |
fem | Attributsnomen steht im Singular und ist Femininum (= Nullflexiv) | |
weak | Attributsnomen steht im Singular und flektiert schwach (=n-Flexiv) | |
strong | Attributsnomen steht im Singular und flektiert stark/gemischt (=s-Flexiv) | |
irrelevant | Beleg ist nicht NameGrammarAttr=common_noun | |
POSInflInitialAttr | ||
Code | Erläuterung | |
ADJ | erstes (potenziell) flektierendes Element der Attributsphrase ist Adjektiv | |
ARTDEF | erstes (potenziell) flektierendes Element der Attributsphrase ist Definitartikel (der, die, das) | |
ARTINDEF | erstes (potenziell) flektierendes Element der Attributsphrase ist Indefinitartikel (ein/e/s) | |
NN | erstes (potenziell) flektierendes Element der Attributsphrase ist Attributsnomen (Jugendlicher, es handelt sich immer um substantivierte Adjektive) | |
PDAT | erstes (potenziell) flektierendes Element der Attributsphrase ist indefiniter Determinierer (z. B. kein) | |
PIAT | erstes (potenziell) flektierendes Element der Attributsphrase ist Demonstrativartikel (z. B. dieser) | |
PPOSAT | erstes (potenziell) flektierendes Element der Attributsphrase ist Possessivartikel (z. B. mein) | |
NUMBER | erstes (potenziell) flektierendes Element der Attributsphrase ist Zahl (zwei oder drei) | |
irrelevant | Beleg ist NameGrammarAttr=bare_name | |
none | es ist kein erstes potenziell flektierendes Element vorhanden | |
LeftBeforeInflAttr | ||
Code | Erläuterung | |
0, 1, 2, 3 | Zahl der Elemente vor dem ersten flektierenden Element der Attributsphrase | |
never | kein (potenziell) erstes flektierendes Element der Attributsphrase (außer dem Attributsnomen) vorhanden | |
irrelevant | Beleg ist NameGrammarAttr=bare_name | |
CaseDistinction | ||
Code | Erläuterung | |
0 | Keine Kasusdisambiguierung in der Attributsphrase | |
1 | Frühe Kasusdisambiguierung in der Attributsphrase | |
2 | Späte Kasusdisambiguierung in der Attributsphrase (Nomen) | |
3 | Späte Kasusdisambiguierung in der Attributsphrase (kombinierend) | |
(leer) | Beleg gehört nicht zum Variationsbereich von Genitiv- und von- Attribut | |
NameGrammarAttr | ||
Code | Erläuterung | |
bare_name | Attribut ist Eigenname ohne Proprialartikel ("grammatischer Eigenname") (Gülay) | |
art_name | Attribut ist Eigenname mit Proprialartikel (das Christkind, die Schweiz) | |
phrase_name | Attribut ist Eigenname in syntaktisch (über Artikel hinaus) erweiterter Phrase (die kleine Gülay, die Deutsche Post) | |
common_noun | Attribut ist Appellativ | |
Anmerkung: | Vgl. Kopf (2021a). | |
AnimacyAttr | ||
Code | Erläuterung | |
h | Kopfnomen (Token) bezeichnet Mensch (individuierbar) | |
c | Kopfnomen (Token) bezeichnet menschliches Kollektiv | |
a | Kopfnomen (Token) bezeichnet Tier | |
i | Kopfnomen (Token) bezeichnet Unbelebtes | |
Anmerkung: | Vgl. Kopf (2021a). | |
SemRelSyn | ||
Code | Erläuterung | |
subj | Subjektsattribut (Attribut ist als Subjekt des Kopfnomens auffassbar) | |
obj | Objektsattribut (Attribut ist als Objekt des Kopfnomens auffassbar) | |
subjobj | Subjekts- oder Objektsattribut (nicht entscheidbar) | |
other | Attribut kann als weitere Ergänzung des (deverbalen) Kopfnomens aufgefasst werden (z. B. Abfahrt vom Carparkplatz) | |
none | kein S-, O- oder K-Verhältnis von Attribut zu Kopf | |
SemRelPoss | ||
Code | Erläuterung | |
poss | Possessivität im engeren Sinne (unbelebtes Objekt, belebter Possessor) | |
poss_inal | inalienable Possession | |
poss_part | possessive Teil-Ganzes-Beziehung | |
poss_rel | Possessum ist inhärent relational | |
poss_abs | Possessum ist Abstraktum | |
{a, u} | kein Possessivverhältnis/nicht entscheidbar | |
(leer) | Beleg gehört nicht zum Datensatz GENPOS | |
Anmerkung: | Vgl. Kopf (2021a). | |
DateAttr | ||
Code | Erläuterung | |
adj_year | Attribut enthält ein Adjektiv und das Nomen Jahr, auch als Kopf von Wortbildungen (z. B. letzten Jahres, neuen Jahres, der vergangenen 30 Jahre, der Jahre 2002 und 2006), Determinierer optional | |
adj_cent | Attribut enthält ein Adjektiv und das Nomen Jahrhundert, auch als Kopf von Wortbildungen (z. B. des sich nun neigenden Jahrhunderts, des vorigen Jahrhunderts), Determinierer optional | |
adj_dec | Attribut enthält ein Adjektiv und das Nomen Jahrzehnt oder eine Bezeichnung für ein Jahrzehnt, auch als Kopf von Wortbildungen (z. B. des letzten Jahrzehntes), Determinierer optional | |
adj_mon | Attribut enthält ein Adjektiv und das Nomen Monat oder eine Monatsbezeichnung, auch als Kopf von Wortbildungen (z. B. vom letzten Juni, der vergangenen Monate), Determinierer optional | |
adj_min | Attribut enthält ein Adjektiv und das Nomen Minute, auch als Kopf von Wortbildungen (z. B. der ersten 45 Minuten, von 2 Minuten), Determinierer optional | |
adj_hour | Attribut enthält ein Adjektiv und das Nomen Stunde, auch als Kopf von Wortbildungen (z. B. der investierten Stunden), Determinierer optional | |
adj_day | Attribut enthält ein Adjektiv und das Nomen Tag, Wochenende oder eine Tagesbezeichnung, auch als Kopf von Wortbildungen (z. B. des darauffolgenden Tages, vom kommenden Wochenende), Determinierer optional | |
adj_timeofday | Attribut enthält ein Adjektiv und das Nomen Morgen, Mittag, Nachmittag, Abend, Nacht, auch als Kopf von Wortbildungen (z. B. vom letzten Dienstagabend), Determinierer optional | |
adj_week | Attribut enthält ein Adjektiv und das Nomen Woche, auch als Kopf von Wortbildungen (z. B. der letzten Wochen), Determinierer optional | |
adj_seas | Attribut enthält ein Adjektiv und eine Jahreszeitbezeichnung, auch als Kopf von Wortbildungen (z. B. des vergangenen Sommers), Determinierer optional | |
dem_year | Attribut enthält (ausschließlich) ein Demonstrativum und das Nomen Jahr, auch als Kopf von Wortbildungen (z. B. dieses Jahres) | |
dem_mon | Attribut enthält (ausschließlich) ein Demonstrativum und das Nomen Monat, auch als Kopf von Wortbildungen oder eine Monatsbezeichnung (z. B. dieses Monats) | |
dem_week | Attribut enthält (ausschließlich) ein Demonstrativum und das Nomen Woche, auch als Kopf von Wortbildungen (z. B. dieser Woche) | |
dem_day | Attribut enthält (ausschließlich) ein Demonstrativum und das Nomen Tag, auch als Kopf von Wortbildungen (z. B. dieser Tage) | |
dem_seas | Attribut enthält (ausschließlich) ein Demonstrativum und eine Jahreszeitbezeichnung, auch als Kopf von Wortbildungen (z. B. dieses Sommers) | |
year | Attribut enthält das Nomen Jahr, auch als Kopf von Wortbildungen (z. B. des Jahres, vom Vorjahr), Determinierer optional | |
year_span | Attribut enthält das Nomen Jahr, auch als Kopf von Wortbildungen, und eine Zeitspanne (z. B. der Jahre 2002 bis 2009), Determinierer optional | |
cent | Attribut enthält das Nomen Jahrhundert, auch als Kopf von Wortbildungen (z. B. des Jahrhunderts), Determinierer optional | |
dec | Attribut enthält das Nomen Jahrzehnt oder eine Bezeichnung für ein Jahrzehnt, auch als Kopf von Wortbildungen (z. B. der 1940er-Jahre, der zwanziger Jahre), Determinierer optional | |
mon | Attribut enthält das Nomen Monat oder eine Monatsbezeichnung, auch als Kopf von Wortbildungen(z. B. des Monats, vom September, der Monate Juni und Juli), Determinierer optional | |
mon_year | Attribut enthält eine Monatsbezeichnung mit Jahreszahl (z. B. vom November 1996), Determinierer optional | |
hour | Attribut enthält das Nomen Stunde , auch als Kopf von Wortbildungen (z. B. der Stunde), Determinierer optional | |
day_mon | Attribut enthält ein Datum aus Tag und Monat (z. B. vom 10. November), Determinierer optional | |
day_mon_year | Attribut enthält ein Datum aus Tag, Monat und Jahr (z. B. vom 16. Mai 2006, des 17. Jänner dieses Jahres), Determinierer optional | |
day | Attribut enthält das Nomen Tag, Wochenende oder eine Tagesbezeichnung, auch als Kopf von Wortbildungen (z. B. vom Wochenende, des Vortages), Determinierer optional | |
timeofday | Attribut enthält das Nomen Morgen, Mittag, Nachmittag, Abend, Nacht (z. B. des Abends, vom Morgen und Nachmittag), Determinierer optional | |
week | Attribut enthält das Nomen Woche, auch als Kopf von Wortbildungen (z. B. der Woche), Determinierer optional | |
seas | Attribut enthält eine Jahreszeitbezeichnung, auch als Kopf von Wortbildungen (z. B. des vergangenen Sommers), Determinierer optional | |
seas_year | Attribut enthält eine Jahreszeitbezeichnung und das Nomen Jahr oder eine Jahreszahl, auch als Kopf von Wortbildungen (z. B. vom Sommer 2013, vom Sommer v. J.), Determinierer optional | |
none | Attribut enthält keine Zeit- oder Datumsangabe mit den oben gegebenen Strukturen | |
Anmerkung: | Nicht annotierte Kombinationen (z. B. day_span existieren in den Daten nicht, wurden aber geprüft). | |
DefinitenessAttr | ||
Code | Erläuterung | |
d | Attributsnomen (=Attributs-NP) ist definit (= hat einen definiten Determinierer inkl. Eigenname in Determiniererposition), ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr | |
i | Attributsnomen (=Attributs-NP) ist indefinit (= hat einen indefiniten oder keinen Determinierer), ermittelt mit POSLeftHead und LeftHead bzw. POSLeftAttr und LeftAttr | |
Embedded | ||
Code | Erläuterung | |
gen | Gesamt-NP ist ein Genitivattribut oder hat ein Genitivattribut (z. B. mit Ende [des ersten Quartals (Head) des heurigen Jahres (Attr)], [Regisseur (Head) des Jahres (Attr)] der Zeitschrift Opernwelt, Häufigkeit entspricht der [eines Zweitkarzinoms (Head) der Lunge (Attr)]) oder Gesamt-NP steht im Genitiv und wird von einer Präposition oder einem Verb gefordert oder Attribut hat ein Genitivattribut (z. B. als wäre er sich[des Ernsts der Lage] bewusst, wegen [des Verdachts einer Drogenfahrt]) | |
von | Gesamt-NP ist ein von-Attribut oder hat ein von-Attribut (z. B. die Weitergabe von [Namen und Adressen ihrer Kunden], [Am Tag der Sonne] von Swisssolar) oder Gesamt-NP ist Teil einer von-PP, die von einer Präposition oder einem Verb gefordert wird oder Attribut hat ein von-Attribut (z. B. Der Vater (Head) [des verstorbenen Prinzen (Attr) von 2010]) | |
case | Potenziell "gen", aber die Phrase wird von einer Präposition gefordet, deren Kasusforderung schwanken kann und hat selbst keine eindeutige Genitivmarkierung (trotz der Auflösung erheblicher Rücklagen) | |
none | Struktur ist nicht "gen", "von" oder "case" | |
Coord | ||
Code | Erläuterung | |
j | Attributsnomen ist koordiniert | |
oj | Attributsnomen ist koordiniert, Konjunkt ist originär artikellos (möglich) (z. B. Der Rolle der [Städte und Gemeinden], die Rolle von [Schaufler und Diehl]) | |
kj | Attributsnomen ist koordiniert, Konjunkt ist nicht originär artikellos (möglich) (z. B. Kunstbegriff des Mittelalters und der Renaissance) | |
n | Attributsnomen ist nicht koordiniert (geprüft) | |
not_checked | Attributsnomen ist wahrscheinlich nicht koordiniert (nicht geprüft) | |
Coord2 | ||
Code | Erläuterung | |
ambig | Attributsnomen ist koordiniert, es ist nicht erkennbar, ob das zweite Konjunkt zur von-Präposition gehört oder im Genitiv steht (die Mischung von Pitch und dazugehöriger Stellung der Rotorblätter) | |
diff | Attributsnomen ist koordiniert, ein Konjunkt ist ein Genitivattribut, das andere ein von-Attribut (eine Folge von Minderausgaben und höherer Steuereinnahmen) | |
same | Attributsnomen ist koordiniert, beide Konjunkte haben dieselbe Form (der Unterhalt des Leitungsnetzes und der Anlagen, an der Schnittstelle von Gottes- und Nächstenliebe) | |
xx | Attributsnomen ist koordiniert, zweites Konjunkt ist eine NP, die nicht im Genitiv steht (in den bereich der unsichtbaren Grenze, und anderen Zwistigkeiten) | |
n | Attributsnomen ist nicht koordiniert (geprüft) | |
not_checked | Attributsnomen ist wahrscheinlich nicht koordiniert (nicht geprüft) | |
ArtAttr | ||
Code | Erläuterung | |
art | Attributs-NP weist Determinier, d. h. Artikel (ART), attributives Possessivpronomen (PPOSAT), attributives Demonstrativpronomen (PDAT) oder attributives Indefinitpronomen (PIAT) auf | |
noart | Attributs-NP weist keinen Determinierer auf (die Arbeit [hartnäckiger Frauen]) bzw. der Determinierer ist ein adnominaler Genitiv (die nachträgliche Wirkung von [Walujews angeblich entscheidendem Schlag]) | |
SemReplacement | ||
Code | Erläuterung | |
y | Attribut ist semantisch gegen Genitivattribut bzw. von-Attribut austauschbar | |
n | Attribut ist semantisch nicht austauschbar | |
irrelevant | Attribut ist strukturell nicht austauschbar | |
GroupSem | ||
Code | Erläuterung | |
expr_class | Gesamtphrase dient der expressiven Klassifikation (dieser arrogante typ von nalbandian) | |
mens | Attribut ist Maßattribut | |
mens2 | Attribut entspricht Maßattribut, hat aber kein Zahlwort, sondern ein anderes, flektierendes (z. B. wenige) | |
orig1 | Attribut verortet das Kopfnomen temporal, ohne enge Zugehörigkeit auszudrücken (Pressemitteilung vom 4. Januar 2008) | |
orig2 | Attribut verortet das Kopfnomen spatial, ohne enge Zugehörigkeit auszudrücken (die Pleite von Amsterdam) | |
orig3 | Attribut hat durch die Präposition markierte privative/ablativische Semantik, vom Kopfnomen gestützt (Abschied von, Weg von) | |
orig4 | Attribut hat durch die Präposition markierte privative/ablativische Semantik, nicht vom Kopfnomen gestützt (Bilder vom Mond) | |
orig5 | wie orig4, aber mit generischer Lesart des Attributs (Tipps vom Fachmann) | |
orig6 | Attribut beschreibt eine Strecke, Spanne (Platten von Tortoise bis Rush) | |
emph_head | Kopfnomen spielt im genannten Zeitausschnitt eine herausragende Rolle | |
per_from_org1 | Attribut ist Kollektiv, Kopfnomen ist Personenname (ersetzbar=nein, wenn Kollektiv nicht artikellos) | |
per_from_org2 | Attribut ist Kollektiv, Kopfnomen ist Personenname mit funktionsbezeichnendem Titel (ersetzbar=nein, wenn Kollektiv nicht artikellos) | |
per_from_org3 | Attribut ist Kollektiv, Kopfnomen ist Personenbezeichnung (appellativisch) (ersetzbar=nein, wenn Kollektiv nicht artikellos) | |
per_from_org4 | Attribut ist Kollektiv, Kopfnomen ist Personenname mit nicht-funktionsbezeichnendem Titel (ersetzbar=nein, wenn Kollektiv nicht artikellos) | |
phraseologism | Gesamtphrase oder Phrasenteil ist Phraseologismus (Qual der Wahl, Triathlon-Konkurrenz vom Feinsten) | |
(leer) | Keine semantischen Besonderheiten | |
Anmerkung: | Für Details vgl. Kopf (2021b). | |
GroupStruc | ||
Code | Erläuterung | |
double_gen | Attribut hat pränominalen Genitv (die eigentliche Rache von Adornos Diktum) | |
uninfl_attr | Attribut hat unflektierte abhängige Elemente, darunter eines auf -er (den Anordnungen von Schweizer Zivilrichtern, in Analysen Schweizer Großbanken) | |
defect_name | Attribut ist artikelloser Name (Bandname, Musiktitel, Filmtitel), der sich nicht genitivisch ausdrücken lässt | |
coord_attr | Attribut besteht aus zwei artikellosen Konjunkten, Artikellosigkeit nur durch Koordination möglich | |
np=name | Gesamtphrase ist ein Eigenname | |
(leer) | Keine strukturellen Besonderheiten | |
Anmerkung: | Für Details vgl. Kopf (2021b, 2021c). | |
AnimacyRel | ||
Code | Erläuterung | |
head | Kopfnomen ist belebter als Attributsnomen (jeweils tokenbasiert) | |
attr | Attributsnomen ist belebter als Kopfnomen (jeweils tokenbasiert) | |
same | Beide Nomen sind gleich belebt | |
AttrAdj | ||
Code | Erläuterung | |
y_alone | Attributsnomen flektiert adjektivisch und es ist kein weiteres flektierendes Element in der Attributsphrase vorhanden (Betreuung Jugendlicher, Betreuung von Jugendlichen) | |
y_comb | Attributsnomen flektiert adjektivisch und es ist ein weiteres flektierendes Element in der Attributsphrase vorhanden (Betreuung der Jugendlichen) | |
n | Attributsnomen flektiert nicht adjektivisch | |
TitleAttr | ||
Code | Erläuterung | |
y_phrase | Attribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) in einer Apposition mit einem Titel, es ist ein weiteres flektierendes Element in der Attributsphrase vorhanden (im Hause der Bauernfamilie Nägeli) | |
y_bare | Attribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) in einer Apposition mit einem Titel, es ist kein weiteres flektierendes Element in der Attributsphrase vorhanden (Enzympeeling von Frau Glas) | |
n | Attribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name), aber nicht in einer Apposition mit einem Titel | |
(leer) | Attribut ist kein prototypischer Eigenname | |
TypeAttr | ||
Code | Erläuterung | |
compl_name | Attribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) aus (mind.) zwei Bestandteilen (Hinrichtung des Russen-Paten Sergej Hodschahmedov) | |
simple | Attribut ist ein prototypischer Eigenname (NameGrammarAttr=bare_name) aus einem Bestandteil | |
(leer) | Attribut ist kein prototypischer Eigenname | |
CaseNP | ||
Code | Erläuterung | |
nom | Gesamt-NP steht im Nominativ | |
other | Gesamt-NP steht nicht im Nominativ | |
(leer) | Beleg gehört nicht zu GENPOS | |
OriginSem | ||
Code | Erläuterung | |
origin | Zwischen Kopfnomen und Attribut lässt sich, neben der allgemeineren Relation, ein Herkunftsverhältnis annehmen | |
neutral | Zwischen Kopfnomen und Attribut lässt sich kein Herkunftsverhältnis annehmen | |
(leer) | Nicht Teil des annotierten Samples (d. h. GenvonPartition(dataprep)!=test) | |
IncludePos | ||
Code | Erläuterung | |
y | Strukturell austauschbar (Genitivattribut und von-Attribut) | |
v | Strukturell nur von-Attribut möglich | |
n | Irrelevant für den Datensatz GENPOS und GENVON-EN | |
Anmerkung: | Basis für Kopf (2021a), teilweise später erfolgte, minimale Korrekturen bei der Verteilung der drei Ausprägungen sind nicht enthalten. Für neuere Untersuchungen liegt die Spalte "IncludeGenvon" zugrunde. | |
IncludeGenvon | ||
Anmerkung: | S. "IncludePos", aber seither leicht aktualisiert, daher teilweise Unterschiede. | |
GenvonPartition | ||
Code | Erläuterung | |
devel | Beleg gehört zum Datensatz GENVON (s. Kopf 2021b) und wurde zur Modellentwicklung verwendet | |
test | Beleg gehört zum Datensatz GENVON (s. Kopf 2021b) und wurde für das endgültige Modell verwendet | |
(leer) | Beleg gehört nicht zum Datensatz GENVON | |
GenvonKat | ||
Code | Erläuterung | |
y | Beleg gehört zum Datensatz GENVON_KAT (s. Kopf 2021b) | |
n | Beleg gehört nicht zum Datensatz GENVON_KAT | |
GenvonForm | ||
Code | Erläuterung | |
y | Beleg gehört zum Datensatz GENVON_FORM (s. Kopf 2021b) | |
n | Beleg gehört nicht zum Datensatz GENVON_FORM | |
GenvonCatchoice | ||
Code | Erläuterung | |
y | Beleg gehört zum Datensatz GENVON_CATCHOICE | |
n | Beleg gehört nicht zum Datensatz GENVON_CATCHOICE | |
PrepostPartition | ||
Code | Erläuterung | |
devel | Beleg gehört zum Datensatz PREPOST (s. Kopf 2021a) und wurde zur Modellentwicklung verwendet | |
test | Beleg gehört zum Datensatz PREPOST (s. Kopf 2021a) und wurde für das endgültige Modell verwendet | |
(leer) | Beleg gehört nicht zum Datensatz PREPOST | |
GenvonEn | ||
Code | Erläuterung | |
y | Beleg gehört zum Datensatz GENVON_EN | |
n | Beleg gehört nicht zum Datensatz GENVON_EN |
Literatur
- Bubenhofer, Noah, Marek Konopka & Roman Schneider. 2014. Präliminarien einer Korpusgrammatik. Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache, Bd. 4. Tübingen: Narr. Unter Mitwirkung von Caren Brinckmann, Katrin Hein und Bruno Strecker.
- Kopf, Kristin. 2021a. Stellung des adnominalen Genitivs. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24420.
- Kopf, Kristin. 2021b. Genitiv- und von-Attribute: Bestimmung des Variationsbereichs. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24421.
- Kopf, Kristin. 2021c. Sonderfälle des Genitivattributs. DOI: https://doi.org/10.14618/sondergenitiv.
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).
- Kupietz, Marc, Harald Lüngen, Paweł Kamocki & Andreas Witt. 2018. The German reference corpus DeReKo: New developments – new opportunities. In Nicoletta Calzolari, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Koiti Hasida, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis & Takenobu Tokunaga (Hgg.),Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018) , 4353–4360. Miyazaki: European Language Resources Association (ELRA).
- Schäfer, Roland & Felix Bildhauer. 2012. Building Large Corpora from the Web Using a New Efficient Tool Chain. In Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Mehmet Uğur Doğan, Bente Maegaard, Joseph Mariani, Asuncion Moreno, Jan Odijk, Stelios Piperidis (Hgg.), Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 12), 486–493. Istanbul: European Language Resources Association (ELRA).