Verschachtelte Genitivattribute (Datensatz)

Version (Datensatz) 1.0 vom 05.07.2021

Version (Dokumentation) 1.3 vom 17.02.2025

Verfasser: Kristin Kopf

Kontakt: Kristin Kopf

Verfügbarkeit

Download


  MD5 (schachtelgenitive.csv) =  c191b9835911e21fe8929af17aa3cebc
 

Beschreibung

Der Datensatz enthält 409 Korpusbelege aus Nominalphrasen mit eingebetteten Genitivattributen, die wiederum ein eingebettetes Genitivattribut aufweisen ( Petras Nachfolgers Beisein ). Er dient der Untersuchung der Sonderfälle des Genitivattributs (Kopf 2021) . Die Belege sind danach klassifiziert, ob die erste eingebettete Nominalphrase vor oder hinter dem Kopfnomen der Gesamtnominalphrase steht ( Petras Nachfolgers Beisein vs. Beisein Petras Nachfolgers ) und ob die erste eingebettete Nominalphrase neben einem Genitiv noch ein Adjektiv enthält ( Beisein Petras direkten Nachfolgers ). Für jeden Beleg werden zudem die Lemmas der drei Nomen in ihrer Einbettungsreihenfolge angegeben. Darüber hinaus sind Metadaten (Land, Jahr) enthalten.

Quelle

Die Daten wurden aus dem Korpusgrammatik-Untersuchungskorpus erhoben (vgl. Bubenhofer et al. 2014 ), basierend auf dem Deutschen Referenzkorpus DeReKo ( Kupietz et al. 2010 ), Release 2017-II, und sind manuell annotiert.

Zitieren

Kopf, Kristin. 2021. Datensatz verschachtelte Genitivattribute. Mannheim: Leibniz-Institut für Deutsche Sprache. doi: 10.14618/schachtelgenitivDB

Nutzung

Daten aus dem Deutschen Referenzkorpus DeReKo unterliegen der Nutzungsvereinbarung des Deutschen Referenzkorpus DeReKo (Fassung vom 24.05.2018). Ausgeschlossen ist insbesondere die kommerzielle Nutzung. Darüber hinaus dürfen diese Daten nicht ohne schriftliche Zustimmung des Leibniz-Instituts für Deutsche Sprache an Dritte weitergegeben oder veröffentlicht werden. Davon ausgenommen sind Zitate und Auszüge.

Mit dem Herunterladen des Datensatzes stimmt der Nutzer/die Nutzerin diesen Vereinbarungen zu.

Details

Der Datensatz enthält die Gesamtheit der relevanten Belege aus dem KoGra-Untersuchungskorpus mit den im Folgenden aufgeführten Strukturen. Die Abfragen für die vier Strukturtypen führten zu 15.875 potenziellen Belegen, von denen sich bei manueller Durchsicht 409 als tatsächliche Nominalphrasen mit zweifach eingebetteten Genitivattributen erwiesen.

Abfrage Typ (i) (pränominal, unerweitert)

Eigenname (NE) Nomen (NN) Nomen (NN)
Tokenauslaut -s Tokenauslaut -s
Lemmaauslaut nicht -s Lemmaauslaut nicht -s
Petras Nachfolgers Beisein

Abfrage Typ (ii) (pränominal, erweitert)

Eigenname (NE) Adjektiv (ADJA) Nomen (NN) Nomen (NN)
Tokenauslaut -s Tokenauslaut -n Tokenauslaut -s
Lemmaauslaut nicht -s Lemmaauslaut nicht -s
Petras direkten Nachfolgers Beisein

Abfrage Typ (iii) (postnominal, unerweitert)

Nomen (NN) Eigenname (NE) Nomen (NN)
Tokenauslaut -s Tokenauslaut -s
Lemmaauslaut nicht -s Lemmaauslaut nicht -s
Beisein Petras Nachfolgers

Abfrage Typ (iv) (postnominal, erweitert)

Nur für Typ (iv) wurde auch nach Belegen gesucht, bei denen das übergeordnete Attribut nicht auf -s endet ( Beisein Petras direkter Nachfolgerin ).

Nomen (NN) Eigenname (NE) Adjektiv (ADJA) Nomen (NN)
Tokenauslaut -s Tokenauslaut -n Tokenauslaut -s
Lemmaauslaut nicht -s Lemmaauslaut nicht -s
Beisein Petras direkten Nachfolgers
Nomen (NN) Eigenname (NE) Adjektiv (ADJA) Nomen (NN)
Tokenauslaut -s Tokenauslaut -r
Lemmaauslaut nicht -s
Beisein Petras direkter Nachfolgerin

Spalten

Name Erläuterung Wert(e)
Nr laufende Nummer (alphabetisch nach N1) number
Kontext.links linker Satzkontext (8 Wörter) string
Beleg Genitivkonstruktion string
Kontext.rechts rechter Satzkontext (8 Wörter) string
N1 Lemma des Gesamtkopfnomens (Matrixnomen von N2) string
N2 Lemma des ersten eingebetteten Genitivs (Matrixnomen von N3) string
N3 Lemma des zweiten eingebetteten Genitivs string
Position Position von N2 relativ zu N2 {post,prä}
Erweiterung weiterer Modifikator außer N3 in der Genitiv-NP {erweitert,unerweitert}
Sigle DeReKo-Sigle string
Land Land, in dem die Quelle erschienen ist {AT,CH,DE,LU}
Jahr Jahr, in dem die Quelle erschienen ist number
Dubletten Siglen von Belegdubletten {nein,ja}
Ausschluss Grund für Ausschluss aus Datenbasis {nein,ja}

Kodierung

Position

Code Erläuterung
post übergeordnete Genitiv-NP folgt N1 (z. B. Ansturm [ Hessens bester Juniorinnen ])
prä übergeordnete Genitiv-NP geht N1 voraus (z. B. [ Eichels Sprechers ] Klugheit )

Erweiterung

Code Erläuterung
erweitert übergeordnete Genitiv-NP enthält nach dem eingebettetem Genitiv (N3) ein Adjektiv (z. B. Besichtigung Norwegens ältester Stabkirche )
unerweitert übergeordnete Genitiv-NP enthält nach dem eingebetteten Genitiv (N3) kein weiteres pränominales Element (z. B. Qualität Österreichs Restaurants )

Dubletten

Code Erläuterung
nein Kombination aus Kontext.links, Beleg und Kontext.rechts treten im KoGra-Untersuchungskorpus nur einmal auf
string Kombination aus Kontext.links, Beleg und Kontext.rechts tritt im KoGra-Untersuchungskorpus mehrfach auf, im Datensatz beibehalten wurde der frühste Beleg, die Siglen der Dubletten sind in diesem Feld angegeben (Separator Semikolon)

Ausschluss

Code Erläuterung
nein Beleg gehört zum Datensatz aus Kopf (2021)
ja, … Beleg gehört nicht zum Datensatz aus Kopf (2021), Grund nach dem Komma angegeben

Literatur

Zum Text

Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen