Verschachtelte Genitivattribute (Datensatz)
Version (Datensatz) 1.0 vom 05.07.2021
Version (Dokumentation) 1.3 vom 17.02.2025
Verfasser: Kristin Kopf
Kontakt: Kristin Kopf
Verfügbarkeit
MD5 (schachtelgenitive.csv) = c191b9835911e21fe8929af17aa3cebc
Beschreibung
Der Datensatz enthält 409 Korpusbelege aus Nominalphrasen mit eingebetteten Genitivattributen, die wiederum ein eingebettetes Genitivattribut aufweisen ( Petras Nachfolgers Beisein ). Er dient der Untersuchung der Sonderfälle des Genitivattributs (Kopf 2021) . Die Belege sind danach klassifiziert, ob die erste eingebettete Nominalphrase vor oder hinter dem Kopfnomen der Gesamtnominalphrase steht ( Petras Nachfolgers Beisein vs. Beisein Petras Nachfolgers ) und ob die erste eingebettete Nominalphrase neben einem Genitiv noch ein Adjektiv enthält ( Beisein Petras direkten Nachfolgers ). Für jeden Beleg werden zudem die Lemmas der drei Nomen in ihrer Einbettungsreihenfolge angegeben. Darüber hinaus sind Metadaten (Land, Jahr) enthalten.
Quelle
Die Daten wurden aus dem Korpusgrammatik-Untersuchungskorpus erhoben (vgl. Bubenhofer et al. 2014 ), basierend auf dem Deutschen Referenzkorpus DeReKo ( Kupietz et al. 2010 ), Release 2017-II, und sind manuell annotiert.
Zitieren
Kopf, Kristin. 2021. Datensatz verschachtelte Genitivattribute. Mannheim: Leibniz-Institut für Deutsche Sprache. doi: 10.14618/schachtelgenitivDB
Nutzung
Daten aus dem Deutschen Referenzkorpus DeReKo unterliegen der Nutzungsvereinbarung des Deutschen Referenzkorpus DeReKo (Fassung vom 24.05.2018). Ausgeschlossen ist insbesondere die kommerzielle Nutzung. Darüber hinaus dürfen diese Daten nicht ohne schriftliche Zustimmung des Leibniz-Instituts für Deutsche Sprache an Dritte weitergegeben oder veröffentlicht werden. Davon ausgenommen sind Zitate und Auszüge.
Mit dem Herunterladen des Datensatzes stimmt der Nutzer/die Nutzerin diesen Vereinbarungen zu.
Details
Der Datensatz enthält die Gesamtheit der relevanten Belege aus dem KoGra-Untersuchungskorpus mit den im Folgenden aufgeführten Strukturen. Die Abfragen für die vier Strukturtypen führten zu 15.875 potenziellen Belegen, von denen sich bei manueller Durchsicht 409 als tatsächliche Nominalphrasen mit zweifach eingebetteten Genitivattributen erwiesen.
Abfrage Typ (i) (pränominal, unerweitert)
Eigenname (NE) | Nomen (NN) | Nomen (NN) |
Tokenauslaut -s | Tokenauslaut -s | |
Lemmaauslaut nicht -s | Lemmaauslaut nicht -s | |
Petras | Nachfolgers | Beisein |
Abfrage Typ (ii) (pränominal, erweitert)
Eigenname (NE) | Adjektiv (ADJA) | Nomen (NN) | Nomen (NN) |
Tokenauslaut -s | Tokenauslaut -n | Tokenauslaut -s | |
Lemmaauslaut nicht -s | Lemmaauslaut nicht -s | ||
Petras | direkten | Nachfolgers | Beisein |
Abfrage Typ (iii) (postnominal, unerweitert)
Nomen (NN) | Eigenname (NE) | Nomen (NN) |
Tokenauslaut -s | Tokenauslaut -s | |
Lemmaauslaut nicht -s | Lemmaauslaut nicht -s | |
Beisein | Petras | Nachfolgers |
Abfrage Typ (iv) (postnominal, erweitert)
Nur für Typ (iv) wurde auch nach Belegen gesucht, bei denen das übergeordnete Attribut nicht auf -s endet ( Beisein Petras direkter Nachfolgerin ).
Nomen (NN) | Eigenname (NE) | Adjektiv (ADJA) | Nomen (NN) |
Tokenauslaut -s | Tokenauslaut -n | Tokenauslaut -s | |
Lemmaauslaut nicht -s | Lemmaauslaut nicht -s | ||
Beisein | Petras | direkten | Nachfolgers |
Nomen (NN) | Eigenname (NE) | Adjektiv (ADJA) | Nomen (NN) |
Tokenauslaut -s | Tokenauslaut -r | ||
Lemmaauslaut nicht -s | |||
Beisein | Petras | direkter | Nachfolgerin |
Spalten
Name | Erläuterung | Wert(e) |
Nr | laufende Nummer (alphabetisch nach N1) | number |
Kontext.links | linker Satzkontext (8 Wörter) | string |
Beleg | Genitivkonstruktion | string |
Kontext.rechts | rechter Satzkontext (8 Wörter) | string |
N1 | Lemma des Gesamtkopfnomens (Matrixnomen von N2) | string |
N2 | Lemma des ersten eingebetteten Genitivs (Matrixnomen von N3) | string |
N3 | Lemma des zweiten eingebetteten Genitivs | string |
Position | Position von N2 relativ zu N2 | {post,prä} |
Erweiterung | weiterer Modifikator außer N3 in der Genitiv-NP | {erweitert,unerweitert} |
Sigle | DeReKo-Sigle | string |
Land | Land, in dem die Quelle erschienen ist | {AT,CH,DE,LU} |
Jahr | Jahr, in dem die Quelle erschienen ist | number |
Dubletten | Siglen von Belegdubletten | {nein,ja} |
Ausschluss | Grund für Ausschluss aus Datenbasis | {nein,ja} |
Kodierung
Position
Code | Erläuterung |
post | übergeordnete Genitiv-NP folgt N1 (z. B. Ansturm [ Hessens bester Juniorinnen ]) |
prä | übergeordnete Genitiv-NP geht N1 voraus (z. B. [ Eichels Sprechers ] Klugheit ) |
Erweiterung
Code | Erläuterung |
erweitert | übergeordnete Genitiv-NP enthält nach dem eingebettetem Genitiv (N3) ein Adjektiv (z. B. Besichtigung Norwegens ältester Stabkirche ) |
unerweitert | übergeordnete Genitiv-NP enthält nach dem eingebetteten Genitiv (N3) kein weiteres pränominales Element (z. B. Qualität Österreichs Restaurants ) |
Dubletten
Code | Erläuterung |
nein | Kombination aus Kontext.links, Beleg und Kontext.rechts treten im KoGra-Untersuchungskorpus nur einmal auf |
string | Kombination aus Kontext.links, Beleg und Kontext.rechts tritt im KoGra-Untersuchungskorpus mehrfach auf, im Datensatz beibehalten wurde der frühste Beleg, die Siglen der Dubletten sind in diesem Feld angegeben (Separator Semikolon) |
Ausschluss
Code | Erläuterung |
nein | Beleg gehört zum Datensatz aus Kopf (2021) |
ja, … | Beleg gehört nicht zum Datensatz aus Kopf (2021), Grund nach dem Komma angegeben |
Literatur
- Bubenhofer, Noah, Marek Konopka & Roman Schneider. 2014. Präliminarien einer Korpusgrammatik . Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache 4. Tübingen: Narr. Unter Mitwirkung von Caren Brinckmann.
- Institut für Deutsche Sprache. 2017. Deutsches Referenzkorpus / Archiv der Korpora geschriebener Gegenwartssprache 2017-II (Release vom 01.10.2017). Mannheim: Institut für Deutsche Sprache.
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German Reference Corpus DeReKo: A primordial sample for linguistic research . In Nicoletta Calzolari et al. (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010) . Valletta: European Language Resources Association (ELRA), 1848–1854. [abgerufen am 20.01.2025)]
- Kopf, Kristin. 2021. Sonderfälle des Genitivattributs. Mannheim: Institut für Deutsche Sprache. doi: 10.14618/sondergenitiv