Verschachtelte Genitivattribute (Datensatz)
Version vom 5.7.2021
Zum Downloadbereich
Quelle
Der Datensatz umfasst 409 Belege. Die Daten wurden aus dem Korpusgrammatik-Untersuchungskorpus (KoGra-UK) erhoben, vgl. Bubenhofer et al. 2014), basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010), Release 2017-II, und sind manuell annotiert.
Der Datensatz dient der Untersuchung der Sonderfälle des Genitivattributs (Kopf 2021).
Spalten
Name | Erläuterung | Wert(e) |
Nr | laufende Nummer (alphabetisch nach N1) | number |
Kontext.links | linker Satzkontext (8 Wörter) | string |
Beleg | Genitivkonstruktion | string |
Kontext.rechts | rechter Satzkontext (8 Wörter) | string |
N1 | Lemma des Gesamtkopfnomens (Matrixnomen von N2) | string |
N2 | Lemma des ersten eingebetteten Genitivs (Matrixnomen von N3) | string |
N3 | Lemma des zweiten eingebetteten Genitivs | string |
Position | Position von N2 relativ zu N2 | {post,prä} |
Erweiterung | weiterer Modifikator außer N3 in der Genitiv-NP | {erweitert,unerweitert} |
Sigle | DeReKo-Sigle | string |
Land | Land, in dem die Quelle erschienen ist | {AT,CH,DE,LU} |
Jahr | Jahr, in dem die Quelle erschienen ist | number |
Dubletten | Siglen von Belegdubletten | {nein,ja} |
Ausschluss | Grund für Ausschluss aus Datenbasis | {nein,ja} |
Kodierungen
Position
Code | Erläuterung |
post | übergeordnete Genitiv-NP folgt N1 (z. B. Ansturm [Hessens bester Juniorinnen]) |
prä | übergeordnete Genitiv-NP geht N1 voraus (z. B. [Eichels Sprechers] Klugheit) |
Erweiterung
Code | Erläuterung |
erweitert | übergeordnete Genitiv-NP enthält nach dem eingebettetem Genitiv (N3) ein Adjektiv (z. B. Besichtigung Norwegens ältester Stabkirche) |
unerweitert | übergeordnete Genitiv-NP enthält nach dem eingebetteten Genitiv (N3) kein weiteres pränominales Element (z. B. Qualität Österreichs Restaurants) |
Dubletten
Code | Erläuterung |
nein | Kombination aus Kontext.links, Beleg und Kontext.rechts treten im KoGra-Untersuchungskorpus nur einmal auf |
string | Kombination aus Kontext.links, Beleg und Kontext.rechts tritt im KoGra-Untersuchungskorpus mehrfach auf, im Datensatz beibehalten wurde der frühste Beleg, die Siglen der Dubletten sind in diesem Feld angegeben (Separator Semikolon) |
Ausschluss
Code | Erläuterung |
nein | Beleg gehört zum Datensatz aus Kopf (2021) |
ja, ... | Beleg gehört nicht zum Datensatz aus Kopf (2021), Grund nach dem Komma angegeben |
Literatur
- Bubenhofer, Noah, Marek Konopka, Roman Schneider. 2014. Präliminarien einer Korpusgrammatik. Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache, Bd. 4. Tübingen: Narr. Unter Mitwirkung von Caren Brinckmann, Katrin Hein und Bruno Strecker.
- Kopf, Kristin. 2021. Sonderfälle des Genitivattributs. DOI: 10.14618/sondergenitiv.
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).