Nominalphrasen (Datensatz)
Version vom 26.5.2021
Download
Beschreibung
Der Datensatz dient der Untersuchung der syntaktischen Funktionen von NPs (Weber 2021a) und der Determination in der NP (Weber 2021b). Er enthält Belege zu nichtpronominalen (d.h. vollen, lexikalischen) Nominalphrasen (NPs) mit einem Substantiv oder einer Nominalisierung als Kopf. Jeder Beleg ist in Bezug auf eine Reihe linguistisch relevanter Merkmale annotiert. Insgesamt enthält der Datensatz 8.137 Belegstellen. Nach dem Aussortieren von Fehlbelegen (siehe Spalten „valide“ und „nicht-valide_Begründung“) bleiben noch 7.813 einschlägige Belege. Die Suchanfrage erfolgte über das Kopfnomen; für Details zur Datenerhebung siehe Weber (2021a). Das Kopfnomen erscheint in der Spalte „Kopf_der_NP“. In manchen Fällen besteht die NP nur aus dem Kopfnomen, in den meisten Fällen geht sie aber darüber hinaus; sie erstreckt sich dann auf einen Teil des vorangehenden Kontexts (Spalte „Satzkontext_vor_Beleg“) und/oder des nachfolgenden Kontexts („Satzkontext_nach_Beleg“). Beispiele (Kopfnomen jeweils in Klammern):
- [Eis]
- die dritte [Staffel]
- [Ausgangspunkt] von allerlei Unternehmungen
- eine [Wiederholung] der Erfolgsgeschichte seiner Lifestyle-Bio-Limo
Quelle
Die Daten wurden aus dem Korpusgrammatik-Untersuchungskorpus (KoGra-UK) erhoben, basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010).
Zitieren
Weber, Thilo. 2021. Datensatz Nominalphrasen. Mannheim: Leibniz-Institut für Deutsche Sprache. DOI: 10.14618/lex.nominalphrasenDB
Permalink: https://grammis.ids-mannheim.de/nominalphrasendb
Details
Spalten
Beleg_ID | Laufende Identifikationsnummer für jeden Beleg | 1-8137 |
Sigle | Textsigle aus DeReKo | A10/APR.02926 - Z14/MAI.00464 |
Satzkontext_vor_Beleg | Sprachlicher Kontext, der dem Kopfnomen der NP vorangeht | Freitext |
Kopf_der_NP | Wortform, die den Kopf der NP bildet (= Beleg, über den die NP gefunden wurde) | % bis Zyprer |
Satzkontext_nach_Beleg | Sprachlicher Kontext, der dem Kopfnomen der NP folgt | Freitext |
Kopf_der_NP_Lemma | Lemma zu der Wortform, die den Kopf der NP bildet | % bis Zyprer |
valide | Angabe, ob der Beleg einschlägig ist | ja, nein |
nicht-valide_Begründung | Begründung, warum ein Beleg ausgeschlossen wurde | Freitext, leer bei validen Belegen |
Numerus | Numerus der NP | pl, sg, unklar, leer bei nicht-validen Belegen |
Genus | Genus der NP | fem, masc, neutr, ugender, leer bei nicht-validen Belegen |
Belebtheit | Angabe, ob mit der NP auf Belebtes oder Unbelebtes referiert wird | M (menschlich), MK (menschliches Kollektiv), Rest, leer bei nicht-validen Belegen |
1._prän_Lemma | Lemma des ersten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) | 0 (kein solcher Ausdruck vorhanden); absolut bis zwölftausend, leer bei nicht-validen Belegen |
1._prän_Feinklassifizierung | Kategorie des ersten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 1._prän_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); definiter_Artikel bis w-Determinierer, leer bei nicht-validen Belegen |
1._prän_Grobklassifizierung | Kategorie des ersten pränominalen Ausdrucks (Grobklassifizierung) | demonstratives_Adjektiv bis unklar, leer bei nicht-validen Belegen |
1._prän_Prädeterminierer | Angabe, ob vor dem ersten pränominalen Ausdruck ein Prädeterminierer steht | 0 (kein solcher Ausdruck vorhanden); solch bis welch, leer bei nicht-validen Belegen |
2._prän_Lemma | Lemma des zweiten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) | 0 (kein solcher Ausdruck vorhanden); ablehnend bis zwölft, leer bei nicht-validen Belegen |
2._prän_Feinklassifizierung | Kategorie des zweiten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 2._prän_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Adverb bis verschiedene, leer bei nicht-validen Belegen |
2._prän_Grobklassifizierung | Kategorie des zweiten pränominalen Ausdrucks (Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Adverb bis verschiedene, leer bei nicht-validen Belegen |
3._prän_Lemma | Lemma des dritten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) | 0 (kein solcher Ausdruck vorhanden); ablehnend bis vorweihnachtlich, leer bei nicht-validen Belegen |
3._prän_Feinklassifizierung | Kategorie des dritten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 3._prän_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Kardinalzahl bis sonstiges_quantifizierendes_Adjektiv, leer bei nicht-validen Belegen |
3._prän_Grobklassifizierung | Kategorie des dritten pränominalen Ausdrucks (Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Determinierer bis sonstiges_Adjektiv, leer bei nicht-validen Belegen |
4._prän_Lemma | Lemma des vierten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) | 0 (kein solcher Ausdruck vorhanden); bunt bis norwegisch, leer bei nicht-validen Belegen |
4._prän_Feinklassifizierung | Kategorie des vierten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 4._prän_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); sonstiges_Adjektiv, leer bei nicht-validen Belegen |
4._prän_Grobklassifizierung | Kategorie des vierten pränominalen Ausdrucks (Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); sonstiges_Adjektiv, leer bei nicht-validen Belegen |
Konjunktion_prän | Angabe, ob unter den pränominalen Ausdrücken Koordinationsstrukturen sind | 0 keine Koordination pränominaler Ausdrücke, erster (erster pränominaler Ausdruck ist mit mindestens einem weiteren Ausdruck koordiniert), zweiter (zweiter pränominaler Ausdruck ist mit mindestens einem weiteren Ausdruck koordiniert) , leer bei nicht-validen Belegen |
Kommentar_prän | Kommentare zu den pränominalen Ausdrücken | Freitext, Leere |
Bezugskategorie | Art des Elements, das der NP unmittelbar übergeordnet ist, sofern die NP nicht syntaktisch selbstständig ist | a (Adjektiv) bis v (Verb), leer bei nicht-validen Belegen |
Syntaktische_Funktion | Syntaktische Funktion der NP | absoluter_Akkusativ bis unklar, leer bei nicht-validen Belegen |
Kasus_distributionell | Kasus der NP unter Zuhilfenahme distributioneller Kriterien | akk (Akkusativ) bis unklar, leer bei nicht-validen Belegen |
Kasus_morphologisch | Kasus der NP nur nach morphologischen Kriterien | akk (Akkusativ) bis unklar, leer bei nicht-validen Belegen |
Kasus_der_Bezugs-NP | Bezieht sich auf NPs, die ihren Kasus typischerweise durch Kongruenz zu einer anderen NP erhalten (Appositionen, NPs in Adjunktor-Phrasen): Gibt den Kasus dieser Bezugs-NP an | akk (Akkusativ) bis unklar, Leere |
Bezugs-NP_Kommentar | Bezieht sich auf NPs, die ihren Kasus typischerweise durch Kongruenz zu einer anderen NP erhalten (Appositionen, NPs in Adjunktor-Phrasen): Kommentare zu dieser Bezugs-NP | Freitext, Leere |
Kasus_Funktion_Kommentar | Kommentare zu Kasus und syntaktischer Funktion | Freitext, Leere |
Präposition | Bezieht sich auf präpositional regierte NPs: Gibt die Präposition an | ab bis zwischen, Leere |
Präposition_Typ | Bezieht sich auf präpositional regierte NPs: Gibt den Präpositionstyp an | akk (Akkusativ-regierende Präposition) bis wechsel (Wechselpräposition), Leere |
Verschmelzung | Bezieht sich auf präpositional regierte NPs mit Definitartikel unmittelbar nach der regierenden Präposition: Gibt an, ob Präposition und Artikel verschmelzen | Verschmelzung, Vollform, Leere |
Domäne | Inhaltliche Domäne, die dem Text zugeordnet wurde | Fiktion, Kultur_Unterhaltung, Mensch_Natur, NA (= keine Angabe), Politik_Wirtschaft_Gesellschaft, Technik_Wissenschaft |
Medium | Medium, aus dem der Text stammt | Buecher_Fachzeitschriften, Gesprochenes, Publikumspresse, Sonstiges |
Land | Land, aus dem der Text stammt | AT (Österreich), CH (Schweiz), DE (Deutschland), LU (Luxemburg) |
Region | Region, aus der der Text stammt | Mittelost, Mittelsued, Mittelwest, NA (keine Angabe), Nordost, Nordwest, Suedost, Suedwest, Ueberregional |
Register | Register, das dem Text zugeordnet wurde | Gebrauchstext, Literarisch, Pressetext |
Jahr | Jahr, in dem der Text erschienen ist | 1958-2014 |
Jahrzehnt | Jahrzehnt, in dem der Text erschienen ist | 1950 bis 2010 |
Literatur
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).
- Weber, Thilo. 2021a. Syntaktische Funktionen von Nominalphrasen und Funktionen der Kasus. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2, 63-102. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24419
- Weber, Thilo. 2021b. Determination in der Nominalphrase - ein Überblick. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2, 13-62. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24418