Nominalphrasen (Datensatz)
Version vom 26.5.2021
Download
Beschreibung
Der Datensatz dient der Untersuchung der syntaktischen Funktionen von NPs (Weber 2021a) und der Determination in der NP (Weber 2021b). Er enthalt Belege zu nichtpronominalen (d.h. vollen, lexikalischen) Nominalphrasen (NPs) mit einem Substantiv oder einer Nominalisierung als Kopf. Jeder Beleg ist in Bezug auf eine Reihe linguistisch relevanter Merkmale annotiert. Insgesamt enthalt der Datensatz 8.137 Belegstellen. Nach dem Aussortieren von Fehlbelegen (siehe Spalten ?valide? und ?nicht-valide_Begrundung?) bleiben noch 7.813 einschlagige Belege. Die Suchanfrage erfolgte uber das Kopfnomen; fur Details zur Datenerhebung siehe Weber (2021a). Das Kopfnomen erscheint in der Spalte ?Kopf_der_NP?. In manchen Fallen besteht die NP nur aus dem Kopfnomen, in den meisten Fallen geht sie aber daruber hinaus; sie erstreckt sich dann auf einen Teil des vorangehenden Kontexts (Spalte ?Satzkontext_vor_Beleg?) und/oder des nachfolgenden Kontexts (?Satzkontext_nach_Beleg?). Beispiele (Kopfnomen jeweils in Klammern):
- [Eis]
- die dritte [Staffel]
- [Ausgangspunkt] von allerlei Unternehmungen
- eine [Wiederholung] der Erfolgsgeschichte seiner Lifestyle-Bio-Limo
Quelle
Die Daten wurden aus dem Korpusgrammatik-Untersuchungskorpus (KoGra-UK) erhoben, basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010).
Zitieren
Weber, Thilo. 2021. Datensatz Nominalphrasen. Mannheim: Leibniz-Institut fur Deutsche Sprache. DOI: 10.14618/lex.nominalphrasenDB
Permalink: https://grammis.ids-mannheim.de/nominalphrasendb
Details
Spalten
| Beleg_ID | Laufende Identifikationsnummer fur jeden Beleg | 1-8137 |
| Sigle | Textsigle aus DeReKo | A10/APR.02926 - Z14/MAI.00464 |
| Satzkontext_vor_Beleg | Sprachlicher Kontext, der dem Kopfnomen der NP vorangeht | Freitext |
| Kopf_der_NP | Wortform, die den Kopf der NP bildet (= Beleg, uber den die NP gefunden wurde) | % bis Zyprer |
| Satzkontext_nach_Beleg | Sprachlicher Kontext, der dem Kopfnomen der NP folgt | Freitext |
| Kopf_der_NP_Lemma | Lemma zu der Wortform, die den Kopf der NP bildet | % bis Zyprer |
| valide | Angabe, ob der Beleg einschlagig ist | ja, nein |
| nicht-valide_Begrundung | Begrundung, warum ein Beleg ausgeschlossen wurde | Freitext, leer bei validen Belegen |
| Numerus | Numerus der NP | pl, sg, unklar, leer bei nicht-validen Belegen |
| Genus | Genus der NP | fem, masc, neutr, ugender, leer bei nicht-validen Belegen |
| Belebtheit | Angabe, ob mit der NP auf Belebtes oder Unbelebtes referiert wird | M (menschlich), MK (menschliches Kollektiv), Rest, leer bei nicht-validen Belegen |
| 1._pran_Lemma | Lemma des ersten pranominalen Ausdrucks in der NP; miteinander koordinierte Ausdrucke werden hier wie ein einzelner Ausdruck gezahlt (aber siehe Spalte Konjunktion_pran) | 0 (kein solcher Ausdruck vorhanden); absolut bis zwolftausend, leer bei nicht-validen Belegen |
| 1._pran_Feinklassifizierung | Kategorie des ersten pranominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Ubernahme des Eintrags aus der Spalte 1._pran_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); definiter_Artikel bis w-Determinierer, leer bei nicht-validen Belegen |
| 1._pran_Grobklassifizierung | Kategorie des ersten pranominalen Ausdrucks (Grobklassifizierung) | demonstratives_Adjektiv bis unklar, leer bei nicht-validen Belegen |
| 1._pran_Pradeterminierer | Angabe, ob vor dem ersten pranominalen Ausdruck ein Pradeterminierer steht | 0 (kein solcher Ausdruck vorhanden); solch bis welch, leer bei nicht-validen Belegen |
| 2._pran_Lemma | Lemma des zweiten pranominalen Ausdrucks in der NP; miteinander koordinierte Ausdrucke werden hier wie ein einzelner Ausdruck gezahlt (aber siehe Spalte Konjunktion_pran) | 0 (kein solcher Ausdruck vorhanden); ablehnend bis zwolft, leer bei nicht-validen Belegen |
| 2._pran_Feinklassifizierung | Kategorie des zweiten pranominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Ubernahme des Eintrags aus der Spalte 2._pran_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Adverb bis verschiedene, leer bei nicht-validen Belegen |
| 2._pran_Grobklassifizierung | Kategorie des zweiten pranominalen Ausdrucks (Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Adverb bis verschiedene, leer bei nicht-validen Belegen |
| 3._pran_Lemma | Lemma des dritten pranominalen Ausdrucks in der NP; miteinander koordinierte Ausdrucke werden hier wie ein einzelner Ausdruck gezahlt (aber siehe Spalte Konjunktion_pran) | 0 (kein solcher Ausdruck vorhanden); ablehnend bis vorweihnachtlich, leer bei nicht-validen Belegen |
| 3._pran_Feinklassifizierung | Kategorie des dritten pranominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Ubernahme des Eintrags aus der Spalte 3._pran_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Kardinalzahl bis sonstiges_quantifizierendes_Adjektiv, leer bei nicht-validen Belegen |
| 3._pran_Grobklassifizierung | Kategorie des dritten pranominalen Ausdrucks (Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); Determinierer bis sonstiges_Adjektiv, leer bei nicht-validen Belegen |
| 4._pran_Lemma | Lemma des vierten pranominalen Ausdrucks in der NP; miteinander koordinierte Ausdrucke werden hier wie ein einzelner Ausdruck gezahlt (aber siehe Spalte Konjunktion_pran) | 0 (kein solcher Ausdruck vorhanden); bunt bis norwegisch, leer bei nicht-validen Belegen |
| 4._pran_Feinklassifizierung | Kategorie des vierten pranominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Ubernahme des Eintrags aus der Spalte 4._pran_Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); sonstiges_Adjektiv, leer bei nicht-validen Belegen |
| 4._pran_Grobklassifizierung | Kategorie des vierten pranominalen Ausdrucks (Grobklassifizierung) | 0 (kein solcher Ausdruck vorhanden); sonstiges_Adjektiv, leer bei nicht-validen Belegen |
| Konjunktion_pran | Angabe, ob unter den pranominalen Ausdrucken Koordinationsstrukturen sind | 0 keine Koordination pranominaler Ausdrucke, erster (erster pranominaler Ausdruck ist mit mindestens einem weiteren Ausdruck koordiniert), zweiter (zweiter pranominaler Ausdruck ist mit mindestens einem weiteren Ausdruck koordiniert) , leer bei nicht-validen Belegen |
| Kommentar_pran | Kommentare zu den pranominalen Ausdrucken | Freitext, Leere |
| Bezugskategorie | Art des Elements, das der NP unmittelbar ubergeordnet ist, sofern die NP nicht syntaktisch selbststandig ist | a (Adjektiv) bis v (Verb), leer bei nicht-validen Belegen |
| Syntaktische_Funktion | Syntaktische Funktion der NP | absoluter_Akkusativ bis unklar, leer bei nicht-validen Belegen |
| Kasus_distributionell | Kasus der NP unter Zuhilfenahme distributioneller Kriterien | akk (Akkusativ) bis unklar, leer bei nicht-validen Belegen |
| Kasus_morphologisch | Kasus der NP nur nach morphologischen Kriterien | akk (Akkusativ) bis unklar, leer bei nicht-validen Belegen |
| Kasus_der_Bezugs-NP | Bezieht sich auf NPs, die ihren Kasus typischerweise durch Kongruenz zu einer anderen NP erhalten (Appositionen, NPs in Adjunktor-Phrasen): Gibt den Kasus dieser Bezugs-NP an | akk (Akkusativ) bis unklar, Leere |
| Bezugs-NP_Kommentar | Bezieht sich auf NPs, die ihren Kasus typischerweise durch Kongruenz zu einer anderen NP erhalten (Appositionen, NPs in Adjunktor-Phrasen): Kommentare zu dieser Bezugs-NP | Freitext, Leere |
| Kasus_Funktion_Kommentar | Kommentare zu Kasus und syntaktischer Funktion | Freitext, Leere |
| Praposition | Bezieht sich auf prapositional regierte NPs: Gibt die Praposition an | ab bis zwischen, Leere |
| Praposition_Typ | Bezieht sich auf prapositional regierte NPs: Gibt den Prapositionstyp an | akk (Akkusativ-regierende Praposition) bis wechsel (Wechselpraposition), Leere |
| Verschmelzung | Bezieht sich auf prapositional regierte NPs mit Definitartikel unmittelbar nach der regierenden Praposition: Gibt an, ob Praposition und Artikel verschmelzen | Verschmelzung, Vollform, Leere |
| Domane | Inhaltliche Domane, die dem Text zugeordnet wurde | Fiktion, Kultur_Unterhaltung, Mensch_Natur, NA (= keine Angabe), Politik_Wirtschaft_Gesellschaft, Technik_Wissenschaft |
| Medium | Medium, aus dem der Text stammt | Buecher_Fachzeitschriften, Gesprochenes, Publikumspresse, Sonstiges |
| Land | Land, aus dem der Text stammt | AT (Osterreich), CH (Schweiz), DE (Deutschland), LU (Luxemburg) |
| Region | Region, aus der der Text stammt | Mittelost, Mittelsued, Mittelwest, NA (keine Angabe), Nordost, Nordwest, Suedost, Suedwest, Ueberregional |
| Register | Register, das dem Text zugeordnet wurde | Gebrauchstext, Literarisch, Pressetext |
| Jahr | Jahr, in dem der Text erschienen ist | 1958-2014 |
| Jahrzehnt | Jahrzehnt, in dem der Text erschienen ist | 1950 bis 2010 |
Literatur
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).
- Weber, Thilo. 2021a. Syntaktische Funktionen von Nominalphrasen und Funktionen der Kasus. In Marek Konopka, Angelika Wollstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2, 63-102. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24419
- Weber, Thilo. 2021b. Determination in der Nominalphrase - ein Uberblick. In Marek Konopka, Angelika Wollstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2, 13-62. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24418
