Nominalphrasen (Datensatz)

Version vom 26.5.2021

Download

Beschreibung

Der Datensatz dient der Untersuchung der syntaktischen Funktionen von NPs (Weber 2021a) und der Determination in der NP (Weber 2021b). Er enthält Belege zu nichtpronominalen (d.h. vollen, lexikalischen) Nominalphrasen (NPs) mit einem Substantiv oder einer Nominalisierung als Kopf. Jeder Beleg ist in Bezug auf eine Reihe linguistisch relevanter Merkmale annotiert. Insgesamt enthält der Datensatz 8.137 Belegstellen. Nach dem Aussortieren von Fehlbelegen (siehe Spalten „valide“ und „nicht-valide_Begründung“) bleiben noch 7.813 einschlägige Belege. Die Suchanfrage erfolgte über das Kopfnomen; für Details zur Datenerhebung siehe Weber (2021a). Das Kopfnomen erscheint in der Spalte „Kopf_der_NP“. In manchen Fällen besteht die NP nur aus dem Kopfnomen, in den meisten Fällen geht sie aber darüber hinaus; sie erstreckt sich dann auf einen Teil des vorangehenden Kontexts (Spalte „Satzkontext_vor_Beleg“) und/oder des nachfolgenden Kontexts („Satzkontext_nach_Beleg“). Beispiele (Kopfnomen jeweils in Klammern):

  • [Eis]
  • die dritte [Staffel]
  • [Ausgangspunkt] von allerlei Unternehmungen
  • eine [Wiederholung] der Erfolgsgeschichte seiner Lifestyle-Bio-Limo

Quelle

Die Daten wurden aus dem Korpusgrammatik-Untersuchungskorpus (KoGra-UK) erhoben, basierend auf dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010).

Zitieren

Weber, Thilo. 2021. Datensatz Nominalphrasen. Mannheim: Leibniz-Institut für Deutsche Sprache. DOI: 10.14618/lex.nominalphrasenDB

Permalink: https://grammis.ids-mannheim.de/nominalphrasendb

Details

Spalten

Beleg_IDLaufende Identifikationsnummer für jeden Beleg1-8137
SigleTextsigle aus DeReKoA10/APR.02926 - Z14/MAI.00464
Satzkontext_vor_BelegSprachlicher Kontext, der dem Kopfnomen der NP vorangehtFreitext
Kopf_der_NPWortform, die den Kopf der NP bildet (= Beleg, über den die NP gefunden wurde)% bis Zyprer
Satzkontext_nach_BelegSprachlicher Kontext, der dem Kopfnomen der NP folgtFreitext
Kopf_der_NP_LemmaLemma zu der Wortform, die den Kopf der NP bildet% bis Zyprer
valideAngabe, ob der Beleg einschlägig istja, nein
nicht-valide_BegründungBegründung, warum ein Beleg ausgeschlossen wurdeFreitext, leer bei validen Belegen
NumerusNumerus der NPpl, sg, unklar, leer bei nicht-validen Belegen
Genus Genus der NP fem, masc, neutr, ugender, leer bei nicht-validen Belegen
Belebtheit Angabe, ob mit der NP auf Belebtes oder Unbelebtes referiert wird M (menschlich), MK (menschliches Kollektiv), Rest, leer bei nicht-validen Belegen
1._prän_Lemma Lemma des ersten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) 0 (kein solcher Ausdruck vorhanden); absolut bis zwölftausend, leer bei nicht-validen Belegen
1._prän_Feinklassifizierung Kategorie des ersten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 1._prän_Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); definiter_Artikel bis w-Determinierer, leer bei nicht-validen Belegen
1._prän_Grobklassifizierung Kategorie des ersten pränominalen Ausdrucks (Grobklassifizierung) demonstratives_Adjektiv bis unklar, leer bei nicht-validen Belegen
1._prän_Prädeterminierer Angabe, ob vor dem ersten pränominalen Ausdruck ein Prädeterminierer steht 0 (kein solcher Ausdruck vorhanden); solch  bis welch, leer bei nicht-validen Belegen
2._prän_Lemma Lemma des zweiten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) 0 (kein solcher Ausdruck vorhanden); ablehnend bis zwölft, leer bei nicht-validen Belegen
2._prän_Feinklassifizierung Kategorie des zweiten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 2._prän_Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); Adverb bis verschiedene, leer bei nicht-validen Belegen
2._prän_Grobklassifizierung Kategorie des zweiten pränominalen Ausdrucks (Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); Adverb bis verschiedene, leer bei nicht-validen Belegen
3._prän_Lemma Lemma des dritten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) 0 (kein solcher Ausdruck vorhanden); ablehnend bis vorweihnachtlich, leer bei nicht-validen Belegen
3._prän_Feinklassifizierung Kategorie des dritten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 3._prän_Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); Kardinalzahl bis sonstiges_quantifizierendes_Adjektiv, leer bei nicht-validen Belegen
3._prän_Grobklassifizierung Kategorie des dritten pränominalen Ausdrucks (Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); Determinierer bis sonstiges_Adjektiv, leer bei nicht-validen Belegen
4._prän_Lemma Lemma des vierten pränominalen Ausdrucks in der NP; miteinander koordinierte Ausdrücke werden hier wie ein einzelner Ausdruck gezählt (aber siehe Spalte Konjunktion_prän) 0 (kein solcher Ausdruck vorhanden); bunt bis norwegisch, leer bei nicht-validen Belegen
4._prän_Feinklassifizierung Kategorie des vierten pränominalen Ausdrucks (Feinklassifizierung einiger Kategorien, ansonsten Übernahme des Eintrags aus der Spalte 4._prän_Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); sonstiges_Adjektiv, leer bei nicht-validen Belegen
4._prän_Grobklassifizierung Kategorie des vierten pränominalen Ausdrucks (Grobklassifizierung) 0 (kein solcher Ausdruck vorhanden); sonstiges_Adjektiv, leer bei nicht-validen Belegen
Konjunktion_prän Angabe, ob unter den pränominalen Ausdrücken Koordinationsstrukturen sind 0 keine Koordination pränominaler Ausdrücke, erster (erster pränominaler Ausdruck ist mit mindestens einem weiteren Ausdruck koordiniert), zweiter (zweiter pränominaler Ausdruck ist mit mindestens einem weiteren Ausdruck koordiniert) , leer bei nicht-validen Belegen
Kommentar_prän Kommentare zu den pränominalen Ausdrücken Freitext, Leere
Bezugskategorie Art des Elements, das der NP unmittelbar übergeordnet ist, sofern die NP nicht syntaktisch selbstständig ist a (Adjektiv) bis v (Verb), leer bei nicht-validen Belegen
Syntaktische_Funktion Syntaktische Funktion der NP absoluter_Akkusativ bis unklar, leer bei nicht-validen Belegen
Kasus_distributionell Kasus der NP unter Zuhilfenahme distributioneller Kriterien akk (Akkusativ) bis unklar, leer bei nicht-validen Belegen
Kasus_morphologisch Kasus der NP nur nach morphologischen Kriterien akk (Akkusativ) bis unklar, leer bei nicht-validen Belegen
Kasus_der_Bezugs-NP Bezieht sich auf NPs, die ihren Kasus typischerweise durch Kongruenz zu einer anderen NP erhalten (Appositionen, NPs in Adjunktor-Phrasen): Gibt den Kasus dieser Bezugs-NP an akk (Akkusativ) bis unklar, Leere
Bezugs-NP_Kommentar Bezieht sich auf NPs, die ihren Kasus typischerweise durch Kongruenz zu einer anderen NP erhalten (Appositionen, NPs in Adjunktor-Phrasen): Kommentare zu dieser Bezugs-NP Freitext, Leere
Kasus_Funktion_Kommentar Kommentare zu Kasus und syntaktischer Funktion Freitext, Leere
Präposition Bezieht sich auf präpositional regierte NPs: Gibt die Präposition an ab bis zwischen, Leere
Präposition_Typ Bezieht sich auf präpositional regierte NPs: Gibt den Präpositionstyp an akk (Akkusativ-regierende Präposition) bis wechsel (Wechselpräposition), Leere
Verschmelzung Bezieht sich auf präpositional regierte NPs mit Definitartikel unmittelbar nach der regierenden Präposition: Gibt an, ob Präposition und Artikel verschmelzen Verschmelzung, Vollform, Leere
Domäne Inhaltliche Domäne, die dem Text zugeordnet wurde Fiktion, Kultur_Unterhaltung, Mensch_Natur, NA (= keine Angabe), Politik_Wirtschaft_Gesellschaft, Technik_Wissenschaft
Medium Medium, aus dem der Text stammt Buecher_Fachzeitschriften, Gesprochenes, Publikumspresse, Sonstiges
Land Land, aus dem der Text stammt AT (Österreich), CH (Schweiz), DE (Deutschland), LU (Luxemburg)
Region Region, aus der der Text stammt Mittelost, Mittelsued, Mittelwest, NA (keine Angabe), Nordost, Nordwest, Suedost, Suedwest, Ueberregional
Register Register, das dem Text zugeordnet wurde Gebrauchstext, Literarisch, Pressetext
Jahr Jahr, in dem der Text erschienen ist 1958-2014
Jahrzehnt Jahrzehnt, in dem der Text erschienen ist 1950 bis 2010

Literatur

  • Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).
  • Weber, Thilo. 2021a. Syntaktische Funktionen von Nominalphrasen und Funktionen der Kasus. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2, 63-102. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24419
  • Weber, Thilo. 2021b. Determination in der Nominalphrase - ein Überblick. In Marek Konopka, Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 2, 13-62. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup.bkgd.2021.1.24418

Zum Text

Schlagwörter
Autor(en)
Thilo Weber
Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen