Zu - und dass -Komplemente (Datensatz)

Version (Datensatz): 1.0 vom 09.01.2019

Version (Dokumentation): 1.4 vom 21.02.2025

Verfasser: Patrick Brandt

Kontakt: Patrick Brandt

Verfügbarkeit

Download


  MD5 (kogra_zudass_2019-01-09.csv) = 11782acdae8ddc04d46db23e20e27aef
 

Beschreibung

Der Datensatz enthält 7.685 Korpusbelege zur Alternation zwischen infiniten und finiten Satzkomplementen, die mit zu (infinit) bzw. dass (finit) eingeleitet werden ( Brandt 2019a ). Die Belege sind manuell annotiert für Eigenschaften, die bekanntermaßen an der Etablierung bzw. Veränderung von Kontrollbeziehungen beteiligt sind (siehe unter Details).

Quelle

Die Daten wurden aus dem Deutschen Referenzkorpus DeReKo ( Kupietz et al. 2010 ), Release 2011-II, erhoben und manuell annotiert.

Zitieren

Brandt, Patrick. 2019. Datensatz zu-/dass-Komplemente. Mannheim: Leibniz-Institut für Deutsche Sprache. doi: 10.14618/zudassKomplementeDB

Nutzung

Daten aus dem Deutschen Referenzkorpus DeReKo unterliegen der Nutzungsvereinbarung des Deutschen Referenzkorpus DeReKo (Fassung vom 24.05.2018). Ausgeschlossen ist insbesondere die kommerzielle Nutzung. Darüber hinaus dürfen diese Daten nicht ohne schriftliche Zustimmung des Leibniz-Instituts für Deutsche Sprache an Dritte weitergegeben oder veröffentlicht werden. Davon ausgenommen sind Zitate und Auszüge.

Mit dem Herunterladen des Datensatzes stimmt der Nutzer/die Nutzerin diesen Vereinbarungen zu.

Details

Die Belege sind dahingehend annotiert, welchen Typ von Kontrollstruktur das im Matrixsatz enthaltene Verb prototypisch projiziert (Subjekt-, Akkusativobjekt-, Dativobjekt- bzw. Antikontrolle) und ob zwischen einem nominalen Argument des Matrixprädikats und dem Subjekt des Komplementsatzes eine Koreferenzbeziehung besteht (viz. Kontrolle).

Weitere annotierte Eigenschaften sind die Passivierung des Matrix- bzw. Komplementsatzes, das Vorkommen von (“freien”) Dativargumenten oder Korrelaten ( es , dazu , dafür , damit ) im Matrixsatz sowie das Vorkommen von Modalverben im Komplementsatz. Hinzu kommen weitere evtl. relevante grammatische Merkmale wie das Vorliegen von Reflexivierung und Information über Flexionsmerkmale sowie Metadaten zu Erscheinungsjahr, Medium, Register, Domäne, Region und Land.

Spalten

Nr Beleg-ID string
TID Dokument-ID (DeReKo-Textsigle) string
Verb Lemma des einbettenden Verbs string
L.Kontext1 Kontext links vom Belegsatz string
Satz Belegsatz string
R.Kontext1 Kontext rechts vom Belegsatz string
dass Nebensatz finit (1) oder infinit (0) {0, 1}
Matrix.Passiv einbettendes Verb im Passiv {0, 1}
Matrix.Dativ Matrixsatz enthält ein Dativobjekt {0, 1}
Matrix.argPP Matrixsatz enthält ein Präpositionalkomplement {0, 1}
Klasse Verbklasse {Obj-Kon, Sub-Kon, Obviat}
Kompsatz.Modal Komplementsatz mit Modalverb {0, 1}
Kompsatz.Passiv eingebettetes Verb im Passiv {0, 1}
Koref Subjekt des Kompl.-satz koreferiert mit Satzglied des Matrixsatzes {sub, do, io, mod, 0}
Korrelat Matrixsatz hat ein Korrelat für den Komplementsat. {0, 1}
Kompsatz.Lemma Lemma des eingebetteten Verbs string
Matrixsatz.Subjekt Matrixsatz hat ein grammatisches Subjekt {0, 1}
Komplementsatz.Subjekt Komplementsatz hat ein grammatisches Subjekt {0, 1}
Reflexiv Matrixprädikat mit Reflexivpronomen {0, 1}
Year Publikationsjahr [1957, 2011]
Register Register {1, 2, 3}
Domain Domäne {0, 1, 2, 3, 4, 5}
Medium Medium {1, 2, 3, 4, 5}
Region Region {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
Country Land {1, 2, 3, 4, 5}
FullRef vollständige Referenz string

Kodierung

Details zur Klassifizierung nach Register, Domain, Medium, Region, Country finden sich in Bubenhofer et al. (2014).

Klasse

Code Erläuterung
Obj-Kon Objektkontrollverb (in Brandt 2019: “AO-KV” oder “DO-KV”)
Sub-Kon Subjektkontrollverb (in Brandt 2019: “SU-KV”)
Obviat obviates Verb (in Brandt 2019: “A-KV”)

Koref

Code Erläuterung
sub Subjekt
do Akkusativobjekt
io Dativobjekt
mod Adjunkt
0 kein koreferentes Element im Matrixsatz

Register

Code Erläuterung
1 Pressetext
2 Gebrauchstext
3 Literarisch

Domain

Code Erläuterung
0 unklassifizierbar
1 Fiktion
2 Kultur/Unterhaltung
3 Mensch/Natur
4 Politik/Wirtschaft/Gesellschaft
5 Technik/Wissenschaft

Medium

Code Erläuterung
1 Publikumspresse
2 Buecher/Fachzeitschriften
3 Wikipedia
4 Gesprochenes
5 Sonstiges

Region

Code Erläuterung
0 überregional
1 Herkunft unbekannt
2 Herkunft nicht zuordenbar
3 Suedwest
4 Mittelost
5 Mittelsued
6 Mittelwest
7 Nordost
8 Nordwest
9 Suedost

Country

Code Erläuterung
0 unbekannt
1 Deutschland
2 Deutschland (Ost)
3 Deutschland (West)
4 Österreich
5 Schweiz
6 Luxemburg

Literatur

Zum Text

Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen