Zu - und dass -Komplemente (Datensatz)
Version (Datensatz): 1.0 vom 09.01.2019
Version (Dokumentation): 1.4 vom 21.02.2025
Verfasser: Patrick Brandt
Kontakt: Patrick Brandt
Verfügbarkeit
MD5 (kogra_zudass_2019-01-09.csv) = 11782acdae8ddc04d46db23e20e27aef
Beschreibung
Der Datensatz enthält 7.685 Korpusbelege zur Alternation zwischen infiniten und finiten Satzkomplementen, die mit zu (infinit) bzw. dass (finit) eingeleitet werden ( Brandt 2019a ). Die Belege sind manuell annotiert für Eigenschaften, die bekanntermaßen an der Etablierung bzw. Veränderung von Kontrollbeziehungen beteiligt sind (siehe unter Details).
Quelle
Die Daten wurden aus dem Deutschen Referenzkorpus DeReKo ( Kupietz et al. 2010 ), Release 2011-II, erhoben und manuell annotiert.
Zitieren
Brandt, Patrick. 2019. Datensatz zu-/dass-Komplemente. Mannheim: Leibniz-Institut für Deutsche Sprache. doi: 10.14618/zudassKomplementeDB
Nutzung
Daten aus dem Deutschen Referenzkorpus DeReKo unterliegen der Nutzungsvereinbarung des Deutschen Referenzkorpus DeReKo (Fassung vom 24.05.2018). Ausgeschlossen ist insbesondere die kommerzielle Nutzung. Darüber hinaus dürfen diese Daten nicht ohne schriftliche Zustimmung des Leibniz-Instituts für Deutsche Sprache an Dritte weitergegeben oder veröffentlicht werden. Davon ausgenommen sind Zitate und Auszüge.
Mit dem Herunterladen des Datensatzes stimmt der Nutzer/die Nutzerin diesen Vereinbarungen zu.
Details
Die Belege sind dahingehend annotiert, welchen Typ von Kontrollstruktur das im Matrixsatz enthaltene Verb prototypisch projiziert (Subjekt-, Akkusativobjekt-, Dativobjekt- bzw. Antikontrolle) und ob zwischen einem nominalen Argument des Matrixprädikats und dem Subjekt des Komplementsatzes eine Koreferenzbeziehung besteht (viz. Kontrolle).
Weitere annotierte Eigenschaften sind die Passivierung des Matrix- bzw. Komplementsatzes, das Vorkommen von (“freien”) Dativargumenten oder Korrelaten ( es , dazu , dafür , damit ) im Matrixsatz sowie das Vorkommen von Modalverben im Komplementsatz. Hinzu kommen weitere evtl. relevante grammatische Merkmale wie das Vorliegen von Reflexivierung und Information über Flexionsmerkmale sowie Metadaten zu Erscheinungsjahr, Medium, Register, Domäne, Region und Land.
Spalten
Nr | Beleg-ID | string |
TID | Dokument-ID (DeReKo-Textsigle) | string |
Verb | Lemma des einbettenden Verbs | string |
L.Kontext1 | Kontext links vom Belegsatz | string |
Satz | Belegsatz | string |
R.Kontext1 | Kontext rechts vom Belegsatz | string |
dass | Nebensatz finit (1) oder infinit (0) | {0, 1} |
Matrix.Passiv | einbettendes Verb im Passiv | {0, 1} |
Matrix.Dativ | Matrixsatz enthält ein Dativobjekt | {0, 1} |
Matrix.argPP | Matrixsatz enthält ein Präpositionalkomplement | {0, 1} |
Klasse | Verbklasse | {Obj-Kon, Sub-Kon, Obviat} |
Kompsatz.Modal | Komplementsatz mit Modalverb | {0, 1} |
Kompsatz.Passiv | eingebettetes Verb im Passiv | {0, 1} |
Koref | Subjekt des Kompl.-satz koreferiert mit Satzglied des Matrixsatzes | {sub, do, io, mod, 0} |
Korrelat | Matrixsatz hat ein Korrelat für den Komplementsat. | {0, 1} |
Kompsatz.Lemma | Lemma des eingebetteten Verbs | string |
Matrixsatz.Subjekt | Matrixsatz hat ein grammatisches Subjekt | {0, 1} |
Komplementsatz.Subjekt | Komplementsatz hat ein grammatisches Subjekt | {0, 1} |
Reflexiv | Matrixprädikat mit Reflexivpronomen | {0, 1} |
Year | Publikationsjahr | [1957, 2011] |
Register | Register | {1, 2, 3} |
Domain | Domäne | {0, 1, 2, 3, 4, 5} |
Medium | Medium | {1, 2, 3, 4, 5} |
Region | Region | {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} |
Country | Land | {1, 2, 3, 4, 5} |
FullRef | vollständige Referenz | string |
Kodierung
Details zur Klassifizierung nach Register, Domain, Medium, Region, Country finden sich in Bubenhofer et al. (2014).
Klasse
Code | Erläuterung |
Obj-Kon | Objektkontrollverb (in Brandt 2019: “AO-KV” oder “DO-KV”) |
Sub-Kon | Subjektkontrollverb (in Brandt 2019: “SU-KV”) |
Obviat | obviates Verb (in Brandt 2019: “A-KV”) |
Koref
Code | Erläuterung |
sub | Subjekt |
do | Akkusativobjekt |
io | Dativobjekt |
mod | Adjunkt |
0 | kein koreferentes Element im Matrixsatz |
Register
Code | Erläuterung |
1 | Pressetext |
2 | Gebrauchstext |
3 | Literarisch |
Domain
Code | Erläuterung |
0 | unklassifizierbar |
1 | Fiktion |
2 | Kultur/Unterhaltung |
3 | Mensch/Natur |
4 | Politik/Wirtschaft/Gesellschaft |
5 | Technik/Wissenschaft |
Medium
Code | Erläuterung |
1 | Publikumspresse |
2 | Buecher/Fachzeitschriften |
3 | Wikipedia |
4 | Gesprochenes |
5 | Sonstiges |
Region
Code | Erläuterung |
0 | überregional |
1 | Herkunft unbekannt |
2 | Herkunft nicht zuordenbar |
3 | Suedwest |
4 | Mittelost |
5 | Mittelsued |
6 | Mittelwest |
7 | Nordost |
8 | Nordwest |
9 | Suedost |
Country
Code | Erläuterung |
0 | unbekannt |
1 | Deutschland |
2 | Deutschland (Ost) |
3 | Deutschland (West) |
4 | Österreich |
5 | Schweiz |
6 | Luxemburg |
Literatur
- Brandt, Patrick. 2019a. Alternation von zu - und dass - Komplementen: Kontrolle, Korpus und Grammatik . In Eric Fuß, Marek Konopka & Angelika Wöllstein (Hgg.), Grammatik im Korpus . Tübingen: Narr, 215–303.
- Bubenhofer, Noah, Marek Konopka & Roman Schneider. 2014. Präliminarien einer Korpusgrammatik . Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache 4. Tübingen: Narr. Unter Mitwirkung von Caren Brinckmann.
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German Reference Corpus DeReKo: A primordial sample for linguistic research . In Nicoletta Calzolari et al. (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010) . Valletta: European Language Resources Association (ELRA), 1848–1854. [abgerufen am 20.01.2025)]