Zu- und dass-Komplemente (Datensatz)
Version vom 9.1.2019
Zum Downloadbereich
Quelle
Der Datensatz umfasst 7685 Belege, erhoben aus dem Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010), Release 2011-II, und wurde manuell annotiert.
Spalten
Nr | Beleg-ID | string |
TID | Dokument-ID (DeReKo-Textsigle) | string |
Verb | Lemma des einbettenden Verbs | string |
L.Kontext1 | Kontext links vom Belegsatz | string |
Satz | Belegsatz | string |
R.Kontext1 | Kontext rechts vom Belegsatz | string |
dass | Nebensatz finit (1) oder infinit (0) | {0, 1} |
Matrix.Passiv | einbettendes Verb im Passiv | {0, 1} |
Matrix.Dativ | Matrixsatz enthält ein Dativobjekt | {0, 1} |
Matrix.argPP | Matrixsatz enthält ein Präpositionalkomplement | {0, 1} |
Klasse | Verbklasse | {Obj-Kon, Sub-Kon, Obviat} |
Kompsatz.Modal | Komplementsatz mit Modalverb | {0, 1} |
Kompsatz.Passiv | eingebettetes Verb im Passiv | {0, 1} |
Koref | Subjekt des Kompl.-satz koreferiert mit Satzglied des Matrixsatzes | {sub, do, io, mod, 0} |
Korrelat | Matrixsatz hat ein Korrelat für den Komplementsat. | {0, 1} |
Kompsatz.Lemma | Lemma des eingebetteten Verbs | string |
Matrixsatz.Subjekt | Matrixsatz hat ein grammatisches Subjekt | {0, 1} |
Komplementsatz.Subjekt | Komplementsatz hat ein grammatisches Subjekt | {0, 1} |
Reflexiv | Matrixprädikat mit Reflexivpronomen | {0, 1} |
Year | Publikationsjahr | [1957, 2011] |
Register | Register | {1, 2, 3} |
Domain | Domäne | {0, 1, 2, 3, 4, 5} |
Medium | Medium | {1, 2, 3, 4, 5} |
Region | Region | {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} |
Country | Land | {1, 2, 3, 4, 5} |
FullRef | vollständige Referenz | string |
Kodierungen
Details zur Klassifizierung nach Register, Domain, Medium, Region, Country finden sich in Bubenhofer et al. (2014).
Klasse | |
Code | Erläuterung |
Obj-Kon | Objektkontrollverb (in Brandt 2019: "AO-KV" oder "DO-KV") |
Sub-Kon | Subjektkontrollverb (in Brandt 2019: "SU-KV") |
Obviat | obviates Verb (in Brandt 2019: "A-KV") |
Koref | |
Code | Erläuterung |
sub | Subjekt |
do | Akkusativobjekt |
io | Dativobjekt |
mod | Adjunkt |
0 | kein koreferentes Element im Matrixsatz |
Register | |
Code | Erläuterung |
1 | Pressetext |
2 | Gebrauchstext |
3 | Literarisch |
Domain | |
Code | Erläuterung |
0 | unklassifizierbar |
1 | Fiktion |
2 | Kultur/Unterhaltung |
3 | Mensch/Natur |
4 | Politik/Wirtschaft/Gesellschaft |
5 | Technik/Wissenschaft |
Medium | |
Code | Erläuterung |
1 | Publikumspresse |
2 | Buecher/Fachzeitschriften |
3 | Wikipedia |
4 | Gesprochenes |
5 | Sonstiges |
Region | |
Code | Erläuterung |
0 | überregional |
1 | Herkunft unbekannt |
2 | Herkunft nicht zuordenbar |
3 | Suedwest |
4 | Mittelost |
5 | Mittelsued |
6 | Mittelwest |
7 | Nordost |
8 | Nordwest |
9 | Suedost |
Country | |
Code | Erläuterung |
0 | unbekannt |
1 | Deutschland |
2 | Deutschland (Ost) |
3 | Deutschland (West) |
4 | Österreich |
5 | Schweiz |
6 | Luxemburg |
Literatur
- Bubenhofer, Noah, Marek Konopka & Roman Schneider. 2014. Präliminarien einer Korpusgrammatik. Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache, Bd. 4. Tübingen: Narr. Unter Mitwirkung von Caren Brinckmann, Katrin Hein und Bruno Strecker.
- Kupietz, Marc, Cyril Belica, Holger Keibel & Andreas Witt. 2010. The German reference corpus DeReKo: A primordial sample for linguistic research. In Nicoletta Calzolari, Khalid Choukri, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel Tapias (Hgg.), Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), 1848-1854. Valletta: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2010/pdf/414_Paper.pdf (abgerufen am 27.8.2021).