Korpus des Projekts Korpusgrammatik
Das Untersuchungskorpus des Projekts (KoGra-Untersuchungskorpus, KoGraUK) ist ein Ausschnitt des Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010), Release 2017-II.
Es ist hinsichtlich bestimmter Dokumentmetadaten (Land, Region, Register, Medium, Domäne) vervollständigt und stratifiziert (Bubenhofer/Konopka/Schneider 2014, Kap. 1).
Dokumente | 23 Mio. | (23.057.608) |
Wörter | 5,8 Mrd. | (5.815.846.039) |
Tokens | 7 Mrd. | (7.042.307.080) |