Korpus des Projekts Korpusgrammatik
Das Untersuchungskorpus des Projekts (KoGra-Untersuchungskorpus, KoGraUK) ist ein Ausschnitt des Deutschen Referenzkorpus DeReKo (Kupietz et al. 2010), Release 2017-II.
Es ist hinsichtlich bestimmter Dokumentmetadaten (Land, Region, Register, Medium, Domäne) vervollständigt und stratifiziert (Bubenhofer/Konopka/Schneider 2014, Kap. 1).
| Dokumente | 23 Mio. | (23.057.608) |
| Wörter | 5,8 Mrd. | (5.815.846.039) |
| Tokens | 7 Mrd. | (7.042.307.080) |
