Zusammensetzung des Korpus
Stratifikation nach den Kategorien Land, Region, Register, Medium, Domäne und Jahr. Beschrieben in Bubenhofer et al. (2014, Kap. 1).
Land
LAND | TOKENS | % | |
Luxemburg | 30 Mio. | (30.133.931) | 0,42 |
Schweiz | 558 Mio. | (557.936.030) | 7,92 |
Österreich | 884 Mio. | (884.161.405) | 12,55 |
Deutschland | 5570 Mio. | (5.570.075.714) | 79,09 |
Region
REGION | TOKENS | % | |
Unbekannt | 7,7 Mio. | (7.721.852) | 0,11 |
Mittelost | 58 Mio. | (58.284.034) | 0,83 |
Mittelsüd | 426 Mio. | (425.537.986) | 6,04 |
Nordwest | 600 Mio. | (600.288.002) | 8,52 |
Südwest | 633 Mio. | (633.078.629) | 8,99 |
Nordost | 882 Mio. | (882.004.919) | 12,52 |
Überregional | 1225 Mio. | (1.225.366.816) | 17,40 |
Südost | 1437 Mio. | (1.437.031.783) | 20,41 |
Mittelwest | 1773 Mio. | (1.772.993.059) | 25,18 |
Register
REGISTER | TOKENS | % | |
Literarisch | 16 Mio. | (16.073.569) | 0,22 |
Gebrauchstext | 541 Mio. | (540.738.045) | 7,67 |
Pressetext | 6485 Mio. | (6.485.495.466) | 92,09 |
Medium
MEDIUM | TOKENS | % | |
Sonstiges | 12 Mio. | (12.191.687) | 0,19 |
Bücher / Fachzeitschriften | 20 Mio. | (19.522.595) | 0,27 |
Gesprochenes | 435 Mio. | (434.702.542) | 6,17 |
Publikumspresse | 6576 Mio. | (6.575.890.256) | 93,37 |
Inhaltliche Domäne
DOMÄNE | TOKENS | % | |
Fiktion | 18 Mio. | (18.010.889) | 0,25 |
Mensch / Natur | 135 Mio. | (135.183.306) | 1,91 |
Sonstiges | 318 Mio. | (318.009.642) | 4,52 |
Technik / Wissenschaft | 429 Mio. | (428.569.913) | 6,08 |
Kultur / Unterhaltung | 2792 Mio. | (2.792.316.523) | 39,65 |
Politik / Wirtschaft / Gesellschaft | 3350 Mio. | (3.350.171.807) | 47,57 |
Jahrzehnt
JAHRZEHNT | TOKENS | % | |
1950 | 1,4 Mio. | (1.390.822) | 0,02 |
1960 | 2,6 Mio. | (2.637.689) | 0,04 |
1970 | 2.1 Mio. | (2.142.666) | 0,03 |
1980 | 3,1 Mio. | (3.100.608) | 0,04 |
1990 | 1830 Mio. | (1.829.540.870) | 25,98 |
2000 | 3281 Mio. | (3.281.374.136) | 46,60 |
2010 | 1922 Mio. | (1.922.120.289) | 27,29 |