Zeitausdrucke
Die Kodierung "Zeitausdruck" deckt eine Vielzahl heterogener Falle ab, die sich nicht ohne weiteres auseinanderhalten lassen (u.a. Wochentage, Monatsnamen, substantivierte Temporaladverbien etc.). Da der Vergleich mit der Menge der Nicht-Zeitausdrucke sowie der "regularen" Appellativa aber dennoch hochsignifikant (Chi-Quadrat-Test: p = 0,0004998; Pearson Residuen fur die Haufigkeiten der verschiedenen Endungsvarianten bei Zeitausdrucken (gegenuber regularen Appellativen): Nullendung: 327,4; Apostroph: 96,72; overte Markierung: -47,58) ausfallt, soll auch diese Kategorie hier Erwahnung finden. Zur genaueren Einschatzung der Einzelfalle mussten noch weiterfuhrende Untersuchungen erfolgen, die allerdings feinkornigere Unterscheidungen bei der Annotation des Korpus voraussetzen (bzw. auf alternative semiautomatische Methoden wie Listen etc. aufbauen konnten).
Nullendung | Apostroph | overte Markierung | Token insgesamt | |
Zeitausdruck | 9.806 (25,8%) | 145 (0,4%) | 28.082 (73,8%) | 38.032 |
kein Zeitausdruck | 457.915 (6,5%) | 10.421 (0,1%) | 6.540.068 (93,3%) | 7.008.404 |
reg. Apperllative | 52.938 (1,7%) | 34 (0,001%) | 3.031.047 (98,3%) | 3.084.018 |
Tabelle 1: Haufigkeit endungsloser Formen: Zeitausdrucke vs. Appellative