Zeitausdrücke
Die Kodierung "Zeitausdruck" deckt eine Vielzahl heterogener Fälle ab, die sich nicht ohne weiteres auseinanderhalten lassen (u.a. Wochentage, Monatsnamen, substantivierte Temporaladverbien etc.). Da der Vergleich mit der Menge der Nicht-Zeitausdrücke sowie der "regulären" Appellativa aber dennoch hochsignifikant (Chi-Quadrat-Test: p = 0,0004998; Pearson Residuen für die Häufigkeiten der verschiedenen Endungsvarianten bei Zeitausdrücken (gegenüber regulären Appellativen): Nullendung: 327,4; Apostroph: 96,72; overte Markierung: -47,58) ausfällt, soll auch diese Kategorie hier Erwähnung finden. Zur genaueren Einschätzung der Einzelfälle müssten noch weiterführende Untersuchungen erfolgen, die allerdings feinkörnigere Unterscheidungen bei der Annotation des Korpus voraussetzen (bzw. auf alternative semiautomatische Methoden wie Listen etc. aufbauen könnten).
Nullendung | Apostroph | overte Markierung | Token insgesamt | |
Zeitausdruck | 9.806 (25,8%) | 145 (0,4%) | 28.082 (73,8%) | 38.032 |
kein Zeitausdruck | 457.915 (6,5%) | 10.421 (0,1%) | 6.540.068 (93,3%) | 7.008.404 |
reg. Apperllative | 52.938 (1,7%) | 34 (0,001%) | 3.031.047 (98,3%) | 3.084.018 |
Tabelle 1: Häufigkeit endungsloser Formen: Zeitausdrücke vs. Appellative