Ressourcen

Die folgenden Seiten präsentieren Forschungsressourcen und Werkzeuge, die im IDS-Projekt Korpusgrammatik des Deutschen genutzt werden.

Zum einen handelt es sich dabei um Datensammlungen. Sie bestehen aus einschlägigen Korpusbelegen, die durchgängig nach relevanten sprachlichen Eigenschaften (auf verschiedenen linguistischen Beschreibungsebenen) und außerlinguistischen Merkmalen (Metadaten wie Register, Region usw.) annotiert sind. Mit den 1.598 Belegen in der Datenbank attributiver Adjektive (in der linken Spalte auch zu finden unter Ressourcen zur Korpusgrammatik des Deutschen), die während der laufenden Arbeiten an der Korpusgrammatik entstanden ist, lassen sich Hypothesen zur Adjektivflexion und -reihenfolge überprüfen. Die beiden anderen Datenbanken ergaben sich bereits als Ergebnisse von Pilotstudien zur Korpusgrammatik (in der linken Spalte auch zu finden unter Datensätze zu Pilotstudien). In der Genitivdatenbank (GenitivDB) finden sich ca. 9,5 Millionen Belege zur Genitivmarkierung des Nomens. Die Datenbank zu den zu-/dass-Komplementen enthält 7.685 Belege zur Alternation zwischen Satzkomplementen, die mit zu (infinit), und solchen, die mit dass (finit) eingeleitet werden.

Zum anderen finden sich hier Zugänge zu der in der freien Grafik- und Statistiksoftware R programmierten Schnittstelle KoGra-R, mit der vordefinierte statistische Auswertungen durchgeführt werden können, und zu dem Tutorial zur Visualisierung linguistischer Daten in R.

Weitere Materialien werden im Fortgang des Projekts entstehen und hier zugänglich gemacht werden.

Zum Text

Letzte Änderung
Aktionen
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen