Korpusgrammatik

Annotationen

Das Korpus hat Annotationen für einzelne Tokens und Annotationen für Tokenspannen.

Tokenebene

N.B. Der Unterstrich _ kann in verschiedenen Ebenen als Annotation auftreten. Er bedeutet entweder „nicht annotiert“ oder „nicht zutreffend“

EBENE	ATTRIBUT(E)	TOOL
Wort(tokenisierung)	word	unitok, custom
Lemma	lemma	TreeTagger, SMOR, custom
Wortart (PoS)	tag	TreeTagger, SMOR, custom
Dependenz	depind, dephd, deprel	Mate
Eigennamen	ne	Stanford Core NLP
Komposita	scmp, sbaselemma, snonheads, slinks	SMOR, COW
Wortbildung	mtree, cpos, nodes, drvnodes, cmpnodes, affixes, topaffix, links, toplink, rules, toprule	Canoo, custom
morph. Merkmale	morph, mpos	MarMoT
Convenience	lc, lemma_lc	Manatee

Tokenspannen

BESCHREIBUNG	ELEMENT	TOOL
Dokument	doc	DeReKo base
Textblock	div	DeReKo base, custom
Satz	s	DeReKo base, custom
Phrasen	nx, px, adjx, ...	Berkeley Parser
Topologische Felder	vf, lk, mf, ...	Berkeley Parser

Zum Text

Schlagwörter

Korpus

Autor(en)

Felix Bildhauer

Bearbeiter

Kathleen Entz

Letzte Änderung

08. Juli 2020

Aktionen

Seite merken
Seite als PDF
Seite drucken
Seite zitieren

Seite teilen

Weiterführend

Projektinformation
Schlagwortwolke
Schlagwortliste

Impressum | Datenschutz | Zitierweise

Schneider, Roman / Lang, Christian (2022): Das grammatische Informationssystem grammis – Inhalte, Anwendungen und Perspektiven. In: Zeitschrift für germanistische Linguistik, 50(2). Berlin/Boston: de Gruyter, 407-427. https://doi.org/10.1515/zgl-2022-2060

@article{SchneiderLang2022,
title = {Das grammatische Informationssystem grammis – Inhalte, Anwendungen und Perspektiven},
author = {Roman Schneider and Christian Lang},
year = {2022},
journal = {Zeitschrift für germanistische Linguistik},
volume = {50},
number = {2},
pages = {407--427},
doi = {doi:10.1515/zgl-2022-2060}
}