Datenbank attributive Adjektive

Der Datensatz attributive_Adjektive_1 dient der Untersuchung zweier Variationsphänomene. Das erste Variationsphänomen ist das Schwanken zwischen schwacher und starker Flexion des zweiten Adjektivs in einer artikellosen Nominalphrase im Dativ Singular Maskulinum oder Neutrum: mit hohem finanziellen Aufwand vs. mit hohem finanziellem Aufwand. Das zweite Variationsphänomen betrifft die Reihenfolge der Adjektive untereinander (bei trockenem[,] warmem Wetter vs. bei warmem[,] trockenem Wetter).

Gesucht wurde in einem Ausschnitt von ca. 122 Mio. Tokens aus dem DEREKO die Abfolge

PräpositionØerstes Adjektiv mit Endung -emØØzweites Adjektiv mit Endung -em oder -enNomen
Adverb,Adverb

Der Datensatz enthält 1809 Sätze und nach dem Aussortieren von Fehlbelegen noch 1598 einschlägige Belege.

Wortgruppen, die diesem Muster entsprechen würden, sind etwa:

  • mit ziemlich langem, beinahe schwarzem/schwarzen Haar
  • mit ziemlich langem schwarzem/schwarzen Haar
  • mit langem, schwarzem/schwarzen Haar
  • mit langem schwarzem/schwarzen Haar

Die Tabellenspalten im Einzelnen:

SpalteÜberschriftBeschreibungVorkommende Werte
ARandomZufallszahl (Reihenfolgenstudie: dient der Teilung des Datensatzes in zwei Hälften)Bei einschlägigen Belegen (vgl. Spalte AU) natürliche Zahlen 1 bis 1598
BKandidat-ADJAngabe, welches der beiden Adjektive in der Reihenfolgenstudie als Kandidat zufällig gewählt wurde1 (linkes Adjektiv), 2 (rechtes Adjektiv)
CPOS1Die abhängige Variable in der Reihenfolgenstudie: Angabe, ob der Kandidat an erster Stelle (links) steht0 (nein), 1 (ja)
DSilbDiff.Kand-KonkSilbenzahl (vgl. Spalten BE, BF) des Kandidaten minus Silbenzahl des Konkurrenten in der ReihenfolgenstudieGanze Zahlen -6 bis 8
ECprobDiff.Kand-KonkBedingte Wahrscheinlichkeit (vgl. Spalten CF, CL), dass der Kandidat auftritt, minus bedingte Wahrscheinlichkeit, dass der Konkurrent auftritt, in der Reihenfolgenstudie-0,59 bis 0,59
FFreqDiff.Kand-KonkDeReWo-Frequenzklasse (vgl. Spalten BJ, BK) des Kandidaten minus DeReWo-Frequenzklasse des Konkurrenten in der ReihenfolgenstudieGanze Zahlen -12 bis 12
GKand.SemaSemantische Klasse (2-Klassen-System, vgl. Spalten AP, AQ) des Kandidaten in der Reihenfolgenstudieint (intersektiv), non (nicht intersektiv)
HKand.SemSemantische Klasse (11-Klassen-System, vgl. Spalten AN, AO) des Kandidaten in der Reihenfolgenstudieart-dem, art-indef, ordi, quali-farb, quali-rel, quali-sonst, ref-lok, ref-temp, rel-ber, rel-geo, rel-material (eine elfte Klasse, die nicht vorkam, wären Determinierer gewesen), u (nicht einzuordnen)
IKand.PartAngabe, ob der Kandidat ein Partizip istlex (lexikalisiertes Partizip), nolex (nicht lexikalisiertes Partizip), nein (kein Partizip)
JKand.AdvAngabe, ob der Kandidat durch ein Adverb erweitert ist (vgl. Spalten AF, AI) 0 (nein), 1 (ja)
KKand.LemmaLemma des Kandidaten (ersatzweise: Stamm)abgerundet bis zweit
LKand.CprobBedingte Wahrscheinlichkeit (vgl. Spalten CF, CL), dass der Kandidat auftritt0 bis 0,60
MKonk.SemaSemantische Klasse (2-Klassen-System, vgl. Spalten AP, AQ) des Konkurrenten in der Reihenfolgenstudieint (intersektiv), non (nicht intersektiv)
NKonk.SemSemantische Klasse (11-Klassen-System, vgl. Spalten AN, AO) des Konkurrenten in der Reihenfolgenstudieart-dem, art-indef, ordi, quali-farb, quali-rel, quali-sonst, ref-lok, ref-temp, rel-ber, rel-geo, rel-material (eine elfte Klasse, die nicht vorkam, wären Determinierer gewesen), u (nicht einzuordnen)
OKonk.PartAngabe, ob der Konkurrent ein Partizip istlex (lexikalisiertes Partizip), nolex (nicht lexikalisiertes Partizip), nein (kein Partizip)
PKonk.AdvAngabe, ob der Konkurrent durch ein Adverb erweitert ist (vgl. Spalten AF, AI)0 (nein), 1 (ja)
QKonk.LemmaLemma des Konkurrenten (ersatzweise: Stamm)abgelebt bis zwölftägig
RKonk.CprobBedingte Wahrscheinlichkeit (vgl. Spalten CF, CL), dass der Konkurrent auftritt0 bis 0,60
SIndexBelegnummer1 bis 1809
TZeitungSigle der Zeitung, aus der der Beleg stammtA bis Z
USigleTextsigleA00/APR.25746 bis Z98/811.06588
VQuelleQuelltyp1 bis 12
WDomainInhaltliche Domäne, die dem Text zugeordnet wurdeFiktion, Kultur_Unterhaltung, Mensch_Natur, NA (= keine Angabe), Politik_Wirtschaft_Gesellschaft, Technik_Wissenschaft
XMediumMedium, aus dem der Text stammtBuecher_Fachzeitschriften, Gesprochenes, Publikumspresse, Sonstiges
YLandLand, aus dem der Text stammtA (Österreich), CH (Schweiz), D (Deutschland), LU (Luxemburg)
ZRegionRegion, aus der der Text stammtMittelost, Mittelsued, Mittelwest, NA (keine Angabe), Nordost, Nordwest, Suedost, Suedwest, Ueberregional
AARegisterRegister, das dem Text zugeordnet wurdeGebrauchstext, Literarisch, Pressetext
ABJzJahrzehnt, in dem der Text erschienen ist1990er, 2000er, 2010er, vor_1990
ACJahrJahr, in dem der Text erschienen ist1942 bis 2014
ADVorSatzkontext vor der Präpositionalphrase, die dem Suchmuster entsprichtFreitext
AEAPPRPräpositionan bis zwischen
AFADV1Adverb, das das erste Adjektiv modifiziert 0 (kein Adverb); äußerst bis zunächst
AGADJA1Erstes attributives Adjektivabgelebtem bis zwölftägigem
AHKommaKomma zwischen den beiden Adjektiven0 (kein Komma), 1 (Komma)
AIADV2Adverb, das das zweite Adjektiv modifiziert (oder Konjunktion, was eine Wertung als „nicht valide“ zur Folge hat)0 (kein Adverb); aber bis zusammen
AJADJA2Zweites attributives Adjektivaberwitzigen bis zwiespältigen
AKNNNomen (Kern der Nominalphrase)Abendessen bis Zwischenstopp
ALNachSatzkontext nach der Präpositionalphrase, die dem Suchmuster entsprichtFreitext
AMFlexionStarke/schwache Flexion des zweiten Adjektivsm (stark), n (schwach)
ANSem1Semantische Klasse (11-Klassen-System) des ersten Adjektivsart-dem (Adjektiv, das einem Demonstrativum nahekommt: einige), art-indef (Adjektiv, das einem Indefinitum nahekommt: besagt), ordi (Ordinalzahladjektiv: zweite), quali-farb (Farbadjektiv: rot), quali-rel (ursprünglich qualitatives Adjektiv in relationaler Lesart, vgl. stark in starke Raucherin), quali-sonst (sonstiges qualifizierendes Adjektiv wie groß), ref-lok (referenzielles Adjektiv mit lokalem Bezug: hiesig, dortig), ref-temp (referenzielles Adjektiv mit temporalem Bezug: gestrig, damalig), rel-ber (Zugehörigkeitsadjektiv, das weder eine geografische Herkunft noch eine materielle Beschaffenheit bezeichnet: finanziell), rel-geo (Zugehörigkeitsadjektiv, das eine geografische Herkunft oder Zugehörigkeit bezeichnet: sächsisch), rel-material (Adjektiv, das eine materielle Beschaffenheit bezeichnet: hölzern); eine elfte Klasse, die nicht vorkam, wären Determinierer gewesen; u (nicht einzuordnen)
AOSem2Semantische Klasse (11-Klassen-System) des zweiten Adjektivsvgl. Spalte AN
APSema1Semantische Klasse (2-Klassen-System) des ersten Adjektivsint (intersektiv, d. h. schnittmengenbildend wie schweizerisch), non (nicht intersektiv: subsektiv wie groß, privativ wie ehemalig)
AQSema2Semantische Klasse (2-Klassen-System) des zweiten Adjektivsvgl. Spalte AP
ARUnd„und“-Test-Ergebnis0 (zwischen die beiden Adjektive lässt sich nicht ohne Bedeutungsveränderung die Konjunktion und einschieben), 1 (zwischen die beiden Adjektive lässt sich und einschieben), 2 (zwischen die beiden Adjektive lässt sich und zwar, das heißt oder nämlich einschieben)
ASTauschTauschtestergebnis0 (die beiden Adjektive lassen sich nicht tauschen, ohne dass sich die Bedeutung ändert oder die Reihenfolge markiert klingt), 1 (die Adjektive lassen sich tauschen)
ATPart2Angabe, ob das zweite Adjektiv ein Partizip ist bzw. aus einem Partizip gebildet wurde; vgl. Spalte BOnein (kein Partizip), lex (lexikalisiertes Partizip: gewagt), nolex (nicht lexikalisiertes Partizip: gackernd)
AUvalideAngabe, ob der Beleg einschlägig ist0 (Fehlbeleg), 1 (einschlägiger Beleg), CONJ (Beleg wurde nicht als einschlägig gewertet, weil zwischen den beiden Adjektiven eine Konjunktion steht)
AVAnno_ADJA1Automatische Annotation (POS: TreeTagger, morphosyntaktische Merkmale: Marmot) des ersten AdjektivsLemma/POS/morphosyntaktische Merkmale
AWStamm_A1Stamm des ersten Adjektivsabgelebt bis zwölftägig
AXStamm_A2Stamm des zweiten Adjektivsabgerundet bis zweckorientiert
AYStamm_NStamm des NomensAppeal bis Zoom
AZAnno_ADV2Automatische Annotation (POS: TreeTagger, morphosyntaktische Merkmale: Marmot) des Adverbs, das das zweite Adjektiv modifiziertLemma/POS/morphosyntaktische Merkmale
BAAnno_ADJA2Automatische Annotation (POS: TreeTagger, morphosyntaktische Merkmale: Marmot) des zweiten AdjektivsLemma/POS/morphosyntaktische Merkmale
BBAnno_NNAutomatische Annotation (POS: TreeTagger, morphosyntaktische Merkmale: Marmot) des NomensLemma/POS/morphosyntaktische Merkmale
BCSilb1Silbenzahl des ersten Adjektivs (ohne Flexionsendung) nach CELEX1 bis 6
BDSilb2Silbenzahl des zweiten Adjektivs (ohne Flexionsendung) nach CELEX1 bis 6
BESilb1.neuSilbenzahl des ersten Adjektivs (inklusive Flexionsendung) nach einem Algorithmus, der bis auf einige Ausnahmen pro Vokal eine Silbe zählt2 bis 8
BFSilb2.neuSilbenzahl des zweiten Adjektivs (inklusive Flexionsendung) nach einem Algorithmus, der bis auf einige Ausnahmen pro Vokal eine Silbe zählt2 bis 10
BGDifferenzSilb2 (Spalte BD) minus Silb1 (Spalte BC)-4 bis 4; NA (keine Angabe)
BHDifferenz3Werte aus Spalte BG, umcodiert auf 4 verschiedene Wertepositiv, negativ, 0, NA (keine Angabe)
BIDifferenz.neuSilb2.neu (Spalte BF) minus Silb1.neu (Spalte BE)-5 bis 8
BJFrequ1DeReWo-Frequenzklasse des ersten Adjektivlemmas6 (eher häufig) bis 20 (eher selten); NA (keine Angabe)
BKFrequ2DeReWo-Frequenzklasse des zweiten Adjektivlemmas6 (eher häufig) bis 21 (eher selten); NA (keine Angabe)
BLFrequNNDeReWo-Frequenzklasse des Nomenlemmas5 (eher häufig) bis 23 (eher selten)
BMNN_m_MitteAnzahl von /m/ in der Mitte des Nomens (<mm> als ein /m/ gezählt, <m> oder <mm> am Ende des Nomens nicht gezählt)0, 1, 2 (Sommerhimmel)
BNNN_m_EndeAngabe, ob das Nomen auf /m/ endet oder nicht0 (nein), 1 (ja)
BOPart 1Angabe, ob das erste Adjektiv ein Partizip ist bzw. aus einem Partizip gebildet wurde; vgl. Spalte ATnein (kein Partizip), lex (lexikalisiertes Partizip: gewagt), nolex (nicht lexikalisiertes Partizip: gackernd)
BPSem12Kombination semantischer Klassen nach dem 11-Klassen-System (Verkettung des Wertes aus Spalte AN mit dem Wert aus Spalte AO)art-demordi bis urel-geo
BQSema12Kombination semantischer Klassen nach dem 2-Klassen-System (Verkettung des Wertes aus Spalte AP mit dem Wert aus Spalte AQ)intint (intersektiv + intersektiv), intnon (intersektiv + nicht intersektiv), nonint (nicht intersektiv + intersektiv), intnon (intersektiv + nicht intersektiv)
BRPart12Kombination von Wortbildungsarten nach dem Kriterium „Partizip oder nicht“ (Verkettung des Wertes aus Spalte BO mit dem Wert aus Spalte AT)lexlex, lexnein, lexnolex, neinlex, neinnein, neinnolex, nolexlex, nolexnein, nolexnolex
BSSem1Num6Wert des ersten Adjektivs bei der Einteilung in 6 Distanzklassen1 (nahe am Nomen, tendenziell also rechts) bis 6 (entfernt vom Nomen, tendenziell also links): 1 Zugehörigkeitsadjektive (einschließlich solcher, die die geografische Herkunft bezeichnen); 2 Ordinalzahl- und Farbadjektive (wobei die Stellung der Ordinalzahladjektive so nahe am Nomen eine Besonderheit des vorliegenden Datensatzes ist), 3 relationale und sonstige qualifizierende Adjektive, 4 referenzielle Adjektive mit lokalem Bezug, 5 referenzielle Adjektive mit temporalem Bezug, 6 Adjektive, die Demonstrativa oder Indefinita nahekommen
BTSem2Num6Wert des zweiten Adjektivs bei der Einteilung in 6 Distanzklassenvgl. Spalte BS
BUSemDist6Sem1Num6 (Spalte BS) minus Sem2Num6 (Spalte BT)-1 bis 5; NA (keine Angabe)
BVSemDistWerte von Spalte BU, umcodiert auf 4 verschiedene Wertenull, negativ, positiv, NA (keine Angabe)
BWFreqDiffFrequenzklasse des zweiten Adjektivs Frequ2 (Spalte BK) minus Frequenzklasse des ersten Adjektivs Frequ1 (Spalte BJ)-8 bis 12; NA (keine Angabe)
BXFrequDiff3Werte aus Spalte BW, umcodiert in 4 verschiedene Wertenegativ, null, positiv, NA (keine Angabe)
BYADVAngabe, ob das erste oder das zweite Adjektiv durch ein Adverb erweitert istADV1, ADV2, (Leere)
BZAnfang_FuellungAngabe, ob Spalte AD gefüllt ist0 (nein), 1 (ja)
CAGenusGenus des Nomensn (Neutrum), m (Maskulinum), NA (keine Angabe)
CBN.lemma.condprobNomenlemma (hilfsweise: Nomenstamm)Abendessen bis Zwischenstopp
CCadj1.lemma.condprobLemma (hilfsweise: Stamm) des ersten Adjektivsachtjährig bis zwölftägig
CDf_ADJ1_NVorkommen des ersten Adjektivs als einziges attributives Adjektiv zum betreffenden Nomen im gesamten KoGra-Untersuchungskorpus (ca 7 Mrd. Tokens)0 bis 183.093
CEf_NVorkommen des Nomens im gesamten KoGra-Untersuchungskorpus (ca 7 Mrd. Tokens)1 bis 16.722.239
CFf_ADJ1|NBedingte Wahrscheinlichkeit, dass das erste Adjektiv auftritt: Wert aus Spalte CD geteilt durch Wert aus Spalte CE0 bis 0,43
CGf_ADJ1N_/NWert aus Spalte CF in anderem Zahlenformat0 bis 0,43
CHadj2.lemma.condprobLemma (hilfsweise: Stamm) des zweiten Adjektivsadlig bis zeitlich
CIf_ADJ2_NVorkommen des zweiten Adjektivs als einziges attributives Adjektiv zum betreffenden Nomen im gesamten KoGra-Untersuchungskorpus (ca 7 Mrd. Tokens)0 bis 30.830
CJf_N(identisch mit Spalte CE)(identisch mit Spalte CE)
CKf_ADJ2|NBedingte Wahrscheinlichkeit, dass das zweite Adjektiv auftritt: Wert aus Spalte CI geteilt durch Wert aus Spalte CE0 bis 0,29
CLf_ADJ2/NWert aus Spalte CK in anderem Zahlenformat0 bis 0,29
CMf_ADJ_N_diffWert aus Spalte CK (bedingte Wahrscheinlichkeit, dass das zweite Adjektiv auftritt) minus Wert aus Spalte CF (bedingte Wahrscheinlichkeit, dass das erste Adjektiv auftritt)-0,42 bis 0,29
CNBedingte_Wahrscheinlichkeit_positivAngabe, ob der Wert aus Spalte CM positiv istFALSCH, WAHR

Zum Text

Autor(en)
Franziska Münzberg
Bearbeiter
Jana Mathy
Letzte Änderung
Aktionen
Seite merken
Seite als PDF
Seite drucken
Seite zitieren
Seite teilen