Bibliografie zur deutschen Grammatik

 


Eintrag

Titel
Automatische Identifizierung und Annotierung von Negation in Texten
Personen
Alexandra Klein
Jahr
2013
Typ
Hochschulschrift
Verlag
Ort
URI
http://www.ub.tuwien.ac.at/diss/AC10774684.pdf
Schlagwörter
Computerlinguistik
Negation
Abstract
Bei der Entwicklung von Verfahren zur Informationsextraktion, zum Information Retrieval und zum Text Mining wird Negation, also die Möglichkeit, dass im Text vorkommende Begriffe oder Zusammenhänge verneint werden, bislang kaum beachtet. Objekte und Relationen zwischen Objekten können zwar in vielen Fällen domänenabhängig und auf der Basis von Hintergrundwissen korrekt identifiziert und kategorisiert werden. In der Informationsextraktion, bei der es zumeist darum geht, Templates zu füllen, werden auch größere Zusammenhänge in Texten gefunden, sofern sie mit den vorgegebenen Templates korrespondieren. Beinahe all diesen Ansätzen liegt jedoch eine vereinfachende Sicht der Information zugrunde: Begriffe, Konzepte, Relationen und Zusammenhänge werden als in Texten entweder vorhanden oder nicht vorhanden betrachtet. Sind sie vorhanden, so werden sie weiterverarbeitet; sind sie nicht vorhanden, so wird der Text oder Textabschnitt ignoriert. Dass ein wichtiger Sachverhalt durch Negation ausgedrückt werden kann, wird dabei zumeist ausgeklammert. Das führt dazu, dass alle vorkommenden Objekte und Relationen auf dieselbe Weise verarbeitet werden, auch wenn einige von ihnen negiert in Texten auftreten. Als Resultat werden Informationen präsentiert oder weiterverarbeitet, die eben nicht zutreffend sind. Die wenigen Ansätze, die Negation einbeziehen, weitgehend im medizinischen Bereich und in der Sentiment-Analyse, konzentrieren sich bisher aufgrund ihrer spezifischen Anwendung zumeist auf eine extrem eingeschränkte Sicht der Bedeutung und somit des Auftretens von Negation. Sätze oder Teilsätze, die negierte Bestandteile enthalten, werden in der Verarbeitung ausgefiltert. Es wird in der Regel nicht versucht, Art und Skopus der Negation genauer zu bestimmen und im Text zu annotieren. Gerade diese beiden Aspekte beschäftigen jedoch traditionell Linguistik und Sprachphilosophie, sodass zu Bedeutung und Realisierung von Negation vielfältige theoretische und empirische Erkenntnisse vorliegen, die bisher nicht in der maschinellen Verarbeitung genutzt werden, die aber Hinweise bei der automatischen Identifikation von Negation geben können. Diese Arbeit beschreibt ein Modul zur automatischen Identifizierung und Annotierung von Negation und ihren Kontexten und Funktionen in Texten. Die Einbeziehung von negierter Information soll zu einer differenzierteren Sicht von Textinhalten beitragen, was bessere Ergebnisse in Anwendungen wie Information Retrieval, Informationsextraktion und Text Mining erwarten lässt. Als Beispieldomäne werden deutschsprachige Zeitungstexte gewählt. Ausgehend von einer Anwendung, bei der mit frei formulierten natürlichsprachlichen Äußerungen nach passenden Zeitungstexten in einem Korpus gesucht werden kann, wurde zunächst eine empirische Studie durchgeführt, bei der Negation, ihre Kontexte und Funktionen manuell annotiert wurden. Ausgehend von dieser Analyse wurde eine Klassifikation der Negation und ihrer Funktionen entwickelt. Diese Klassifikation wiederum dient als Basis für ein Modul zur Identifikation und Klassifikation von Negation. Die Ergebnisse der automatischen Analyse wurden auf zwei Korpora evaluiert. Es zeigt sich, dass ein hoher Anteil der vorkommenden Negationen auch in Texten, die vorher nur maschinell vorverarbeitet und nicht manuell bearbeitet worden sind, korrekt erkannt und klassifiziert werden.

https://grammis.ids-mannheim.de/bdg/79903