Integration eines Wortklassifizierers in einen constraintbasierten Parser für natürliche Sprache
Autor: Jochen Hagenström
Betreuer: Prof. Wolfgang Menzel und Frank Schilder, Ph.D.
Abgabe: Oktober 2002
siehe auch:
DiplomJochenHagenstroem
Kurzbeschreibung: Diese Diplomarbeit dokumentiert und analysiert die Integration eines Wortklassifizierers (engl. part--of--speech--tagger, kurz Pos--Tagger) als Vorverarbeitungsstufe für ein mit gewichteten Constraints arbeitendes System zur Dependenzanalyse natürlicher Sprache ( engl. weighted constraint dependancy grammar parser, kurz: WCDG--Parser).
Die Klassifizierung von Worten ist ein wichtiger Bestandteil der Analyse natürlicher Sprache und kann mit relativ hoher Präzision und geringem Zeitaufwand vor der Dependenzanalyse durchgeführt werden. Im Mittelpunkt dieser Arbeit stehen zwei Fragen:
Kann der Parser qualitativ von der Vorverarbeitung profitieren? Wie wertvoll sind die zusätzlichen Informationen des Pos--Taggers für die Akkuratheit der vom WCDG--Parser erzeugten Analysen?
Kann der WCDG--Parser Sprache unter Verwendung der vom Pos--Tagger bereitgestellten Wortkategorien schneller analysieren?
Diese Arbeit untersucht verschiedene Integrationsmodelle und vergleicht diese auf ihre Tauglichkeit für das WCDG-System.