Parsen von n002k023-1 mit und ohne Tagger


1. Parse n002k023-1 :

n002k023-1 : wenn, ich, da, so, meinen, Terminkalender, anschaue, das, sieht, schlecht, aus;
newnet n002k023-1 w/o using tagscore:
PROFILE: the search took 101160ms
INFO: the search took 147588 steps
--> zwei resultierende parses:

cdgp> verify parse2
WARNING: word `meinen': feature cat = FIN should be PPOSAT.
WARNING: word `Terminkalender': feature number = pl should be sg.
WARNING: subordination SYN: so-->5 should be SYN: so-->7
WARNING: subordination SYN: meinen-->0 should be SYN: meinen-->6
WARNING: subordination OBL2: meinen-->4 should be OBL2: meinen-->0
WARNING: subordination VORFELD: meinen-->4 should be VORFELD: meinen-->0
WARNING: subordination THEME: meinen-->4 should be THEME: meinen-->0
WARNING: subordination OBL1: Terminkalender-->0 should be OBL1: Terminkalender-->5
  structural labelled lexical strict
SYN: 81.82 81.82 72.73 72.73
OBL1: 90.91 90.91 81.82 81.82
OBL2: 90.91 90.91 81.82 72.73
OBL3: 100.00 100.00 81.82 81.82
OBL4: 100.00 100.00 81.82 81.82
VORFELD: 90.91 90.91 81.82 81.82
AGENT: 100.00 100.00 81.82 81.82
EXP: 100.00 100.00 81.82 81.82
PATIENT: 100.00 100.00 81.82 81.82
QUALITY: 100.00 100.00 81.82 81.82
THEME: 90.91 90.91 81.82 72.73
SUB: 100.00 100.00 81.82 81.82
overall: 95.45 95.45 81.06 79.55


cdgp> verify parse3
WARNING: word `meinen': feature cat = FIN should be PPOSAT.
WARNING: word `Terminkalender': feature number = pl should be sg.
WARNING: subordination SYN: so-->5 should be SYN: so-->7
WARNING: subordination SYN: meinen-->0 should be SYN: meinen-->6
WARNING: subordination OBL2: meinen-->4 should be OBL2: meinen-->0
WARNING: subordination VORFELD: meinen-->4 should be VORFELD: meinen-->0
WARNING: subordination THEME: meinen-->4 should be THEME: meinen-->0
WARNING: subordination OBL1: Terminkalender-->0 should be OBL1: Terminkalender-->5
  structural labelled lexical strict
SYN: 81.82 81.82 72.73 72.73
OBL1: 90.91 90.91 81.82 81.82
OBL2: 90.91 90.91 81.82 72.73
OBL3: 100.00 100.00 81.82 81.82
OBL4: 100.00 100.00 81.82 81.82
VORFELD: 90.91 90.91 81.82 81.82
AGENT: 100.00 100.00 81.82 81.82
EXP: 100.00 100.00 81.82 81.82
PATIENT: 100.00 100.00 81.82 81.82
QUALITY: 100.00 100.00 81.82 81.82
THEME: 90.91 90.91 81.82 72.73
SUB: 100.00 100.00 81.82 81.82
overall: 95.45 95.45 81.06 79.55

newnet n002k023-1 with using tagscore:

PROFILE: the search took 1060ms
INFO: the search took 9949 steps

INFO: net: id net4, wordgraph n002k023-1
#nodes 199, #edges 0
#evaluations
213150 unary, 0 statistics, 224799 binary
#values
min 1, max 25, total 827, average 4.16

1 resultierender parse:

cdgp> verify
  structural labelled lexical strict
SYN 100.00 100.00 100.00 100.00
OBL1 100.00 100.00 100.00 100.00
OBL2 100.00 100.00 100.00 100.00
OBL3 100.00 100.00 100.00 100.00
OBL4 100.00 100.00 100.00 100.00
VORFELD 100.00 100.00 100.00 100.00
AGENT 100.00 100.00 100.00 100.00
EXP 100.00 100.00 100.00 100.00
PATIENT 100.00 100.00 100.00 100.00
QUALITY 100.00 100.00 100.00 100.00
THEME 100.00 100.00 100.00 100.00
SUB 100.00 100.00 100.00 100.00
overall 100.00 100.00 100.00 100.00

Analyse der Resultate:
Der Parse unter Verwendung von Tagscores ist ca. 100 mal schneller und hat führt zu einem einzigen richtigen Parsingergebnis, während beide Parses, die ohne die Tagscores fehlerhaft sind.

Frage: Warum gibt es 2 identische Parsingresultate?

Die herausragende Rolle spielt hierbei das Wort 'meinen'. Dieses Wort wird als finites Verb interpretiert, obwohl es ein attribuierendes Possessivpronomen ist.

Der Tagger gewichtet die Wahrscheinlichkeit Possessivpronomenn zu Verb zugunsten des Pronomens mit 10:1. Diese Information hilft dem Parser entscheidend.


wenn KOUS 1.000000e+00
ich PPER 1.000000e+00
da KOUS 1.728453e-03 ADV
9.982715e-01
so ADV 1.000000e+00
meinen FIN 2.924091e-02 PPOSAT 9.683613e-01 INF 2.397740e-03
Terminkalender NN 1.000000e+00
anschaue FIN 1.000000e+00
das PROS 9.055809e-01 ARTDEF 8.597240e-02 PREL
5.524100e-03 PROSN 2.922554e-03
sieht FIN 1.000000e+00
schlecht ADJP 1.000000e+00
aus PTKVZS 1.000000e+00


Page Preferences

-- JochenHagenstroem - 25 Mar 2002
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback