StatusMeeting15Nov2001
--
IngoSchroeder - 15 Nov 2001
Datum: 15/11/2001 14.00 Uhr
Anwesende: Wolfgang, Kilian, Jochen und Ingo
Kilian
- Wortfeld "erwerben" beackert
o Firmen erwerben Firmen,
o Kunden erwerben Produkte
o Firmen erwerben Patente/Rechte
o Abschluß/Fähigkeiten erwerben
- ähnlich zu "übernehmen"
- Schreiben des parseVerify() kommt als nächstes.
Wolfgang
- Wortfeld "kaufen" flüchtig angeschaut
Jochen
- Festgebissen an TBL-Tagger
o unbefriedigende Ergebnisse
o noch keine Behandlung von unbekannten Worten
o Warum eigentlich Brill-Tagger?
* vermeintlich einfach
* bekanntes Paradigma
o fnTBL Toolkit wahrscheinlich besser geeignet für das Lernen
- WG-Tagging: Eingabe von Wortgraphen an Stelle von Wortsequenzen
o Christer Samuelsson: HMM-basiertes Modell
-> mathematisch schwer
- Mapping CDG-Tags <-> STTS-Tags
o kein Trainingsmaterial mit CDG-Tags verfügbar!
o Mapping auf Trainingsdaten oder Ausgabedaten
o Weg des geringsten Widerstandes:
Tagging mit beliebigen Taggers -> Abbildung auf CDG-Tags
- Brill-Tagger können auch Wahrscheinlichkeiten ausgeben
(Ingo: Ngai Paper)
- Interface klären!
o Wie redet der Tagger mit dem CDG-System?
- Parsing-Experimente
o Upper bounds abschätzen (perfekter Tagger)
o Tag-Mehrdeutigkeit auf unserem Corpus messen
* Wie hoch ist durchschnittliche Mehrdeutigkeit pro Wort?
* Corpus-Entropie
- In diesem Kontext, aber nicht Inhalt von Jochens Arbeit:
o Tagging, Chunking, PSG-Parsing als Sequenz von
immer mächtigerer Information
o Römer: Tagging, Chunking -> Dependenzparsing für Chunks
o CDG-Experiment: Können wir einen NP-Chunker mit CDG bauen?
- Nächste Schritte (in dieser Reihenfolge):
o Mapping (1 Tag)
o Upper bound bestimmen (2 Tage)
o Corpus-Entropie bestimmen (1 Tag)
o Konzeption Interface (1 Tag)
o Implementation Interface (1 Woche)
o Auswahl Tagger und Anpassung an Interface (3 Tage)
o Erste Experimente mit Parser+Tagger
Ingo
- Speech