UHH>Informatik>NatS>CDG Web>PapaMeetings>StatusMeeting15Nov2001 (17 Oct 2012, UnknownUser) Print version

StatusMeeting15Nov2001

-- IngoSchroeder - 15 Nov 2001

Datum: 15/11/2001 14.00 Uhr
Anwesende: Wolfgang, Kilian, Jochen und Ingo

Kilian
  - Wortfeld "erwerben" beackert
    o Firmen erwerben Firmen, 
    o Kunden erwerben Produkte
    o Firmen erwerben Patente/Rechte
    o Abschluß/Fähigkeiten erwerben
  - ähnlich zu "übernehmen"
  - Schreiben des parseVerify() kommt als nächstes.

Wolfgang
  - Wortfeld "kaufen" flüchtig angeschaut

Jochen
  - Festgebissen an TBL-Tagger
    o unbefriedigende Ergebnisse
    o noch keine Behandlung von unbekannten Worten
    o Warum eigentlich Brill-Tagger? 
      * vermeintlich einfach
      * bekanntes Paradigma
    o fnTBL Toolkit wahrscheinlich besser geeignet für das Lernen

  - WG-Tagging: Eingabe von Wortgraphen an Stelle von Wortsequenzen
    o Christer Samuelsson: HMM-basiertes Modell
      -> mathematisch schwer
    
  - Mapping CDG-Tags <-> STTS-Tags
    o kein Trainingsmaterial mit CDG-Tags verfügbar!
    o Mapping auf Trainingsdaten oder Ausgabedaten
    o Weg des geringsten Widerstandes:
      Tagging mit beliebigen Taggers -> Abbildung auf CDG-Tags

  - Brill-Tagger können auch Wahrscheinlichkeiten ausgeben
   (Ingo: Ngai Paper)

  - Interface klären!
    o Wie redet der Tagger mit dem CDG-System?

  - Parsing-Experimente
    o Upper bounds abschätzen (perfekter Tagger)
    o Tag-Mehrdeutigkeit auf unserem Corpus messen
      * Wie hoch ist durchschnittliche Mehrdeutigkeit pro Wort?
      * Corpus-Entropie

  - In diesem Kontext, aber nicht Inhalt von Jochens Arbeit:
    o Tagging, Chunking, PSG-Parsing als Sequenz von
      immer mächtigerer Information
    o Römer: Tagging, Chunking -> Dependenzparsing für Chunks
    o CDG-Experiment: Können wir einen NP-Chunker mit CDG bauen?

  - Nächste Schritte (in dieser Reihenfolge):
    o Mapping (1 Tag)
    o Upper bound bestimmen (2 Tage)
    o Corpus-Entropie bestimmen (1 Tag)
    o Konzeption Interface (1 Tag)
    o Implementation Interface (1 Woche)
    o Auswahl Tagger und Anpassung an Interface (3 Tage)
    o Erste Experimente mit Parser+Tagger 

Ingo
  - Speech

CDG

Navigation

Publications

NatsWiki
Main
User
Sandbox
System

Copyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback