HiWi-Meeting, 08.05.2003
Anwesend: Olga, Daniel, Lidia, Timo, Micha, Kilian, Othello
Daniel:
- Daniel war und ist dabei lexikalische Fehler zu korrigieren.
- Fehlerrate reduziert von ca. 600 auf ca. 300.
- Viele Fehler (ca. 100) entstehen durch falsche Klassifikation von Waehrungen, dies soll nun direkt in den Gold-Saetzen geaendert werden.
- Die gemachten Fehler teilen wir uns mit den Negra-Leuten im Verhaeltnis 50:50.
- Kilian baut Daniel eine Erweiterung in den Emacs zum schnelleren Bearbeiten der lexikalischen Fehler.
- Probleme sind beim Einloggen von zu Hause aus entstanden, also --> immer auf der nats42 arbeiten.
Lidia:
- Lidia hat sich viel mit Perl beschaeftigt.
- Wird jetzt den Uebersetzer fuer die Adjektive bauen.
- Die Input-Datei fuer die Adjektive besteht ja bereits.
Olga:
- Olga hat von Othello eine Einfuehrung in das Arbeiten am negra2cdg bekommen.
- Hat bereits die ersten Regeln fuer Label-Fehler geschrieben.
- Micha hat noch einige Ungereimtheiten bei den Adverben gefunden, die Olga noch beheben wird.
Othello:
- Hat mit Olga das negra2cdg durchgesprochen.
- Hat weitere Regeln fuer die Behebung von Label-Fehlern und fuer Strukturaenderungen im Postprocessing geschrieben.
- Die Unterscheidung von OBJP und PP ist im Postprocessing zur Zeit nicht zu machen, weil hier mit Perl auf ein C-Array zugegriffen werden muesste. Das ist uns hier zu aufwendig, weshalb sich Kilian noch was anderes einfallen laesst.
- Wird sich weiter um Strukturfehler kuemmern und Olga helfen.
Timo:
- Timo kommt mit dem Tagger gut voran und hat Erfolgserlebnisse am laufenden Band.
- Die Kommentierung fehlt aber noch und das Ganze muss noch zum Laufen gebracht werden.
- Angedacht ist erst mal eine if...then...else Loesung fuer die Integration des neuen Taggers, damit auch der alte Tagger noch solange laufen kann bis wirklich alle Abhaengigkeiten entsprechend veraendert wurden.
Micha:
- Micha hat seinen Oberseminarvortrag vorbereitet, den er heute praesentierte.
- Hat Fehler im Deutsch-Lexikon gefixed.
Kilian:
- Kilian bereitet seinen Oberseminarvortrag vor.
- Hat am Lexikon gearbeitet.
- Kilian wird sich jetzt mit der Adverb-Klassifikation beschaeftigen.
Generelles:
- Alle sollen fleissiger das CVS benutzen, auch kleinere Aenderungen veroeffentlichen, aber nur lauffaehige Versionen einchecken. Ausserdem soll immer und viel in den CVS-log geschrieben werden.
- Woechentlich kommt jetzt der CVS-log ueber die PaPa-Mailinglist.
- Es gibt neue Corpora in Englisch, die wir uns auch mal anschauen koennen. Jede Menge Banker-Wissen...
- Die Idee einer gemeinsamen Doku fuer saemtliche Grammatik-tools konnte sich nicht durchsetzen. Statt dessen soll jedes einzelne tool entsprechend ausfuehrlich dokumentiert werden.
Protokoll: Othello