Tagging des Stellingen-Korpus ohne stellingenspezifische Regeln


Diese Mappingtabelle erlaubt Tags die nicht im Stellingen-Korpus vorkommen

single tagging
accuracy : 92.512208
ambiguity : 1.187195


multimode (-z550):
accuracy : 97.721107
ambiguity : 1.954965

Kommandozeile:
Singletagging (linux-cluster):
~/Tagger/Corpus/Stellingen $ cat nf-n-200.annotation.tt| ~/dawai/cdg/utils/mapper.pl  -m ~/dawai/cdg/utils/simple_stts_stellingen_map -l /data/linux/opt/tnt/models/negra.tnt -c  | ~/Tagger/Tools/statistics.pl -f nf-n-200.annotation.tt

Multitagging (linux-cluster):
~/Tagger/Corpus/Stellingen $ cat nf-n-200.annotation.tt| ~/dawai/cdg/utils/mapper.pl  -z550 -m ~/dawai/cdg/utils/simple_stts_stellingen_map -l /data/linux/opt/tnt/models/negra.tnt -c  | ~/Tagger/Tools/statistics.pl -f nf-n-200.annotation.tt
Resultate auf dem Negra-Korpus:(zum Vergleich)
multitagging(ten fold validated, -z550)
accuracy : 99.3486154
ambiguity : 1.6921734

singletagging(ten-fold validated)
accuracy : 97.2683609
ambiguity : 1.3108328

diese resultate entstanden wie folgt.
  1. Das nergra-corpus 2.0 wurde 10 mal in unterschiedliche Test- und Trainingskorpora unterteilt:
    for I in 1 2 3 4 5 6 7 8 9 0; do cat negra-corpus.tt | ~/Tagger/Tools/CorpusTools.pl -s 10 -f $I -n negra; done;
  2. Zehn Sprachmodelle wurde trainiert:
    for I in 1 2 3 4 5 6 7 8 9 0; do /data/linux/opt/tnt/tnt-para negra-s10-f$I.train; done;
  3. Alle Testkorpora wurden vollständig getaggt.
    for I in 1 2 3 4 5 6 7 8 9 0; do /data/linux/opt/tnt/tnt -v0 ~/Tagger/Corpus/Negra/negra-s10-f$I ~/Tagger/Corpus/Negra/negra-s10-f$I.test | ~/Tagger/Tools/negra-statistics.pl -f ~/Tagger/Corpus/Negra/negra-s10-f$I.test >> tnt.out ; done;
  4. Die Ergebnisse wurden gemittelt:
    cat tnt.out | perl -e 'while(<>){if(m/accuracy\s+:\s(\S+)/){$a=$1;$i++,$aa+=$a}if(m/ambiguity\s+:\s(\S+)/){$b=$1; $ab+=$b}}$aa/=$i;$ab/=$i;print "mean accuracy: $aa, mean ambiguity $ab\n"'

Kommandozeile zum durchführen eines Taggingexperiments:
Single (linux-cluster):
/data/linux/opt/tnt/tnt -v0 ~/Tagger/Corpus/Negra/negra-s10-f5 ~/Tagger/Corpus/Negra/negra-s10-f5.test | ~/Tagger/Tools/statistics.pl -f ~/Tagger/Corpus/Negra/negra-s10-f5.test

Multi (linux-cluster):
/data/linux/opt/tnt/tnt -v0 -z550 ~/Tagger/Corpus/Negra/negra-s10-f5 ~/Tagger/Corpus/Negra/negra-s10-f5.test | ~/Tagger/Tools/statistics.pl -f ~/Tagger/Corpus/Negra/negra-s10-f5.test

Definition von precision, recall, f-measure, accuracy, ambiguity

Page Preferences

-- JochenHagenstroem - 20 Mar 2002
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback