Worte die im Negra-Korpus anders kategorisiert werden, als im Stellingen-Korpus


einfache Abbildungen für eindeutige Worte:

  • 'bißchen' wird im Stellingen-Korpus als immer ARTINDEF getaggt. Das Negra-Korpus kennt 'bißchen' als attributives Indefinitpronomen mit Artikel.
  • 'nicht' wird von der Stellingen-Grammatik als ADV (Adverb) getaggt, während Negra es als Negationspartikel (PTKNEG) bezeichnet.
    • nicht PTKNEG -> ADV
  • 'prinzipiell' und viele andere Worte werden im Negra-Korpus als adverbiales Adjektiv getaggt, im Stellingen-Korpus als Adverb.
    • prinzipiell ADJP -> ADV
  • weitere exoten
    • DATUM NE->NN
    • ZEIT NE->NN
    • zweihundertdrei ADJD->CARD
    • okay XY->ADJP
    • zu_erreichen VVINF->INFZU
    • zu_treffen VVINF->INFZU
    • zu_haben VVINF->INFZU
    • zu_arbeiten VVINF-> INFZU
    • zu_Ende ADJA->PTKVZS
    • genauso ADV->KON
    • bißchen PIDAT->ARTINDEF
    • nicht PTKNEG -> ADV
    • besten ADJA->ADV
    • prinzipiell ADJD->ADV
    • wie KOKOM -> Relativadverb
    • wo KOUS -> Relativadverb
    • grade ADJD->ADV
    • darauf PROAV->ADV
    • danach PROAV->ADV

mehrdeutige Abbildungen:

  • 'haben' inkl. aller Lautungen kommt im Stellingen-Lexikon als Voll- und Auxiliarverb vor. Im Stellingen-Korpus sind 21 Instanzen als Voll- und 5 Instanzen Auxiliarverb getaggt. Im Negra-Korpus wird 'haben' immer als Auxiliarverb getaggt.
    • Singletagging: haben wird auf Vollverb gabgebildet.
    • Multitagging: haben VAFIN->haben FIN 0.8 VAUXFIN 0.2 ... alle anderen Lautungen genauso

  • 'sein' inkl. aller Lautungen wird im Stellingen-Lexikon sowohl als Voll- als auch als Auxiliarverb geführt. Im Stellingen-Korpus sind alle Instanzen als Vollverb getaggt. Im Negra-Korpus wird 'sein' (fast) immer als Auxiliarverb getaggt.
    • Singletagging: sein wird auf Vollverb gabgebildet.
    • Multitagging: sein VAFIN->haben FIN 0.9 VAUXFIN 0.1 ... alle anderen Lautungen genauso

Artikel stellen bei der Abbildung vom STTS-Tagset auf das das Stellingen-Tagset eine Besonderheit dar, da ersteres, im Gegensatz zu zweiterem, nicht zwischen definitem und indefinetem Artikel unterscheidet. Da die Artikel jedoch eine geschlossen Wortklasse darstellen, ist es möglich alle Fälle für jeden Artikel eine einfache Sonderregel zu schreiben:

  • indefinite Artikel:
    • ein ART->ARTINDEF
    • eine ART->ARTINDEF
    • einen ART->ARTINDEF
    • einem ART->ARTINDEF
    • einer ART->ARTINDEF
    • eines ART->ARTINDEF
    • Ein ART->ARTINDEF
    • Eine ART->ARTINDEF
    • Einen ART->ARTINDEF
    • Einem ART->ARTINDEF
    • Einer ART->ARTINDEF
    • Eines ART->ARTINDEF
  • definite Artikel
    • der ART->ARTDEF
    • die ART->ARTDEF
    • das ART->ARTDEF
    • dem ART->ARTDEF
    • den ART->ARTDEF
    • Der ART->ARTDEF
    • Die ART->ARTDEF
    • Das ART->ARTDEF
    • Dem ART->ARTDEF
    • Den ART->ARTDEF

Abbildungen, die nur in Verwendung mit dem Stellingen-Korpus sinnvoll sind, da diese Worte normalerweise noch mehr Bedeutungen haben, als das Stellingen-Lexikon für sie vorsieht.

  • 'aus' wird von der Stellingen-Grammatik immer als PTKVZS getaggt.
    Im Negra-Korpus wird unterschiedlichen Kategorien zugeordnet:
    aus: ADV 1 APPO 2 APPR 584 APZR 15 PTKVZ 111
    Ein auf dem Negra-Korpus trainierter Tagger taggt die Ausprägungen von 'aus' im Stellingen-Korpus als Präposition (Zirkumposition, links APPR) oder als abgetrennten Verbzusatz (PTKVZS)
    • aus APPR -> PTKVZS
  • 'mir' ist in der Stellingen-Grammatik reflexiv, nicht aber nicht immer im Negra-Korpus:'mir'/'uns'_ sollten eigentlich gleich behandelt werden, da aber zwei Lautungen für 'uns' im Stellingen-Korpus gibt, wird für uns keine extra Regel verwendet.

    • mir 45 PPER 41 PRF 4
    • also mir PPER -> PPERRF
  • 'wo', _'wie' im Negra-Korpus als Konjunktion getaggt(unterordnend, Vergleichs-), sind im Stellingen-Korpus Relativadverben.
    • wie KOKOM -> Relativadverb
    • wo KOUS -> Relativadverb
  • Adjektive, die im Stellingen-Korpus nur als Adverb vorkommen * gemeinsam ADJD->ADV * kurz ADJD->ADV * ganztägig ADJD->ADV * früher ADJD->ADV * wunderbar ADJD->ADV * ruhig ADJD->ADV * lange ADJD->ADV * länger ADJD->ADV * früh ADJD->ADV * beruflich ADJD->ADV

  • das Partizip Perfekt wird im STTS nur dann als ADJD getaggt, wenn es adverbial gebraucht wird: gekonnt/ADJD [gespielt]; aber: [es ist] geplant/VVPP; Stellingen.cdg verwendet meist ADJP für diese Konstruktion:Für jedes Vorkommnis gibt es eine Sonderregel: gemacht VVPP->ADJP
    • word: gemacht should be ADJP but was tagged PPP 1 times, this was correct 0 times
    • word: gelegen should be ADJP but was tagged PPP 1 times, this was correct 0 times
    • word: belegt should be ADJP but was tagged PPP 1 times, this was correct 0 times
  • 'am' kommt im Stellingen Lexikon nur im Zusammenhang mit dem Superlativ als 'am besten' vor.
    • am PTKA->PTKSUP
    • am APPRART->PTKSUP
  • 'ungeschickt' ist immer prädikatives Adjektiv im Stellingen-Korpus
    • ungeschickt VVPP->ADJP

Page Preferences

-- JochenHagenstroem - 08 Mar 2002
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback