Aufgabe Nr.2


Drei (semi-formale) Regeln aus dem Bereich der Morphosyntax bzw. Phonologie

  1. Phonologie
    1. Wenn ein Wort in Vokal endet, dann ist es ein langer Vokal.
      Bsp
      he, me, we, so, flu, Katmandu,...
    2. Woerter mit "ou" werden als [aʊ] ausgesprochen.
      Bsp
      house, mouse, arouse, lousy,...
  2. Morphosyntax
    1. Pluralbildung: -s.
      Bsp
      cats, dogs, etc

Ausnahmefälle für diese Regeln

  1. Phonologie
    1. to, do, ma, pa, ska, bla
    2. wounds
  2. Morphosyntax
    1. Fuenf Ausnahmefaelle:
      • Mit -es: addresses, buses, boxes,...
      • Mit -ies: babies, copies, flies,...
      • Mit -ves: wives, lives, leaves...
      • Mit -oes: heores, potatoes, torpedoes,...
      • Wort bleibt unveraendert: aircraft, deer, (fish), salmon, sheep, chinese,...

Gibt es Ausnahmen zu den Ausnahmen?

  1. Phonologie
    1. Nein.
    2. Nein.
  2. Morphosyntax
    1. Fuer den spezifischen Fall -oes: radios, photos, pianos. Und viele irregulaere: man/men, person/people, child/children, die/dice, mouse/mice, matrix/matrices, tooth/theeth,...

Lassen sich die Ausnahmen regelhaft beschreiben?

  1. Phonologie
    1. Vermutlich nicht.
    2. Vermutlich nicht.
  2. Morphosyntax
    1. Nein.

Fragmente des Textes aus Aufgabe 1 mit Wortarten Tags

Artikel, The Dark Secret at the Heart of AI, von Will Knight. (Es wurden die pos-tags von der Penn Treebank Project benutzt, und mit Hilfe des Part-of-speech Taggers der Stanford University bekommen wir folgendes:
"Last/JJ year/NN, a/DT strange/JJ self-driving/JJ car/NN was/VBD released/VBN onto/IN the/DT quiet/JJ roads/NNS of/IN Monmouth/NNP County/NNP, New/NNP Jersey/NNP. The/DT experimental/JJ vehicle/NN, developed/VBN by/IN researchers/NNS at/IN the/DT chip/NN maker/NN Nvidia/NNP, didn?t/VBD+RB look/VB different/JJ from/IN other/JJ autonomous/JJ cars/NNS, but/CC it/PRP was/VBD unlike/IN anything/NN demonstrated/VBN by/IN Google/NNP, Tesla/NNP, or/CC General/NNP Motors/NNPS, and/CC it/PRP showed/VBD the/DT rising/VBG power/NN of/IN artificial/JJ intelligence/NN. The/DT car/NN didn?t/VBD+RB follow/VB a/DT single/JJ instruction/NN provided/VBN by/IN an/DT engineer/NN or/CC programmer/NN. Instead/RB, it/PRP relied/VBD entirely/RB on/IN an/DT algorithm/NN that/WDT had/VBD taught/VBN itself/PRP to/TO drive/VB by/IN watching/VBG a/DT human/JJ do/VBP it/PRP."

  • Sollte der Token "different" in "look different from[...]" nicht ein Adverb sein?
  • Sollte "anything" NNS sein?
  • Sollte "Instead" CC sein?
  • Token "human" sollte NN sein!

Warscheinlichkeiten

  • Sei t(i) = NN und t(i-1) = JJ,
    dann gilt p( t(i) | t(i-1) ) = 5/11.
  • Sei jetzt t(i) = DT, dann gilt
    p( "the" | DT) = 3/11 ,
    p( "The" | DT) = 2/10 ,
    p( "a" | DT) = 3/10 und
    p( "an" | DT) = 2/10.

Quellen

-- NikM - 16 Apr 2017
Warning: Can't find topic Sandbox.WebLeftBarExample

 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback