Aufgabe Nr.2
Drei (semi-formale) Regeln aus dem Bereich der Morphosyntax bzw. Phonologie
- Phonologie
- Wenn ein Wort in Vokal endet, dann ist es ein langer Vokal.
- Bsp
- he, me, we, so, flu, Katmandu,...
- Woerter mit "ou" werden als [aʊ] ausgesprochen.
- Bsp
- house, mouse, arouse, lousy,...
- Morphosyntax
- Pluralbildung: -s.
- Bsp
- cats, dogs, etc
Ausnahmefälle für diese Regeln
- Phonologie
- to, do, ma, pa, ska, bla
- wounds
- Morphosyntax
- Fuenf Ausnahmefaelle:
- Mit -es: addresses, buses, boxes,...
- Mit -ies: babies, copies, flies,...
- Mit -ves: wives, lives, leaves...
- Mit -oes: heores, potatoes, torpedoes,...
- Wort bleibt unveraendert: aircraft, deer, (fish), salmon, sheep, chinese,...
Gibt es Ausnahmen zu den Ausnahmen?
- Phonologie
- Nein.
- Nein.
- Morphosyntax
- Fuer den spezifischen Fall -oes: radios, photos, pianos. Und viele irregulaere: man/men, person/people, child/children, die/dice, mouse/mice, matrix/matrices, tooth/theeth,...
Lassen sich die Ausnahmen regelhaft beschreiben?
- Phonologie
- Vermutlich nicht.
- Vermutlich nicht.
- Morphosyntax
- Nein.
Fragmente des Textes aus Aufgabe 1 mit Wortarten Tags
Artikel,
The Dark Secret at the Heart of AI
, von Will Knight.
(Es wurden die pos-tags von der
Penn Treebank Project benutzt, und mit Hilfe des Part-of-speech Taggers der Stanford University bekommen wir folgendes:
"Last/JJ year/NN, a/DT strange/JJ self-driving/JJ car/NN was/VBD released/VBN onto/IN the/DT quiet/JJ roads/NNS of/IN Monmouth/NNP County/NNP, New/NNP Jersey/NNP. The/DT experimental/JJ vehicle/NN, developed/VBN by/IN researchers/NNS at/IN the/DT chip/NN maker/NN Nvidia/NNP, didn?t/VBD+RB look/VB different/JJ from/IN other/JJ autonomous/JJ cars/NNS, but/CC it/PRP was/VBD unlike/IN anything/NN demonstrated/VBN by/IN Google/NNP, Tesla/NNP, or/CC General/NNP Motors/NNPS, and/CC it/PRP showed/VBD the/DT rising/VBG power/NN of/IN artificial/JJ intelligence/NN. The/DT car/NN didn?t/VBD+RB follow/VB a/DT single/JJ instruction/NN provided/VBN by/IN an/DT engineer/NN or/CC programmer/NN. Instead/RB, it/PRP relied/VBD entirely/RB on/IN an/DT algorithm/NN that/WDT had/VBD taught/VBN itself/PRP to/TO drive/VB by/IN watching/VBG a/DT human/JJ do/VBP it/PRP."
- Sollte der Token "different" in "look different from[...]" nicht ein Adverb sein?
- Sollte "anything" NNS sein?
- Sollte "Instead" CC sein?
- Token "human" sollte NN sein!
Warscheinlichkeiten
- Sei t(i) = NN und t(i-1) = JJ,
dann gilt p( t(i) | t(i-1) ) = 5/11.
- Sei jetzt t(i) = DT, dann gilt
p( "the" | DT) = 3/11 ,
p( "The" | DT) = 2/10 ,
p( "a" | DT) = 3/10 und
p( "an" | DT) = 2/10.
Quellen
--
NikM - 16 Apr 2017