Formulieren Sie drei Beispiel für (semi-formale) Regeln aus dem Bereich der Morphosyntax bzw. Phonologie. Geben Sie jeweils drei Ausnahmefälle für diese Regeln an. Gibt es Ausnahmen zu den Ausnahmen? Lassen sich die Ausnahmen regelhaft beschreiben?
Annotieren Sie Ihren Text aus Aufgabe 1 mit Wortarten-Tags. Stellen Sie dabei jeweils alle in Frage kommenden Tags für eine Wortform zusammen und wählen Sie daraus die in dem gegebenen Kontext passende aus. Für das Deutsche stellt das Stuttgart-Tübingen Tagset (STTS) den de facto Standard für die Annotation dar. Informationen zu STTS und seiner Verwendung finden Sie hier.
Berechnen Sie für zwei ausgewählte Tags die bedingten Wahrscheinlichkeitsverteilungen p( t(i) | t(i-1) ) und p( w(i) | t(i) ), die angeben
mit welcher Wahrscheinlichkeit ein Tag im Text auf ein anderes Tag folgt ( p( t(i) | t(i-1) ) ), bzw
mit welcher Wahrscheinlichkeit eine Wortform im Text auftritt, falls ihr ein bestimmtes Tag zugeordnet wurde ( p( w(i) | t(i) ) ).