NF 1, SS 1997: Lösungsblatt 4: Reguläre Ausdrücke


Aufgabe 1: Unbestimmte Artikel

Zählen Sie alle unbestimmten Artikel in einer Textdatei. Als Datenmaterial diene die Datei

/users/rzdspc5/nf1/xamtrup/schilder.txt

Welche Kommandozeile ist hierzu notwendig?

Lösung hierzu

sed -e's/[<>]/ /g' schilder.txt |
sed -e's/^[^ ]/ &/;s/[^ ]$/& /' |
sed 's/ / /g' |
sed -n -e's/ eine\{0,1\}[smnr]\{0,1\} /<!&>/gp' |
sed -e's/^./>&/;s/.$/&</' |
sed -e's/>[^<]*<//g' |
sed -e's/^\!//' |
tr "!" "\012" |
wc

Die Formen von unbestimmten Artikeln sind ein, eines, einem, einen, eine, einer, einer, eine, ein, eines, einem und einen.

Im Einzelnen:

Ich komme dabei auf 65 Vorkommen von unbestimmten Artikeln.

Achtung: Der reguläre Ausdruck paßt auch auf `eins'!

Aufgabe 2: Verbflexion

Schreiben Sie einen regulären Ausdruck, der möglichst viele Flexionsformen eines deutschen Verbs abdeckt.

Lösung hierzu:

Beispiel: `rasten'

Die folgenden Formen treten auf: gerastet, raste, rasten, rastest, rastet, rastete, rasteten, rastetest, rastetet.

Der reguläre Ausdruck dazu lautet:

\(ge\)\{0,1\}raste[nt]|st|te\([nt]|st\)\{0,1\}

Achtung: Auch dieser RA läßt zuviel zu, z.B. `gerasten'.


Author: Jan W. Amtrup
Document:
Last modified: