Dissertation: Automatische Spracherkennung für Amharisch

Solomon Teferra Abate - DAAD-Stipendiat aus Äthiopien

Projektbeschreibung: Das Ziel dieses Forschungsprojektes ist es, ein sprecherunabhängiges Spracherkennungssystem mit einem großen Wortschatz für fließend gesprochenes Amharisch zu realisieren. Amharisch ist die Landessprache Äthiopiens und gehört zur Familie der semitischen Sprachen. Sie zeichnet sich durch eine fast kongruente Übereinstimmung zwischen Lauten und Schriftzeichen aus. Charakteristisch für das Amharische ist auch die sehr homogene Silbenstruktur bestehend aus je einem Konsonanten und einem Vokal, weshalb insgesamt nur 232 verschiedene Silben unterschieden werden müssen. Auf dieser Eigenschaft der Sprache gründet sich die Annahme, dass als Modellierungseinheit in einem Spracherkennungssystem für Amharisch Silben besser geeignet sind als einzelne Laute. Diese Hypothese soll im Rahmen einer Dissertation überprüft werden. Dazu wird ein Korpus von Sprachsignaldaten zahlreicher Sprecher des Amharischen zusammengestellt und zum Training von Hidden-Markov-Modellen benutzt. Modelle unterschiedlicher Topologie sollen im Hinblick auf die damit erreichbaren Erkennungsraten miteinander verglichen werden.

Schlagwörter: Amharisch, Automatische Spracherkennung, Hidden-Markov-Modelle
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback