Vorschläge für Diplom- und Masterarbeiten
Sprachsignalverarbeitung
Sprecheradaption für Nichtmuttersprachler
- Thematische Einordnung: Sprachsignalverarbeitung
- Kurzbeschreibung: Spracherkennungssysteme für den Einsatz in Sprachlernsystemen können zwar mit einem relativ stark einschränkten Wortschatz arbeiten, müssen andererseits aber auch außergewöhnlich hohe Abweichungen in der phonetischen Qualität des Sprachsignals tolerieren. In der Arbeit soll untersucht werden, inwieweit Verfahren zur Sprecheradaption geeignet sind, diese zusätzliche Varianz auszugleichen.
- Charakter der Arbeit: Problemanalyse, Datengewinnung, Softwarentwicklung mit HTK, C, C++, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel
Worterkennung mit visuellem Input (Lippenlesen)
- Thematische Einordnung: Sprachsignalverarbeitung
- Kurzbeschreibung: Visuelle Informationen über die Sprechbewegungen der Lippen sind eine wichtige Informationsquelle beim Sprachverstehen, insbesondere bei stark gestörtem akustischen Signal. Der Einfluß des visuellen Kanals kann dabei unter Umständen so dominant sein, daß er in Einzelfällen die auditive Wahrnehmung verfälscht. Wesentlich für das erfolgreiche Zusammenspiel der beiden Wahrnehmungsmodi ist die Tatsache, daß ihre informationellen Beiträge partiell komplementär sind. So lassen sich Plosive (z.B. /p/ vs. /t/ bzw. /b/ vs. /d/) anhand der akustischen Evidenz nur schlecht, aufgrund der Lippenstellung hingegen recht gut voneinander unterscheiden. Aus der Sicht der technischen Verarbeitung ist die Integration der akustischen und visuellen Information insbesondere ein Architekturproblem:
- Es ist zu klären, auf welcher kategorialen Ebene die Integration am günstigsten erfolgen kann.
- Das Training der visuellen und akustischen Komponenten sollte aus praktischen Gründen zumindest teilweise entkoppelt werden.
- Aus Gründen der Robustheit des Gesamtsystems sollte die akustische Erkennung auch autonom funktionsfähig sein, so daß bei (temporären) Störungen im visuellen Kanal kein Systemzusammenbruch auftritt.
Bisherige Systementwicklungen beschränken sich auf Buchstabiererkenner, für die die Kopplung einfach und der informationelle Beitrag der Lippenstellung maximal ist. Für fließend gesprochene Sprache liegen noch keine brauchbaren Ansätze vor. Unter dem Integrationsaspekt wäre die Lautebene für eine Kopplung vorteilhaft. Diese ist jedoch für eine adäquate Modellierung der Koartikulationsphänomene nur bedingt geeignet. Auf der Wortebene hingegen ist eine wirksame Einbeziehung der visuellen Information wenig aussichtsreich. Als möglicher Lösungsansatz bietet sich eine zweistufige Erkennerarchitektur an, in der sowohl die Lautebene (zur Integration der informationellen Beiträge) als auch die Wort- bzw. Silbenebene (zur Modellierung der Koartikulation) explizit repräsentiert sind. Auf dieser Basis soll eine Integrationskomponente entwickelt werden, die die akustische und visuelle Information zusammenführt. In Abstimmung mit den Anforderungen und Möglichkeiten der Bildverarbeitung ist hierfür ein geeignetes Kategorieninventar für Artikulationsgesten zu entwickeln.
- Charakter der Arbeit: Problemanalyse, Systementwurf, Softwareentwicklung mit HTK, C, C++, experimentelle Evaluation (teilweise simuliert)
- Kontakt: Prof. Wolfgang Menzel
Robustes Parsing mit gewichteten Constraints
Inkrementelle Analyse mit CDG
- Thematische Einordnung: Robustes Parsing mit gewichteten Constraints
- Kurzbeschreibung: Aufbauend auf einem Verfahren zur inkrementellen Suche, sind suboptimale Verfahren zur zeitabhängigen Disambiguierung zu entwickeln. Sie sollen bewirken, daß nach Ablauf einer vorgegebenen Nachlaufzeit eine eindeutige Strukturbeschreibung vorliegt. Darüberhinaus ist ein Verfahren zur Sackgassenerkennung und zum gezielten Rücksetzen der Analyse zu konzipieren.
- Charakter der Arbeit: Problemanalyse, experimenteller Systementwurf, Softwareentwicklung in C, C++, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel, Niels Beuck
Modellierung räumlicher Relationen mit CDG
- Thematische Einordnung: Ribustes Parsing mit gewichteten Constraints
- Kurzbeschreibung: Für eine begrenzte Domäne sind Möglichkeiten zur Modellierung elementarer räumlicher Relationen so in eine CDG zu integrieren, dass
- bestehende Relationen zur Unterstützung des Disambiguierungsprozesses herangezogen werden können
- unbekannte Relationen aus einer Äußerung extrahierbar sind und
- die bekannten Relationen, die zum propositionalen Gehalt einer Äußerung im Widerspruch stehen, als solche identifiziert werden können.
Dabei soll geklärt werden, inwieweit sich höherstellige Relationen (z.B. Lage eines Objekts zwischen A und B, Bewegung eines Objektes von A nach B) in das binäre Repräsentationsschema der CDG integrieren lassen.
- Charakter der Arbeit: Problemanalyse, Modellierung mit gewichteten Constraints, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel
Koreferenzen zwischen Entitäten in natürlichsprachlichen Texten
- Thematische Einordnung: Informationsextraktion aus Texten
- Kurzbeschreibung: Aktuelle Entwicklungen in der Inhaltsanalyse von Texten erfordern nicht nur die Erkennung und Klassifikation von Entitäten im Text, sondern auch die Identifizierung derjenigen textuellen Erwähnungen, die sich auf die gleiche Entität beziehen. Dies kann durch Pronomen, aber auch durch (definite) Nominalgruppen geschehen. Es ist ein System zur Feststellung von Koreferenzen zu entwickeln und in einen existierenden Parser für deutsche Texte zu integrieren.
- Charakter der Arbeit: Softwareentwicklung in C/C++, Modellierung von Constraints für Koreferenzbeziehungen, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel
Fehlerdiagnose mit CDG
- Thematische Einordnung: Robustes Parsing mit gewichteten Constraints
- Kurzbeschreibung: In den bisherigen Arbeiten zur Diagnose von Grammatikfehlern mit gewichteten Constraints konnte für stark eingeschränkte Sprachbereiche eine sehr hohe Diagnmosepräzision nachgewiesen werden. Es soll nunmehr untersucht werden, wie eine vorhandene Grammatik für unrestringierte deutsche Text modifiziert werden muss, um auch in beliebigen Texten Fehler mit ausreichender Sicherheit feststellen zu können. Dazu ist die bestehende Grammatik auf realen Texten von Deutschlernenrn zu evaluieren und mit verschiedenen erweitereten Versionen zu vergleichen.
- Charakter der Arbeit: Problemanalyse, Modellierung mit gewichteten Constraints, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel
Partielles Parsing mit CDG
- Thematische Einordnung: Robustes Parsing mit gewichteten Constraints
- Kurzbeschreibung: Die Möglichkeit, natürlichsprachliche Äußerungen auch partiell zu verarbeiten, ist eine wichtige Fähigkeit im Hinblick auf ganz unterschiedliche Aspekte der Sprachverarbeitung. Dazu zählen
die Robustheit der Analyse
-
- die Realisierung LR-inkrementeller Analyseverfahren
- die Realisierung zeitsensitiver Verfahren und
- die Möglichkeit zur gezielten Informationsextraktion
Es ist das Potential des eliminativen Parsings zur Ermittlung partieller Strukturbeschreibungen zu untersuchen. Hierzu ist eine geeignete Grammatik zu entwerfen und ihre Leistungsfähigkeit an realen natürlichsprachlichen Äußerungen zu evaluieren.
- Charakter der Arbeit: Problemanalyse, Modellierung mit gewichteten Constraints, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel
Dynamisches Weltwissen in einer Mehrebenengrammatik
- Thematische Einordnung: Robustes Parsing mit gewichteten Constraints
- Kurzbeschreibung: Vor dem Hintergrund einer Anwendung in Sprachlehrsystemen ist die Modellierung eines dynamischen Weltausschnitts so in eine CDG zu integrieren, daß eine Fehlerdiagnose wirksam unterstützt wird. Zu berücksichtigen sind dabei sowohl autonom ablaufende Bewegungsabläufe als auch einfache Manipulationen mit den Mitteln einer grafischen Interaktionsumgebung. Ausgehend von einer propositionalen Ereignisrepräsentation ist die Constraintmenge des Systems so zu aktualisieren, daß eine angemessene Verbalisierung der vorgegebenen Ereignisse stark präferiert wird. Die Konsequenzen für die Gestaltung des constraint-basierten Parsers sind in einen entsprechenden Systementwurf umzusetzen.
- Charakter der Arbeit: Problemanalyse, Modellierung mit gewichteten Constraints, experimentelle Evaluation, Systementwurf
- Kontakt: Prof. Wolfgang Menzel
Simulation menschlicher Sprachverstehensprozesse mit CDG
- Thematische Einordnung: Eliminatives Parsing mit gewichteten Constraints
- Kurzbeschreibung: Das eliminative Parsing mit CDG weist einige Analogien zu Verfahren der Aktivierungsausbreitung im Bereich neuronaler Architekturen auf. In der Arbeit soll untersucht werden, inwieweit diese Beziehungen es gestatten, ausgewählte Prozeßeigenschaften der menschlichen Sprachverarbeitung nachzubilden. Die Ergebnisse sind im Hinblick auf die offene Frage nach der zugrundeliegenden Verarbeitungsarchitektur (modular vs. interaktiv) zu interpretieren.
- Charakter der Arbeit: Problemanalyse, Modellierung mit gewichteten Constraints, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel
Andere Anwendungssysteme
Interaktionsumgebung für den FU
- Thematische Einordnung: Lehrsysteme für den Fremdsprachenunterricht
- Kurzbeschreibung: Zur Unterstützung eines kommunikativ orientierten Sprachunterrichts ist eine wissensbasierte grafische Interaktionsumgebung zu realisieren, die die folgenden Dienstleistungen anbietet:
- Verifikation versprachlichter Propositionen.
- Manipulation der grafischen Repräsentation durch Kommandos, die sich direkt auf Objekte der Domäne beziehen.
- Extraktion einer propositionalen, domänenobjektbezogenen Repräsentation aus mausbasierten Nutzerinteraktionen.
- Charakter der Arbeit: Problemanalyse, Spezifikation der Interfacerepräsentation, Auswahl eines Visualisierungswerkzeugs, Softwareentwicklung `
- Kontakt: Prof. Wolfgang Menzel
Extraktion von semantischen Relationen
- Thematische Einordnung: Informationsextraktion aus Texten
- Kurzbeschreibung: Mit Hilfe von Regeln auf der Basis von regulären Ausdrücken sollen syntaktische Strukturbeschreibungen im Hinblick auf die Vermittlung von Relationen zwischen Entitäten analysisert werden. Zu diesem Zweck sind vorhandene Werkzeugen zur Inspektion von Strukturen anzupassen und ggf. zu erweitern. Für einen eingeschränkten Satz von Relationen ist eine experimentelle Evaluation durchzuführen.
- Charakter der Arbeit: Anforderungsanalyse, Implementation, Modellierung der Abbildungsregeln, experimentelle Evaluation
- Kontakt: Prof. Wolfgang Menzel, Michael Daum, Kilian Foth
Diagnose von Constraintverletzungen in Prolog-Programmen
- Thematische Einordnung: E-Learning, Software-Entwicklung, Fehlerdiagnose
- Kurzbeschreibung: Ausgehend von den semantisch-pragmatischen Anforderung konkreter Übungsaufgaben sollen Korrektheitsbedingungen in Form von Constraints für Programmtexte formuliert werden. Diese Bedingungen sind mit Kommentaren für den Schüler über mögliche Fehlerursachen verknüpft, die im Falle einer Constraintverletzung als Hinweis zur Programmkorrektur angeboten werden können. Es ist ein System zur Auswertung solcher Constraints zu implementieren und an mehreren Beispielaufgaben exemplarisch zu testen.
- Charakter der Arbeit: Implementation (vorzugsweise in Prolog), Modellierung von Korrektheitsbedingungen mit Constraints, Test
- Kontakt: Prof. Wolfgang Menzel
--
WolfgangMenzel --
15 Oct 2003