This (incomplete, constantly extended/revised) list contains your ideas for exam questions (slightly edited) with my comments as to how well I think they cover the contents of the course.

Allgemein

  • Überlegen Sie in der Vorbereitung auf die Klausur, welche Zusammenhänge Sie zwischen den einzelnen Inhalten sehen.

01. Sprachliches Kommunikationssystem

  • Welche Annahmen werden beim Model of communication (Shannon-Weaver) getroffen?
  • An welchen Stellen der Kommunikation zwischen Sender und Empfänger kann diese gestört werden?
  • Wie lässt sich Kommunikaton und ihre Störung modellieren. Welche Lösung in Hinblick auf Störungen schlägt das Shannon'sche Model vor?
  • Welche Vorgänge sind Teil des übermittelns von Information seitens des Senders bzw. des Empfängers? --> ich würde wahrscheinlich eher fragen "Beschreiben Sie die Schritte bei der Informationsübermittlung im Shannon'schen Informationsmodell"

  • Wie ist das Schichtenmodell der Kommunikation aufgebaut? (Aufbau der Grafik und grob die Schritte erklären)
  • In welche Teilgebiete wird die Linguistik üblicherweise eingeteilt? Warum kann diese Einteilung manchmal problematisch sein?
    • Führen Sie zu jedem Teilgebiet ein Beispiel an, wie der jeweilige Teilaspekt der Kommunikation scheitern kann.
  • Nenne 3 Unterdisziplinen der Linguistik --> ich glaube, dass ich dieses Terminologiewissen tatsächlich voraussetzen würde, und nicht explizit abfrage. Die Unterdisziplinen (und was sie unterscheidet) muss man dann eben benennen können wenn man sinnvoll auf Fragen wie "Ordnen Sie die Dialogsystemkomponenten ASR, NLU und Dialogmanagement jeweils zugehörigen Unterdisziplinen der Linguistik zu."

  • Was spricht dafür, dass die Abläufe zur Kommunikation von Ideen nebenläufig stattfindet und nicht sequenziell?

02. Dialog

  • Wie kann ein Sprecher signalisieren, dass sein Redebeitrag zuende geht?
  • Wie kann ein Dialogteilnehmer signalisieren, dass der Dialog zuende geht?
  • Was unterscheidet Monolog von Dialog?
  • Wie unterscheidet sich eine moderierte Veranstaltung von einem Dialog, insbesondere in Bezug auf das Turn-Taking?
  • Welche Mechanismen kennen Sie, die Dialogteilnehmer nutzen um Missverständnisse im Dialog zu vermeiden?
  • Nennen und erläutern Sie Eigenschaften von Dialog (vermutlich würde ich das so fragen, dass der Bezug möglichst klar wird)
  • worin unterscheiden sich Chatbots und task-orientierte Dialogsysteme? (zum Beispiel hinsichtlich der Performanzmaße: woher weiß ich, dass mein Chatbot gut funktioniert?)
  • weshalb funktioniert die Kommunikation zwischen Menschen und Dialogsystemn, trotz der eingeschränkten Turn-Taking-Fähigkeiten der Systeme?

03. Dialogsystemaufbau

  • Beschreiben Sie die vorherrschenden Modelle Pipeline und Blackboard für Dialogsysteme
    • benennen und diskutieren Sie Vor- und Nachteile des Pipeline- vs. Blackboard-Modells
  • Vergleichen Sie die vorherrschenden Modelle für Dialogsysteme mit Bezug auf Eigenschaft X.
  • 1. Benennen Sie Defizite von Dialogsystemen in ihrer Dialogsysteme, 2 erklären Sie, wie diese in ihrer Architektur begründet sind, und 3. erläutern Sie, warum die Interaktion mit solchen Systemen dennoch funktionieren kann (ggfs. 4. unter welchen Einschränkungen).
  • Wieso ist das Blackboard-Konzept technisch nur schwer umzusetzen, bzw. welche Einschränkungen gibt es, welche einige Vorteile (bitte benennen) des Konzepts im Vergleich zu Pipelines schnell wieder zunichtemachen?
  • Nennen Sie 4 Möglichkeiten, die Aufgabenstellung "Turn-Taking" in der Architektur eines Dialogsystem zu verorten und diskutieren Sie die jeweiligen Vor- und Nachteile
  • in welcher Hinsicht unterscheidet sich text-basierter Chat von gesprochensprachlichem Dialog? Welche Unterschiede ergeben sich für die Architektur der jeweiligen Systeme?

04. Spracherkennung

  • Was bedeutet die Markov-Annahme und warum ist diese in der Spracherkennung nützlich? (übrigens genauso bei der graphischen Modellierung eines Dialogmanagers.)
  • Erklären Sie sowohl das "Akustische Modell" sowie das "Wortfolge-Modell" und wie diese beiden zueinander in Beziehung stehen --> bzw. wie diese in Spracherkennungssoftware zusammenspielen
  • Werden "Spectrograms" wirklich für die Aufstellung eines sinnvollen "Lautmodells" benötigt und wenn ja, wieso lassen sie sich nicht ersetzen; und wenn nein, wie ließen sie sich ersetzen? --> verstehe ich nicht ganz.
  • Wozu dient ein Spektogramm und wie sind die Achsen beschriftet?
  • Wie ergeben sich die totalen Kosten für eine Zustandszuordnung im HMM? (Transitionskosten + Kosten, den Lautvektor zuzuordnen) --> und welche Transitionskosten können Sie dem akustischen, welche dem Wortfolge-Modell zuordnen?
  • Was ist in der Spracherkennung unter "Search Graph" zu verstehen?
  • Erläure den Token-Passing Algorithmus
  • Wie geht der "Token-Pass-Algorithmus" [an einem Beispiel?] vor?
  • Wo können sich die Token im Modell befinden und welche Information beinhalten Sie?
  • Unter welchen Grundvoraussetzungen terminiert Token Passsing? --> würde ich eher bei AD erwarten, aber fragen kann ich's natürlich
  • Wie wird am Ende das am besten passende Wort ermittelt? (Pfad Identifikator, Word Link Record..) --> hmm, das klingt sehr spezifisch nach der originalen Implementierung; mir ist das grundlegende Prinzip (das ja mittlerweile auch für connected word recognition genutzt wird) wichtiger
  • Wozu wird in der Spracherkennung sowas wie eine "confidence measure" bzw. "rejection threshold" benötigt? --> bzw. welche Vorteile hat es, die Konfidenz zu wissen

05. Sprachsynthese

  • Erläutern Sie die Bedeutung der "Prosodie" während des Vorgangs der Sprachsynthese... --> wie unterscheidet sich die Rolle der Prosodie zwischen Spracherkennung und Sprachsynthese?
  • ...und nennen Sie für drei unterschiedliche Unterdisziplinen der Linguistik jeweils zwei Beispiele. --> das versteh ich nicht?
  • Visualisieren Sie die Zusammenhänge der "Prosodie" und unterschiedlicher Unterdisziplinen der Linguistik. --> das wäre eine gewagte Frage, weil ich nicht wüsste, ab wann die Visualisierung für volle Punktzahl ausreicht. Geht es eigentlich darum, welcher Art die durch Prosodie encodierte Information ist?
  • Nennen und erläutern Sie unterschiedliche Ausprägungen der "Waveform Synthesis" mit ihren jeweiligen Merkmalen. --> interessant sind hier besonders Abwägungen zwischen den Vorgehensweisen
  • Welche zwei Ansätze für Sprachsynthese sind Ihnen bekannt? Wie funktioniert konkatenative/ modellbasierte Sprachsynthese?
  • Wenn wir doch über "world knowledge" verfügen, wozu brauchen wir denn dann noch "information structure"?
  • Geben Sie ein Bsp., bei dem sich die Bedeutung einer Aussage durch die Betonung verändert.
  • Wie unterscheidet sich "Sprachsynthese" fundamental von der "Spracherkennung"?
  • Ist eine unatürlich klingende Sprachsynthese problematisch?
  • Wie löst die Sprachsynthese das Problem der Mehrdeutigkeit, abhängig von der Betonung? ("alles ein ein bisschen betonen"/Mensch hat Erwartungen) --> Welches neue Problem entsteht durch diese Lösung? (Indifferenz)

06. Semantik

  • Wenn Computer praktisch immer an der Pragmatik interessiert sind, wieso sollte sich dann überhaupt noch ein Sprachdialogsystem-Forscher mit der Semantik beschäftigen? --> schlechte Frage.
  • Erklären Sie, was unter "Frame-Semantik" zu verstehen ist und was diese mit "Slots" zu tun haben.
  • Was ist ein "Dialogue Act" und wie bestimmen wir innerhalb einer Dialogdomäne die "relevanten Dialogue Acts"?

07.-10.: Methoden des Dialogmanagements

  • Erläutern Sie was unter einem "premature-implementation-Problem" zu verstehen ist und dessen Implikationen für die Sprachdialogsysteme.
  • Was macht ein "modulares Dialogsystem" aus?

  • Was ist die Dialog Policy? Auf welcher Basis trifft Sie Entscheidungen?
  • Erklären Sie, wieso ein "Markov-Decision-Process", welcher nur einen einzigen Zustand betrachtet, in einem so komplexen Thema wie "Dialog-Management" von Nutzen ist.
  • Ist es ein Problem, dass die Übergangsfunktion nur den vorherigen Zustand betrachtet? (Markov Annahme)

  • Was sind Vor-/ Nachteile von rule-based systems?
  • Was sind Dialoghandlungen?
  • Was ist ein Frame? Slot?
  • Können Slots selbst Frames darstellen? --> ja/nein-Fragen sind natürlich langweilig, besser
  • Stellen Sie sowohl Vorteile als auch die Nachteile von "Frame-basierten Dialogmanagement" gegenüber "FSM-basierten Dialogmanagement" dar. --> vermutlich würde ich dies einschränken auf bestimmte Aspekte (damit es nicht zu sehr ausufert)
  • In welcher Spielart des Dialogmanagements werden "Frames" als zentrale Datenstruktur zur Verwaltung der Dialogsituation verwendet? Wie?
  • Entwerfen Sie ein "Frame" zu [hier vorgefertigte Situation einfügen]. --> ja, sowas kann ich mir tatsächlich vorstellen
  • Wie ist der Ablauf bei Frame-based Dialogue Systems?
  • Wie werden Slots gefüllt?
  • Wie geht das System vor, um Frames zu füllen? Welche Entscheidung muss das System treffen? (Welcher Slot aus welchem Frame gefüllt werden soll)
  • Wie verhält sich die "Dialogpolicy" und "Dialogzustand" in einem "probabilistischen Dialogmanagement"? --> warum nur in einem probabilistischen Dialogmanagement? Geht das für die anderen Spielarten nicht?

  • Welche Policies sind Ihnen bekannt, um als System zu reagieren, wenn der Input nicht verstanden werden kann? (explict/implicit confirming, progressive/rapid prompting)
  • Wie sieht das vorzuziehende Verhalten eines Dialog-Management-Systems im Falle der verschiedenen Grade von Ungewissheit [hierfür vielleicht vorgefertigte Situation?] aus? Begründen Sie Ihre Antwort. --> begründen Sie immer Ihre Antwort.
  • Wie kann die dialogue policy verbessert/trainiert werden? / Erkläre den Reinforcement Learning Ansatz.
  • Was ist der Unterschied zw POMDP und MDP?
  • Welche Variable repräsentiert das Wissen vom Dialogagenten beim POMDP und was gibt sie an? (belief state b: most likely state over all possible states)
  • Erklären Sie, wie "Deep Learning" / "Ende-zu-Ende-Verarbeitung" im Dialogmanagement Einsatz finden bzw. noch finden können.
  • Welche wiederstreblichen Ziele ergeben sich beim Training vom Dialog Manangement? (Sicherheit über Input vs Schnelligkeit)

11.: inkrementelle Dialogverarbeitung

  • Erklären Sie den Begriff "Responsivität" und grenzen Sie ihn von "Inkrementalität ab.
  • Was hat der Begriff "feedback loop" mit der "naturalness" im Bereich der Dialogsysteme zu tun?
  • Beschreiben Sie den Begriff "Affordanzen" und erläutern Sie, wie diese bei der Erstellung eines Dialogsystems berücksichtigt werden sollten.
  • Wie wirken sich "interaction quality" und "synthesis quality" auf die "naturalness" eines Dialogsystems aus?

  • Stellen Sie die grundlegenden Unterschiede zwischen "inkrementeller Sprachverarbeitung" und "nicht-inkrementeller Sprachverarbeitung" (anhand eines Beispiels) dar. --> möglicherweise gebe ich das Beispiel direkt vor. Was sind die Vor- und Nachteile der inkrementellen Verarbeitung in diesem Beispiel?
  • Was macht ein "modulares inkrementelles Dialogsystem" aus? Warum ist Modularität für inkrementelle Verarbeitung wesentlich und wo liegen Schwierigkeiten?
  • Benennen Sie die wesentlichen Eigenschaften des "Incremental Unit Models" und erklären Sie, welche Aspekte der Verarbeitung diese jeweils lösen?
  • Wie ist das "Incremental Unit Network" aufgebaut?
  • Erklären Sie die Elemente von "Incremental Units" und deren Funktion innerhalb des "Incremental Unit Networks".
  • In wie weit könnte es von Vorteil sein, dass die Dependenzen zwischen den einzelnen Einheiten in der Architektur des "Incremental Unit Models" erhalten bleiben?

Querschnittsthemen:

 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback