Übungsaufgaben zu Teil 1

Aufgabe 1

Beschreiben Sie mindestens drei verschiedene Informationsverarbeitungsaufgaben für die eine Lösung auf der Basis des Maschinellen Lernens sinnvoll, erfolgversprechend bzw. interessant erscheint. Achten Sie bei der Auswahl auf eine möglichst große Vielfalt unterschiedlicher Anwendungsbereiche und Anwendungsszenarien.

Begründen Sie Ihre Wahl auf der Seite Teilnehmerbeiträge unter den Aspekten

  • Relevanz
  • Erfolgsaussichten
  • Existenz bewährter Lösungsansätze für ähnliche Fälle
  • Verfügbarkeit von Trainingsdaten
  • Existenz alternativer Lösungen

Finden Sie mindestens 2 Werkzeugsammlungen für das Maschinelle Lernen. Achten Sie bei der Auswahl auf eine möglichst große Vielfalt an unterschiedlichen Systemen.

Dokumentieren Sie Ihre Ergebnisse unter Teilnehmerbeiträge. Berücksichtigen Sie dabei insbesondere die folgenden Fragestellungen:

  • Leistungsumfang
  • Verfügbarkeit
  • Dokumentation
  • Bisherige Nutzung in der Forschung, bei Wettbewerben und für Benchmark-Tests

  • Bearbeitung bis zum 10.4.2012

Aufgabe 2

Wählen Sie eine geeignete Werkzeugsammlung aus und installieren Sie diese. Begründen Sie Ihre Wahl und dokumentieren Sie eventuelle Probleme bei der Installation.

Wählen Sie sich aus dem UCI Machine Learning Repository drei interessante Datensätze aus. Beschreiben Sie die Datensätze nach

  • Umfang
  • Anzahl und Art der Attribute
  • Datentypen der Attribute
  • Fehlende Daten, Inkonsistenzen
  • Bisherige Nutzung für bestimmte Verarbeitungsaufgaben
  • publizierte Resultate

Begründen Sie Ihre Auswahl und illustrieren Sie Ihre Beschreibung mit Beispielen aus den Datensammlungen.

  • Bearbeitung bis zum 17.4.2012

Aufgabe 3

Wählen Sie einen Datensatz aus und definieren Sie dafür eine (oder mehrere) Lernaufgabe(n). Dokumentieren Sie dazu

  • Zielstellung der Lernaufgabe
  • Festlegungen zu Trainings-, Entwicklungs- und Testdaten
  • Erwartete Resultate

Wählen Sie aus den Lernverfahren in Ihrer Werkzeugsammlung zwei alternative Modellklassen für Ihre Lernaufgabe(n) aus. Beschreiben Sie die Lernverfahren hinsichtlich

  • verwendeter Modellrepräsentation
  • Induktivem Bias
  • Optimierungsansatz
  • Robustheit gegenüber fehlenden bzw. inkonsistenten Daten, hoher Dimensionsanzahl, unterschiedlichen Skalierungen usw.

  • Bearbeitung bis zum 24.4.2012

Aufgabe 4

Bereiten Sie Ihre Daten für die in Aufgabe 3 gewählten Verfahren auf und trainieren Sie die Modelle. Evaluieren Sie die trainierten Modelle hinsichtlich der erreichten Modellgüte. Vergleichen Sie Ihre Ergebnisse miteinander, sowie mit ggf. bereits publizierten Resultaten auf dem gleichen Datensatz.

Untersuchen Sie die Abhängigkeit Ihrer Resultate von der Größe der Lern- und Teststichprobe.

Treten bei Ihren Experimenten Probleme mit der Überanpassung (Overfitting) auf? Wenn ja warum, wenn nein, warum nicht?

  • Bearbeitung bis zum 2.5.
  • ggf. Abschlusspräsentation 27.6./4.7.2012 (Wird noch festgelegt)

-- WolfgangMenzel -- 26 Mar 2012
 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback