+ Aufgaben Bereiche

Überblick von G. Neumann (deutsch, DFKI Saarbrücken)

Exzerpt

Aufgabenbereiche

  • Motivation
    • immer mehr Texte sind online verfügbar
    • Online-Texte können automatisiert verarbeitet werden
    • Recherchen ermöglichen, die über Stichwortsuche hinaus gehen

  • Ziele
    • Analyse freier Texte
    • relevante Texte erkennen
    • das Gefundene strukturieren
    • typische Fragen: wer, was, wem, wann, wo, warum

  • Einschränkungen
    • kein universelles Textverstehen
    • Anwendungsdomäne muss im voraus beschrieben werden

  • Arbeitsweise
    • Ausfüllen von Templates
      • Vorgegeben: Platzhalter für domänenspezifische Informationsschnippsel
        • wer?
        • wem?
        • was?
        • etc.
      • Textanalyse
        • Einsetzen der passenden "Antworten" aus den bearbeiteten Texten
        • Template u.U. nur partiell ausgefüllt

  • Evaluation
    • Messgrößen
      • Präzision (P)
        • Wie viele der gefundenen Wissenseinheiten sind auch relevant?
      • Vollständigkeit (V)
        • Wie viele der möglichen Wissenseinheiten wurden gefunden?
      • F-Maß
        • zusammenfassendes Gütemaß aus P und V

  • Modularität
    • IE-System als Hintereinanderschaltung von Transduktoren
    • Teilaufgaben
      • Tokenscanner
        • Trennen von Überschrift, Teaser, Absätzen ...
      • Lexikalische Analyse
        • Wortart und Flexion
      • Eigennamenerkennung
      • Parsing
        • i.d.R. keine vollständige Analyse
      • Koreferenzauflösung
        • "G. Schröder" = "Gerhard Schröder" = "Bundeskanzler Schröder"
        • Wer ist mit "er", "ihr", "sie" gemeint?
        • "Boris Becker" = "der Leimener"
      • Erkennung domänenrelevanter Muster
      • Template-Unifikation

-- WolfgangMenzel - 08 Apr 2003
Warning: Can't find topic InfEx.WebLeftBarExample

 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback