UHH
>
Informatik
>
NatS
>
InfEx Web
>
ThemenGebiete
>
AufgabenBereiche
(17 Oct 2012, UnknownUser)
P
rint version
+ Aufgaben Bereiche
Überblick von G. Neumann (deutsch, DFKI Saarbrücken)
Exzerpt
Aufgabenbereiche
Motivation
immer mehr Texte sind online verfügbar
Online-Texte können automatisiert verarbeitet werden
Recherchen ermöglichen, die über Stichwortsuche hinaus gehen
Ziele
Analyse freier Texte
relevante Texte erkennen
das Gefundene strukturieren
typische Fragen: wer, was, wem, wann, wo, warum
Einschränkungen
kein universelles Textverstehen
Anwendungsdomäne muss im voraus beschrieben werden
Arbeitsweise
Ausfüllen von Templates
Vorgegeben: Platzhalter für domänenspezifische Informationsschnippsel
wer?
wem?
was?
etc.
Textanalyse
Einsetzen der passenden "Antworten" aus den bearbeiteten Texten
Template u.U. nur partiell ausgefüllt
Evaluation
Messgrößen
Präzision (P)
Wie viele der gefundenen Wissenseinheiten sind auch relevant?
Vollständigkeit (V)
Wie viele der möglichen Wissenseinheiten wurden gefunden?
F-Maß
zusammenfassendes Gütemaß aus P und V
Modularität
IE-System als Hintereinanderschaltung von Transduktoren
Teilaufgaben
Tokenscanner
Trennen von Überschrift, Teaser, Absätzen ...
Lexikalische Analyse
Wortart und Flexion
Eigennamenerkennung
Parsing
i.d.R. keine vollständige Analyse
Koreferenzauflösung
"G. Schröder" = "Gerhard Schröder" = "Bundeskanzler Schröder"
Wer ist mit "er", "ihr", "sie" gemeint?
"Boris Becker" = "der Leimener"
Erkennung domänenrelevanter Muster
Template-Unifikation
--
WolfgangMenzel
- 08 Apr 2003
InfEx
Warning: Can't find topic InfEx.WebLeftBarExample
Copyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki?
Send feedback