BADGER Information Extraction (IE) Software
Die Universität von Massachusetts bietet mit der
Badger IE Software eine frei verfügbare Software zur Informationsextraktion an. Die Software besteht aus drei Komponenten:
-
The MARMOT Text Bracketting Module
Dieses Modul ist ein Basismodul, das Texte in Sätze, Verb und Nominalphrasen zerlegt. Außerdem erkennt es noch einige Besonderheiten, wie Zeitangaben.
-
The BADGER Extraction Module
Das Informationsextraktionsmodul, das nach bestimmten Regelsystemen Informationen extrahiert.
-
The CRYSTAL Dictionary Induction Module
Diese Modul lernt Informationsextraktionsregeln durch vorbereitete Texte.
Die komplette Software gibt es sowohl im Quellcode, als auch in kompilierten Dateien für Windows.
--
BorisVonLoesch - 22 Apr 2003