BADGER Information Extraction (IE) Software

Die Universität von Massachusetts bietet mit der Badger IE Software eine frei verfügbare Software zur Informationsextraktion an. Die Software besteht aus drei Komponenten:

  • The MARMOT Text Bracketting Module Dieses Modul ist ein Basismodul, das Texte in Sätze, Verb und Nominalphrasen zerlegt. Außerdem erkennt es noch einige Besonderheiten, wie Zeitangaben.
  • The BADGER Extraction Module Das Informationsextraktionsmodul, das nach bestimmten Regelsystemen Informationen extrahiert.
  • The CRYSTAL Dictionary Induction Module Diese Modul lernt Informationsextraktionsregeln durch vorbereitete Texte.

Die komplette Software gibt es sowohl im Quellcode, als auch in kompilierten Dateien für Windows.

-- BorisVonLoesch - 22 Apr 2003
