Tools zum Ähnlichkeitsvergleich

Dateien

Im CVS sind alle Tools zum Ähnlichkeitsvergleich im Verzeichnis speakerid/comparison. Checkout via:

cvs -d /data/cvs checkout speakerid
cd comparison

Verzeichnis Was gibt es dortSorted ascending
src "Aufgeräumte" Java-Sourcen; jedes Unterverzeichnis ist ein Package
src/speakerid/report Ausgabeverzeichnis der Matrix-Analyse
src/speakerid Direkt startbare Klassen im Paket speakerid
prototypes Erste Implementierungen: DTW-Algorithmus, MatrixMatch (jeden Sprecher mit jedem vergleichen)
src/speakerid/ui GUI-Klassen für den DTW-Visualisierer
src/speakerid/util Hilfsklassen (insb. zum Einlesen von HTK-Feature-Dateien
src/speakerid/eval Klassen zur Auswertung von Vergleichsmatrizen
src/speakerid/algo Verschiedene DTW-Implementierungen

Tools

Obacht! Java 1.4 wird benötigt. Ggf. muss der Pfad angepasst werden, also etwa:

export PATH=/opt/pkg/j2sdk1.4.1_02/bin:$PATH

VisDTW

visdtw.jpg

Vergleicht zwei Feature-Dateien miteinander und visualisiert das Ergebnis.

Aufruf:

  • Ins Verzeichnis speakerid/comparison/src gehen
  • Ggf. kompilieren, also javac speakerid/VisDTW.java und javac speakerid/algo/*.java
  • Start mit java speakerid.VisDTW

Die Datei visdtw.conf (im Verzeichnis src) legt fest, welche DTW-Implementierungen zur Verfügung stehen und wo nach Feature-Dateien gesucht werden soll.

BatchComparison

batchcmp.jpg

Führt für eine Liste von Verzeichnissen in jedem Verzeichnis einen Vergleich aller Feature-Dateien durch und wertet die entstandenen "Jeder-mit-jedem"-Matrizen aus. Als Ausgabe wird eine HTML-Datei im Verzeichnis report erstellt.

Aufruf:

  • Ins Verzeichnis speakerid/comparison/src gehen
  • Ggf. kompilieren, also javac speakerid/BatchComparison.java und javac speakerid/algo/*.java
  • Ggf. das Arbeitsskript compare.script anpassen (hier ist enthalten, welche Verzeichnisse überhaupt untersucht werden sollen und welche DTW-Implemtierungen zum Einsatz kommen sollen)
  • Start mit java speakerid.BatchComparison
  • Warten ...

make_ideal_features.pl

Nimmt ein Verzeichnis voller Feature-Dateien und erzeugt in einem leeren Verzeichnis genau so viele Dateien gleichen Namens. Die erzeugten Dateien sind so gestaltet, dass je zwei Sprecherproben (z.B. hans1.feat und hans2.feat) einen geringen Abstand haben und die Proben verschiedener Sprecher einen deutlich höheren Abstand.

Die so erzeugten Dateien können mit in die Analyse der besten Feature-Auswahl einbezogen werden.

Warning: Can't find topic SpeakerId.WebLeftBarExample

 
This site is powered by FoswikiCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback