*rauskram*
zur termgewichtung nimmt man allgemein tf-idf, zum vergleich von dokumenten dann das vector space model mit dem cosinus z.b.
dazu gibt es eine riesige menge an literatur...
Zitat:
habe mal ein skript im netz gefunden, das die kölner phonetik implementierte - die ergebnisse waren dennoch eher enttäuschend. spracherkennung ist und bleibt ein schwieriges unterfangen .-
|
da bin ich jetzt mal pingelig: das ist wenn dann überhaupt sprachverarbeitung und nicht -erkennung. und auch wenn es schwer ist, ist doch vieles möglich.