Rozpoznawanie komend głosowych

Witam. Chciałbym napisać program umożliwiający rozpoznawanie komend głosowych. Jest to mój pierwszy tak skomplikowany program dlatego chciałbym się troszkę poradzić. Przedstawię jak ja to sobie wyobrażam:

Użytkownik nagrywa polecenie głosowe dla danej komendy np. dla zamknięcia komputera nagrywa odpowiednią komendę 3 razy
Następnie program "wyłapuje" głos i zapisuje go do pliku (wav, mp3 ?? )
Zapisane nagranie jest w jakiś magiczny sposób porównywanie z 3 nagranymi poleceniami z punktu 1.
Jeżeli nagranie zgadza się ze wzorami z punktu 1 wykonywana jest dana komenda.

I o to moje pytania:

Czy mój sposób jest dobry ?
W jaki sposób mogę porównać 2 pliki nagrań z daną tolerancją ?
Jaki język/technologia będzie najodpowiedniejsza dla tego typu zadania ? Dodam że znam C++/Qt oraz jako tako C#.

Możesz wykorzystać gotowy projekt Open Source do rozpoznawania mowy o nazwie Sphinx 4 po uprzednim przygotowaniu odpowiednich próbek dźwiękowych zdaje się n-gramów.
http://cmusphinx.sourceforge.net/sphinx4/
Program napisany w Java.
Tu masz jakąś pracę magisterską opisującą trochę Sphinxa http://dariusz.wawer.org/art/inne/dwawer_mgr.pdf

.NET ma w pakiecie biblioteki do rozpoznawania mowy :) - dość niedawno też rozpocząłem pracę nad tym :D od ile dobrze pamiętam, powinien być gdzieś wątek na 4p o tym ;)

@maszynaz: projekt Spihinx 4 odpada - Java nie wchodzi w ogóle w grę.

@Docent: wspomniałeś że zacząłeś pracę nad tym czy mógłbyś się podzielić zdobytą wiedzą i wysłać mi jakieś przykłady/informacje ? :)

@mto9, to jest open source = masz dostępne źródła.

@mto9: Kodu źródłowego Ci nie dam, mojej aplikacji. Jedynie co mogę dać, to linka do MSDNa: http://msdn.microsoft.com/en-us/library/gg145021%28v=vs.100%29.aspx ;)

Liczba odpowiedzi na stronę

Rozpoznawanie komend głosowych

1 użytkowników online, w tym zalogowanych: 0, gości: 1

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami