Rozpoznawanie komend głosowych

0

Witam. Chciałbym napisać program umożliwiający rozpoznawanie komend głosowych. Jest to mój pierwszy tak skomplikowany program dlatego chciałbym się troszkę poradzić. Przedstawię jak ja to sobie wyobrażam:

  1. Użytkownik nagrywa polecenie głosowe dla danej komendy np. dla zamknięcia komputera nagrywa odpowiednią komendę 3 razy
  2. Następnie program "wyłapuje" głos i zapisuje go do pliku (wav, mp3 ?? )
  3. Zapisane nagranie jest w jakiś magiczny sposób porównywanie z 3 nagranymi poleceniami z punktu 1.
  4. Jeżeli nagranie zgadza się ze wzorami z punktu 1 wykonywana jest dana komenda.

I o to moje pytania:

  1. Czy mój sposób jest dobry ?
  2. W jaki sposób mogę porównać 2 pliki nagrań z daną tolerancją ?
  3. Jaki język/technologia będzie najodpowiedniejsza dla tego typu zadania ? Dodam że znam C++/Qt oraz jako tako C#.
0

Możesz wykorzystać gotowy projekt Open Source do rozpoznawania mowy o nazwie Sphinx 4 po uprzednim przygotowaniu odpowiednich próbek dźwiękowych zdaje się n-gramów.
http://cmusphinx.sourceforge.net/sphinx4/
Program napisany w Java.
Tu masz jakąś pracę magisterską opisującą trochę Sphinxa http://dariusz.wawer.org/art/inne/dwawer_mgr.pdf

0

.NET ma w pakiecie biblioteki do rozpoznawania mowy :) - dość niedawno też rozpocząłem pracę nad tym :D od ile dobrze pamiętam, powinien być gdzieś wątek na 4p o tym ;)

0

@maszynaz: projekt Spihinx 4 odpada - Java nie wchodzi w ogóle w grę.

@Docent: wspomniałeś że zacząłeś pracę nad tym czy mógłbyś się podzielić zdobytą wiedzą i wysłać mi jakieś przykłady/informacje ? :)

0

@mto9, to jest open source = masz dostępne źródła.

0

@mto9: Kodu źródłowego Ci nie dam, mojej aplikacji. Jedynie co mogę dać, to linka do MSDNa: http://msdn.microsoft.com/en-us/library/gg145021%28v=vs.100%29.aspx ;)

1 użytkowników online, w tym zalogowanych: 0, gości: 1