Przetwarzanie plików dźwiękowych przy użyciu WinAPI, struktura pliku WAVE

0

Cześć,
czy korzystając z WinAPI mogę wyciągnąć z pliku Wave informacje takie jak częstotliwość, głośność i barwa dźwięku w określonej chwili? Jeżeli tak, to za pomocą których funkcji?
Wiem, że plik WAVE ma format nagłówek+dane, gdzie dane są postaci
//16-bit stereo
probka0 L LB, probka0 L HB, probka0 R LB, probka 0 R HB, probka 1 L LB, probka 1 L HB, probka 1 R LB, probka 1 R HB...
ale czym dokładnie są te próbki?
Czy powyższe dane są w powyższym formacie również, jeżeli nasz Wave to nie jest PCM?
Czy one zawierają jawnie informacje o parametrach częstotliwość+głośność+barwa, czy to jest zorganizowane w jakiś inny sposób, jeżeli tak, to jak to dokładnie działa?
Jak należy rozumieć chwilę w tym kontekście, tzn. skąd wiadomo po ilu (mili)sekundach dźwięk ma być zmieniony na inny?

Pozdrawiam,
Adrian

2

Czy powyższe dane są w powyższym formacie również, jeżeli nasz Wave to nie jest PCM?
Nie, PCM to jest właśnie dokładnie to co opisałeś. Plik WAVE może zawierać dźwięk skompresowany teoretycznie dowolną metodą, włączając MP3. Skompresowany strumień trzeba najpierw zdekodować (robi to kodek) do formatu PCM.

ale czym dokładnie są te próbki?
Stopniem wychylenia membrany głośnika w danej chwili. Albo napięciem elektrycznym w przewodzie z sygnałem audio. Albo ciśnieniem powietrza podczas rozchodzenia się fali dźwiękowej.

Czy one zawierają jawnie informacje o parametrach częstotliwość+głośność+barwa
Nie. Można to wyliczyć, np. transformata Fouriera da nam informacje na temat częstotliwości składowych.

Masz dwie drogi do wyboru: pogłębić swą wiedzę na temat dźwięku i teorii sygnałów w ogóle, albo użyć gotowych bibliotek jak BASS i FFTW.

Jak należy rozumieć chwilę w tym kontekście, tzn. skąd wiadomo po ilu (mili)sekundach dźwięk ma być zmieniony na inny?
Częstotliwość próbkowania jest zapisana w nagłówku pliku. Zazwyczaj wynosi 44100 Hz, czyli jedna próbka trwa 1/44100 sekundy. "16 bit stereo" oznacza dwa kanały, i na każdy kanał próbka ma 16 bitów - czyli 2 bajty dla lewego głośnika i 2 bajty dla prawego.

0

A możesz podać jakieś dobre źródło online, które rzetelnie omawia te zagadnienia (wolałbym jednak, żeby nie było zbyt obszerne)

0

ja potrzebuje zrobic kwerende literaturowa na temat przetwarzanie dźwięku i plików dźwiękowych czy ktos bedzie zainteresowany oczywiscie odplatnie ??

1 użytkowników online, w tym zalogowanych: 0, gości: 1