最近項目中需要研究語音辨識功能,感覺挺好玩的,特別搜尋了大量的資料來學習,這一篇是參考網上的一篇文章記錄出來的,主要是以使用者的角度來使用google語音辨識引擎,與代碼無關。
語音搜尋網站,挺好用的,不過要裝chrome!!!
網址是:http://slides.html5rocks.com/#speech-input
1、準備必要的軟體: flac.exe , wget.exe 。(前面那個是轉碼用的,後面那個用於HTTP提交和接收資料,將兩者放到D盤根目錄測試)
2、首先安裝一個WAV錄音的軟體,也可以使用Windows內建的。先錄音,並儲存檔案名稱為: test.wav 。
3、開啟命令列,轉入D盤,鍵入:
> flac.exe -8 -f --sample-rate=16000 test.wav
這是將test.wav檔案轉換成flac檔案,轉換完存放在目前的目錄下,存放的檔案名稱為test.flac
接著鍵入:
> wget -O "GoogleSpeechAPI.txt" --user-agent="Mozilla/5.0" --post-file=test.flac --header="Content-Type: audio/x-flac; rate=16000" "http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=1"
就會將test.flac的語音轉換成文字檔,存放在GoogleSpeechAPI.txt裡,開啟可看到:
{
"status":0,
"id":"8f9d46231ac2dadee91d8d6ba1b57779-1",
"hypotheses":
[
{"utterance":"那不行哦","confidence":0.87555957}]
}
這個算是對使用google語音辨識引擎的一個初體驗吧,感覺挺好玩的,所以記錄一下。
參考文章 : http://hi.baidu.com/stoneforestwhu/item/84857330d9ccb102b2c0c55f
本文部落格源地址:http://blog.csdn.net/ypist