標籤:離線語音辨識 pocketsphinx android 自己的語音庫
最近做項目,用到離線語音辨識,整了好久,查了好多方法,終於完成,網上資料有點亂,而且大部分就是那幾個人寫的,一群人轉!下面我總結一下,也為後來人行個方便。
關於環境配置我就不多說了,我就是按照這個教程一步步來的,絕對是可行的。http://gaebolg.blog.163.com/blog/static/19826906820136232810723/
下面重點講解一下demo的運行和語音庫的配置(注意:上面那個教程的運行demo最後寫的一塌糊塗,可以從拷貝聲學模型和語音庫那裡開始看我的!)
首先,demo運行需要以下檔案:pocketsphinx/model/en_US下lm檔案夾( .dic檔案, .lm檔案),以及hmm檔案夾。如果覺得麻煩可以下載我提供的檔案。http://download.csdn.net/detail/u011747781/8034061
下面進入重頭戲,就是如何設定屬於自己的中文語音庫:
1、編寫自己的命令集:
建立一個txt檔案,輸入命令,如:
百度
Google
點擊檔案,另存新檔,注意將編碼改為UTF-8格式!(正下方編碼選項)儲存為txt檔案。
2、利用線上工具http://www.speech.cs.cmu.edu/tools/lmtool.html將寫好的txt檔案組建檔案。下載tgz檔案即可(裡面有所有檔案),複製tgz壓縮包中的lm檔案,因為只有這個有用(如果是英語的話,dic檔案可以直接用,就不用我下面介紹的方法產生dic檔案了!!)
3、建立一個txt檔案。在我給的data檔案夾裡,有個叫做standard.dic的檔案,那個是標準語音庫,ctrl+F 尋找你需要的發音,複製到你建立的txt檔案中。
格式如下:
百度 b ai d u
完事後存為UTF-8格式,改名為 .dic檔案。
4、這樣屬於你的語音庫就建好了,只需覆蓋我的data檔案夾中相應的dic , lm檔案 即可!
最後,奉上親測可用的完整demo http://download.csdn.net/detail/u011747781/8034195
Android離線語音辨識(PocketSphinx)