Android離線語音辨識(PocketSphinx)

來源:互聯網
上載者:User

標籤:離線語音辨識   pocketsphinx   android   自己的語音庫   

最近做項目,用到離線語音辨識,整了好久,查了好多方法,終於完成,網上資料有點亂,而且大部分就是那幾個人寫的,一群人轉!下面我總結一下,也為後來人行個方便。


關於環境配置我就不多說了,我就是按照這個教程一步步來的,絕對是可行的。http://gaebolg.blog.163.com/blog/static/19826906820136232810723/



下面重點講解一下demo的運行和語音庫的配置(注意:上面那個教程的運行demo最後寫的一塌糊塗,可以從拷貝聲學模型和語音庫那裡開始看我的!)


首先,demo運行需要以下檔案:pocketsphinx/model/en_US下lm檔案夾( .dic檔案, .lm檔案),以及hmm檔案夾。如果覺得麻煩可以下載我提供的檔案。http://download.csdn.net/detail/u011747781/8034061


下面進入重頭戲,就是如何設定屬於自己的中文語音庫:

1、編寫自己的命令集:

建立一個txt檔案,輸入命令,如:


百度
Google

點擊檔案,另存新檔,注意將編碼改為UTF-8格式!(正下方編碼選項)儲存為txt檔案。

2、利用線上工具http://www.speech.cs.cmu.edu/tools/lmtool.html將寫好的txt檔案組建檔案。下載tgz檔案即可(裡面有所有檔案),複製tgz壓縮包中的lm檔案,因為只有這個有用(如果是英語的話,dic檔案可以直接用,就不用我下面介紹的方法產生dic檔案了!!)


3、建立一個txt檔案。在我給的data檔案夾裡,有個叫做standard.dic的檔案,那個是標準語音庫,ctrl+F 尋找你需要的發音,複製到你建立的txt檔案中。

格式如下:

百度 b ai d u

完事後存為UTF-8格式,改名為 .dic檔案。


4、這樣屬於你的語音庫就建好了,只需覆蓋我的data檔案夾中相應的dic , lm檔案 即可!


最後,奉上親測可用的完整demo http://download.csdn.net/detail/u011747781/8034195


Android離線語音辨識(PocketSphinx)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.