解析手機語音互動設計

來源:互聯網
上載者:User

  語音辨識技術,也被稱為自動語音辨識,其目標是將人類的語音中的詞彙內容轉換為電腦可讀的輸入,例如按鍵、二進位編碼或者字元序列。

  語音辨識技術作為輸入方式,比按鍵輸入和手勢輸入更為快捷,學習成本很低,對於非特定人連續語音辨識系統的識別率達到98.73%,已經達到實用要求,具有廣闊的應用前景,在手機端的應用有語音撥號、語音輸入、語音命令、語音搜尋和語音翻譯等。

  語音的技術原理比較複雜,可以從語音互動的過程來理解:

  1.開啟語音辨識功能。一般由使用者手動點擊按鈕啟動,手機端暫時無法自動啟動,如由語音命令啟動或者根據音量高低判斷開始識別。

  2.進入說話介面。程式介面會通過視覺體現音量的變化。

  3.說話完畢,系統開始分析。結束輸入有兩種方式:一是自動關閉,通常時輸入單詞完畢之後自己的關閉,另一種是使用者手機手動關閉。系統處理過程可以分為以下幾個步驟:

  a)前端處理。該模組的主要任務是從輸入訊號中去除噪音等影響結果的因素,提取特徵,供聲學模型處理。訊號處理之前會先進行斷點檢測,端點檢測是指在語音訊號中將語音和非語音訊號時段區分開來,準確地確定出語音訊號的起始點。經過端點檢測後,後續處理就可以只對語音訊號進行,這對提高模型的精確度和識別正確率有重要作用。語音增強主要任務就是消除環境雜訊對語音的影響。目前通用的方法是採用維納濾波,該方法在雜訊較大的情況下效果好於其它濾波器。

  b)聲學特徵提取。聲學特徵的提取既是一個資訊大幅度壓縮的過程,也是一個訊號解卷過程,目的是使模式劃分器能更好地劃分。如上傳音頻會利用到語音編碼解碼技術,可以減少音訊檔案大小、儲存空間或者傳輸位元速率。

  c)統計聲學模型。計算各個幀的聲學特徵,如上下文建模。根據發聲機理,音之間只能漸層,前一音會影響後一音,從而使得後一個音的頻譜與其他條件下的頻譜產生差異,從而使模型能更準確地描述語音。

  d)發音詞典。發音詞典包含系統所能處理的詞彙集及其發音,類似於拼音IME的詞庫。如IME,詞典更新熱詞和詞庫有組於提高匹配的準確率。

  e)語言模型。語言模型對系統所針對的語言進行建模,如分析語音上下文。

  由於音頻檔案大小的限制,本地只能儲存少量的詞典,這也就要求複雜的語音需要串連伺服器分析。Google語音搜尋在使用者輸入完成之後才提示無法連網,在啟動輸入之前就應該檢查網路連接狀況。

  4.系統分析完畢輸出結果。一種是根據結果自動顯示結果,如bing搜尋,另外一種是提供選項供使用者選擇,這和輸出結果的機率高低有一定關係。使用者選擇的結果對於詞典的排序產生影響,增強語音的自適應和強健性,協助形成個人化輸入。

  根據產品可識別的詞彙量區分產品,對於特定語音命令,使用者只能輸入符合命令的詞彙,比如說出連絡人名字搜尋。IME的詞彙更多,而語句搜尋不但需要龐大的詞彙庫,處理連續的語音輸入需要區分連音和變音,還要求能根據上下文和熱詞輸出更為合理的結果。條件限制越少,語音辨識的難度越大。因為一定程度上避免模糊音,詞典資料越少,輸入特定詞彙的準確率越高。

  中文的語音輸入與英文不同,英文匹配不到詞典配置的詞就無法識別,中文詞彙由單字組成,中文可以根據單字識別。

  io 5的IME已經加入語音功能,會逐步變為手機輸入的常規功能,最終輸出結果的準確率和操作流暢度是衡量其互動優劣的重要標準。

  作者:曉生

  文章來源:daichuanqing.com/index.php/archives/2800

相關文章

Beyond APAC's No.1 Cloud

19.6% IaaS Market Share in Asia Pacific - Gartner IT Service report, 2018

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。