最近在做一個文本轉語音TTS(Text to Speech)的第三方軟體封裝,使用的是國內語音技術龍頭安徽科大訊飛公司提供的離線引擎AiSound5.0,主要用於汽車導航用途。科大訊飛還提供了AiTalk用於語音辨識,AiWrite用於手寫辨識服務等。另外還有針對6種平台的SDK和開發樣本。
其中AiSound5.0隻提供TTS介面(即將文本字串合成PCM格式的音頻資料),不提供播音功能,至於播放音頻資料我採用的是pulseaduio。
一、科大訊飛語音平台
科大訊飛目前有不少產品應用在移動終端上了,比如說用在手機上的訊飛語點,可方便語音撥打到電話和傳送簡訊,查天氣、股票等資訊。
在下面訊飛語音雲這個網站可以找到科大訊飛針對6種平台的SDK,http://open.voicecloud.cn/download.php,包括Android、Iphone、Windows、Linux、Java、Flash這些平台的語音合成、語音辨識和聽寫的開發文檔和SDK下載,不過使用之前需要申請AppID(每個語音應用程式需要一個Appid來唯一標識,您需要通過註冊帳號來獲得自己應用的Appid,未註冊的語音應用將無法正常擷取Voice Messaging Service。),通過審核後就能下載響應的開發文檔和SDK並用於自己的軟體系統中了。
二 、科大訊飛語音合成、識別-線上文檔和應用程式樣本網址
從這裡可以查看線上的開發文檔http://open.voicecloud.cn/developer.php?column=aW50ZV9zZGs%3D
Android平台的開發文檔和應用程式樣本:http://open.voicecloud.cn/developer.php?category=YW5kcm9pZA%3D%3D&column=ZG9jdW1lbnQ%3D&type=d2lkZ2V0#a38
Windows和Linux平台的開發文檔和程式樣本:http://open.voicecloud.cn/developer.php?category=b3RoZXI%3D&column=ZG9jdW1lbnQ%3D&type=YXBp
三、科大訊飛語音產品的行動裝置 App
這裡有一個科大訊飛的線上語音合成系統示範程式:ViViVoice 2.1線上示範系統
http://www.iflytek.com/TtsDemo/viviVoiceShow.aspx
1、訊飛語點的應用,官網下載網址如下:http://yudian.voicecloud.cn/yudian.htm,支援Android和Iphone兩大平台。
2、訊飛IME應用:http://ime.voicecloud.cn/index.html
3、訊飛語音輸入法應用:http://kouxun.voicecloud.cn/index.html
4、開發人員社區:http://open.voicecloud.cn/index.php
四、官網的Windows平台-語音合成和識別範例程式碼
網址如下:http://open.voicecloud.cn/developer.php?category=b3RoZXI%3D&column=c2FtcGxl&type=YXBp
以Windows下的開發為例,給出了語音合成、語音辨識和聽寫的編程樣本。
五、Tizen(泰澤)提供的TTS和STT語音合成、語音辨識介面
泰澤是三星和英特爾合作開發的一款作業系統。
1、Tizen SDK官網:https://developer.tizen.org/downloads/tizen-sdk
2、Tizen項目:https://review.tizen.org/git/
3、tts-api:https://review.tizen.org/git/?p=framework/api/tts-api.git;a=summary
其對應的tts.h標頭檔api介面線上網址為:https://review.tizen.org/git/?p=framework/api/tts-api.git;a=blob;f=include/tts.h;h=636470d923555a30d164cc09ceff841b72187e20;hb=98aee0bab00a418af162a0314ef931f8fd620892
4、stt-api:https://review.tizen.org/git/?p=framework/api/stt-api.git;a=summary