後記:
採用波形拼接的方法有個很大的缺點,就是使用的語音庫檔案太大,而且多音節字根本無法解決。
還有一種實現中文TTS方法就是記錄全部的發音,因為在普通話中,實際存在的發音只有1333種。
所以我們的語音庫只要儲存這1333個語音就行,而不需要儲存每個漢字的讀音。
如果語音庫只有1333個讀音的話,我們還得建立索引表來記錄每個漢字在語音庫中的位置,
因為有了索引表,就可以解決多音漢字的問題,由於涉及到多音漢字發音的識別,還得用到 分詞技術。
關於takaya朋友問的實現自然連續的發音問題:
說實話,這是我最想解決和實現的問題,我自己想了下,如果以片語為單位來做語音庫,那聲音
聽起來就比較連續,因為我們平時說話 也是以片語為單位說的,但如果要實現這個的
話,就得用到分詞技術,而且語音庫的建立也要一定的功夫。
關於分詞技術朋友們可以看下 http://www.nlp.org.cn/。
白: 我一直是以程式員的角度去做這個簡單的TTS的,所以很多東西我自己也有誤解或不懂的地方,希望朋友們
不要笑話我,並且能幫我提出問題和指導我。
這個TTS還有很多很多如前言列出的需要改進的地方,我希望能有這方面愛好的朋友能我和一起來完善它。
期待ing...
文章導讀:
中文TTS 的簡單實現(基於linux)之 前言
http://blog.csdn.net/dedodong/archive/2006/07/15/923543.aspx
中文TTS 的簡單實現(基於linux)之 實現原理:
http://blog.csdn.net/dedodong/archive/2006/07/16/927041.aspx
中文TTS 的簡單實現(基於linux)之 語音庫的實現
http://blog.csdn.net/dedodong/archive/2006/08/22/1105742.aspx
中文TTS 的簡單實現(基於linux)之 實現語音合成
http://blog.csdn.net/dedodong/archive/2006/08/22/1105879.aspx