手機對話中的語音處理(三)

來源:互聯網
上載者:User

標籤:mil   osi   hid   流程   post   log   lan   string   border   


本系列文章由 @YhL_Leo 出品。轉載請註明出處。
文章連結: http://blog.csdn.net/yhl_leo/article/details/50359479

上一篇:部落格手機對話中的語音處理(二)講述了有聲語音利用LP模型進行語音合成的整個流程,本文將講述LP預測合成技術在無聲語音(即雜訊)中的使用。

2.2 30毫秒無聲語音的LP合成

從上篇部落格的語音波形圖中選取一部分30毫秒的無聲語音訊號(這裡選擇2000~2239這段訊號):

input_frame=speech(2000:2239);plot(input_frame);



圖 1 語音波形

繪製出其功率譜密度圖。須要強調的是,我們如今處理的是雜訊(並不是語音),所以採用平均周期頻譜來估算功率譜密度(相比一個簡單的周期頻譜而言頻率解析度減少)。這裡使用Matlab中的pwlech函數,預設將語音幀分為8個子幀,相鄰之間重疊度為50%。

pwelch(input_frame);



圖 2 功率譜密度圖

相同使用LP模型,p=10合成一個新的幀。

合成的時候,使用all-pole濾波(使用預測殘差的標準差σ作為其標準差)處理高斯白色雜訊幀:

[ai, sigma_square]=lpc(input_frame,10);sigma=sqrt(sigma_square);excitation=randn(240,1);synt_frame=filter(sigma,ai,excitation);plot(synt_frame);



圖 3 合成語音波形

相同繪製出其功率譜密度圖:

pwelch(synt_frame);



圖 4 合成音功率譜密度圖

非常明顯,儘管合成音的波形與原音的波形基本沒什麼共同點,可是功率譜密度圖還有些類似。

這就是LP模型的雜訊合成分析~

手機對話中的語音處理(三)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.