目前,雜訊估計已成為語音增強技術中很關鍵的環節。在很多單通道語音增強演算法中,尤其在雜訊源不可知的情況下,即時雜訊功率譜估計是很重要的。雜訊估計的準確性會直接影響最終效果:若雜訊估計過高,則徼弱的語音將被去掉,增強語音會產生失真;若估計過低,則會有較多的背景殘留雜訊。
近年來,非穩定環境下雜訊功率譜估計得到了重視。傳統的雜訊估計方法實現純粹基於語音活動的檢測,制約了雜訊在語音存在時的更新,而且在弱語音訊號的低輸入信噪比時,其可靠性效能惡化較明顯。
文獻【1】提出的最小值統計(Minima Statistical,MS)方法,通過跟蹤特定窗內語音功率譜的最小值來估計雜訊,乘以一個係數來補償偏差。該方法所得雜訊估計的方差是傳統方法的2倍,同時它可能偶爾會削弱低能墾音素,尤其當最小觀察窗很小時,只有以很高的計算複雜度為代價來克服其局限性。
文獻【2—3】提出最小值控制遞迴平均(Minima ControlledRecursive Averaging,MCRA)法以及改進的MCRA(Improved Minima Controlled Recursive Averaging,IMCRA),它們雖然保證了雜訊譜估計的準確性,但在追蹤帶噪語音平滑功率譜最小值時採用了固定時間窗,因此,在雜訊突變的情況下,估計的雜訊譜存在很長的延時。
文獻【4】提出一種快速估計方法,其雜訊譜的更新在連續時問內不依賴同定時間的窗長,但在語音或雜訊能量過高時雜訊估計會慢下來,而且當時間大於0.5 S時,會削弱一些語音能量。
註:袁文浩. 《基於雜訊估計的語音增強演算法研究》[D]. 上海:華東理工大學.
此為博士論文,對於雜訊估計的主要方法及原理都有詳細介紹。
參考文獻:
【1】Martin R.Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics[J].IEEE Trans.on Speech andAudio Processing,2001,9(5):504—512.
【2】Cohen I,Bergdugo B.Noise Estimation by Minima Controlled Recursive for Robust Speech Enhancement[J].IEEE Signal Processing Letters,2002,9(1):12—15.
【3】Cohen I.Noise Spectral Estimation in Adverse Environments:Improved Minima Controlled Recursive Averaging[J].IEEE Transactions on Speech and Audio Processing,2003,11(5):466475.
【4】Rangachari S,Loizou P C.A Noise—estimation Algorithm for Highly Non-stationary Environments[C]//Proc.of ICASSP’04.Dallas,USA:[s.n.],2004:220—231.