中文語音處理在數(shù)字助聽器系統(tǒng)的開發(fā)設(shè)計(jì)
2. 方法 (Methodology)
數(shù)字助聽器的核心部分是增益計(jì)算,基于頻域的處理過程,它建立了各頻率段的輸入瞬時(shí)能量與增益的函數(shù)關(guān)系,如圖3所示,對(duì)每個(gè)頻段的瞬時(shí)能量進(jìn)行短時(shí)能量累計(jì)和長時(shí)間慢速平均可獲得信號(hào)識(shí)別和分類所必要的數(shù)據(jù)。其中:
( 1 ) E j (n)= a E j (n-1) 式中: a 是時(shí)間常數(shù) 。
。 2 )使用倒譜算法提取基頻, 512 個(gè)點(diǎn) FFT , 40ms 漢明窗,窗移為 10ms 。
。 3 )用一個(gè)簡單的滑動(dòng)平均算法對(duì)每個(gè)音節(jié)測到的基頻進(jìn)行平滑處理,剔除那些平滑段內(nèi)偏離均值過大的值。
。 4 )音高和音長分別進(jìn)行歸一化。
。 5 )采用一個(gè)二次曲線在最小均方誤差的意義下逼近基音軌跡。并計(jì)算曲線的一次斜率、二次斜率、谷點(diǎn)和平坦度。
上述算法采用基于 TOCCATA 指令系統(tǒng)的匯編語言實(shí)現(xiàn)。 14 位 A/D ,采樣率設(shè)為 32KHz 。
圖3 . 漢語言語增強(qiáng)系統(tǒng)處理結(jié)構(gòu)圖
1). 語音的切分 (Classifications of Phonemes)
聲波由音質(zhì)(即音色)、音高、音強(qiáng)和音長四部分組成,這四部分在語音中起著不同的作用,但在時(shí)間上又是同時(shí)并存的。
音質(zhì)成分 —— 按音節(jié)劃分,如元音、輔音。
超音質(zhì)成分 —— 由音高、音強(qiáng)和音長三部分組成,附著于一個(gè)音節(jié)或音段上。
從聲波特性上看,可以由基頻確定音高,根據(jù)振幅確定音強(qiáng),根據(jù)時(shí)間確定音長。
2). 處理原理 (Algorithm Principles)
中文語音處理主要體現(xiàn)在:
在驗(yàn)配過程的中,考慮中文語音長時(shí)間頻譜覆蓋的頻率作加權(quán)處理,抬高目標(biāo)曲線中言語頻率的部分,可以達(dá)到加強(qiáng)語音理解的作用。
在助聽器的信號(hào)處理程序中,對(duì)壓縮控制器做特別的設(shè)置,使對(duì)高頻的信號(hào)壓縮的啟動(dòng)時(shí)間和釋放時(shí)間很短 , 做到使輔音清晰化的效果,增強(qiáng)使用者對(duì)言語的理解度。
在降噪處理中,根據(jù)中文語音在噪音環(huán)境中的采樣分析,得出了為中文語音優(yōu)化的降噪策略。實(shí)驗(yàn)證實(shí),該策略最高可以提高信噪比 18dB 。

發(fā)表評(píng)論
請輸入評(píng)論內(nèi)容...
請輸入評(píng)論/評(píng)論長度6~500個(gè)字
圖片新聞
技術(shù)文庫
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月30-31日報(bào)名參會(huì)>>> 全數(shù)會(huì)2025中國激光產(chǎn)業(yè)高質(zhì)量發(fā)展峰會(huì)
-
精彩回顧立即查看>> 【線下論壇】新唐科技2025新品發(fā)布會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】研華嵌入式核心優(yōu)勢,以Edge AI驅(qū)動(dòng)機(jī)器視覺升級(jí)
-
精彩回顧立即查看>> OFweek 2025(第十四屆)中國機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【在線會(huì)議】從直流到高頻,材料電特性參數(shù)的全面表征與測量