




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第3章短時時域處理技術(shù)3.1語音信號的短時處理方法3.2短時能量和短時平均幅度3.3短時過零率3.4短時自相關(guān)函數(shù)3.5基音提取2語音端點檢測預(yù)加重分幀和加窗3.1語音信號的短時處理方法33.1語音信號的短時處理方法預(yù)處理的作用:在對語音信號進行特征提取之前,消除高次諧波失真、混疊、高頻等現(xiàn)象對語音信號產(chǎn)生的負面影響,盡可能保證經(jīng)過預(yù)處理后的信號更平滑、干凈,方便有效地提取并表示語音信號所攜帶的信息圖預(yù)處理流程圖43.1.1語音端點檢測端點端點檢測(VoiceActivityDetection,VAD)也被稱作語音活動檢測,其目的主要是對一段音頻區(qū)分語音部分與非語音部分,從而忽略噪聲部分和靜音部分,提取包含有效信息的語音端。帶閾值的端點檢測基于分類器的端點檢測基于模型的端點檢測端點檢測帶閾值的端點檢測
63.1.2預(yù)加重預(yù)加重是一種在發(fā)送端對輸入信號高頻分量進行補償?shù)男盘柼幚矸绞?,增強信號的高頻成分。而預(yù)加重對噪聲并沒有影響,因此能夠有效地提高輸出信噪比。73.1.3分幀與加窗語音信號通常是非平穩(wěn)的,特別是低質(zhì)量環(huán)境下的情感語音。因此,語音信號需要進行短時分析,即認為在短時間內(nèi)該聲音是平穩(wěn)的,一般采取分幀與加窗處理。分幀將語音片段進行分段處理,一般的語音信號以10-30ms為一幀進行劃分,劃分后假定認為每一幀短時平穩(wěn)。考慮到幀與幀之間具有相關(guān)性,相鄰幀之間會保留一部分重疊從而上下幀之間平穩(wěn)過渡,重疊部分稱之為幀移。圖幀移與幀長比例為1/4的分幀示意圖加窗加窗的目的:讓一幀信號的幅度在兩端漸變到0,能夠提高頻譜的分辨率;同時,加窗能夠使全局信息更加連續(xù),避免出現(xiàn)吉布斯效應(yīng)。窗的作用實際上是強調(diào)窗內(nèi)的信號,削弱窗外信號。為了完全保留窗內(nèi)信號的性質(zhì),理想的窗函數(shù)盡可能相當于脈沖形式,用來增加其頻率分辨率,并具有無旁瓣(即頻率漏泄)的特性。常見窗函數(shù)矩形窗海寧窗海明窗布雷克曼窗函數(shù)性質(zhì)矩形窗具有最窄主瓣、最高頻率分辨率,同時也有最大的頻率漏泄、呈現(xiàn)更多噪聲。布累克曼窗有最低的頻率分辨率和最小的頻率漏泄,表現(xiàn)在頻譜上比其他窗形更平滑。海明窗的折衷效果較好,在語音分析窗中應(yīng)用的也最為廣泛。分析窗矩形海寧海明布累克曼48812旁瓣漏泄(dB)-13.3-31.5-42.7-58.1表窗的特性123.2短時能量和短時平均幅度短時能量:常用在端點檢測,估測有聲之音母或韻母的開始位置及結(jié)束位置;也用于區(qū)分清濁音。因此,當語音段信噪比較高時,可以用短時能量進行語音分類。133.2短時能量和短時平均幅度
上圖音頻的原始波形和短時能量
左圖短時能量進行語音分類代碼等主觀音量曲線等主觀音量曲線代表了人耳對于不同頻率聲音的靈敏程度,即人耳的頻率曲線。主觀音量除了和頻率有關(guān)外,也和聲音的內(nèi)容,如音色、基本周期的波形等有關(guān)。例如,可以盡量使用相同的主觀音量來錄下幾個發(fā)音比較單純的元音,再用音量公式來算它們的音量,就可以看出音量公式和發(fā)音嘴型的關(guān)系。圖等主觀音量曲線等主觀音量曲線上圖元音/o/的音量曲線圖左圖繪制相應(yīng)圖像代碼163.2短時能量和短時平均幅度短時能量:改進缺點:對信號電平值過于敏感。需要計算信號樣值的平方和,容易產(chǎn)生溢出。短時平均幅度:優(yōu)點:用絕對值代替平方和,簡化運算,也能更好的表達清音的幅度變化173.3短時過零率
183.3短時過零率上圖音頻信號的短時過零率右圖提取音頻信號短時過零率代碼193.3短時過零率計算過零率時常遇問題:由于有的信號恰好位于零點,過零率的計算就有兩種,出現(xiàn)的效果也會不同。因此必須多加觀察,才能選用最好的作法。大部分使用聲音的原始整數(shù)值來進行計算,這樣才不會因為使用浮點數(shù)信號減去直流偏移(DCBias)時,造成過零率的增加。203.4短時自相關(guān)函數(shù)自相關(guān)函數(shù)用于衡量信號自身時間波形的相似性,表示為平穩(wěn)的自相關(guān)函數(shù)性質(zhì):1.對稱性:R(k)=R(-k)2.在k=0時取最大值,即|R(k)|≤R(0)3.對于確定信號,R(0)對應(yīng)能量;對于隨機信號,R(0)對應(yīng)功率213.4短時自相關(guān)函數(shù)上述的第2個性質(zhì)中,如果是一個周期為P的信號,則在取樣處,其自相關(guān)函數(shù)也是最大值,因此可以根據(jù)自相關(guān)函數(shù)的最大值的位置來估計周期信號的周期值。假設(shè)一段語音是濁音信號,則其短時自相關(guān)函數(shù)也呈現(xiàn)周期現(xiàn)象,且其自相關(guān)函數(shù)的周期等于原語音信號的周期;若語音是清音信號,則其自相關(guān)函數(shù)不存在周期性。223.5短時時域處理技術(shù)案例:基音提取基音是基于發(fā)聲器官如聲門、聲道和鼻腔的生理結(jié)構(gòu)而提取的參數(shù),能夠很好地刻畫說話人的聲帶特征,在很大程度上反映了人的個性特征。目前,已經(jīng)存在的很多基音檢測算法是根據(jù)所在語音幀的清濁音分類結(jié)果進行檢測?;羲苡绊懧暤罏V波的影響使聲門激勵呈現(xiàn)出非完美的周期性。例如,放松的說話和用力說話令聲門波平滑或猛烈地關(guān)閉,基音隨之變化。即使說話人努力地想保持說話方式或者聲道的形狀,基音也會隨機地抖動,連續(xù)聲門波的幅度也會放大或者削弱而無法令基音周期保持不變。在清濁音語音類型變化處,由于語音的平穩(wěn)性遭到破壞,基音特性變化速度快。基音范圍比較大,在50~400Hz之間,難以非常精確地檢測基音。當清濁音同時存在的時候,基音難以準確檢測。豐富的諧波信息的存在,基音難以準確檢測。由于環(huán)境噪聲的存在,比如人聲喧嘩處、汽車內(nèi)或有其他聲音的干擾,難以準確檢測基音。24圖中心削波法提取基音法流程圖
3.5.1基音檢測估計1:三電平削波法25左圖去噪后的語音信號右圖中心削波處理后的信號3.5.1基音檢測估計1:三電平削波法263.5.1基音檢測估計2:SHR諧波檢測法提取基音時經(jīng)常取到基音的倍頻或者半頻,引起基音檢測的誤差和基音提取的誤判諧波-諧波比率(Subharmonic-harmonicRatio,SHR)基音提取方法273.5.1基音檢測估計2:SHR諧波檢測法圖(a)
原始語音波形圖(b)
噪聲波形圖(c)
原始語音加噪聲波形圖(d)
真實語音波形與帶噪語音時域波形1.語音信號為什么要進行短時處理?是怎么實現(xiàn)的?2.假設(shè)一段語音采樣頻率為8000Hz,請實現(xiàn)語音信號的分幀和加窗,要求幀長為20ms,幀移為10ms,窗型為海明窗;并畫出其中一幀語音加窗前后的波形。3.基音表示聲音信號的什么特征?它由什么因素決定?對于男聲、女聲、小孩的聲音,基音有什么特性?28練習(xí)題4.可以用什么特征來區(qū)分聲音和噪聲?
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護理競賽考試題庫及答案
- 地球文明考試題及答案
- 公考面試題型套路及答案
- 人生重在反思班會課件
- 食管賁門黏膜撕裂綜合征的臨床護理
- T/CADBM 62-2022多元鎂輕質(zhì)無機板
- T/CADBM 51-2021室內(nèi)裝飾用竹木纖維集成墻板應(yīng)用技術(shù)規(guī)程
- 小區(qū)房屋設(shè)計合同范本
- 二手機器買賣合同范本
- 入股手袋工廠合同范本
- 心血管-腎臟-代謝綜合征患者的綜合管理中國專家共識2025解讀
- 婚慶合作入股協(xié)議書
- 學(xué)院“十五五”大學(xué)文化建設(shè)規(guī)劃
- 2025年陜西省西安市西咸新區(qū)中考二模語文試題(原卷版+解析版)
- 安全生產(chǎn)管理和培訓(xùn)制度
- 2025山東濟南先行投資集團有限責任公司及權(quán)屬公司社會招聘169人筆試參考題庫附帶答案詳解
- 2024年高考化學(xué)試卷(山東)(解析卷)
- 乘法運算定律復(fù)習(xí)課(1)
- 淺談歌曲《我的祖國》
- lemon米津玄師翻唱中文諧音
- 滾鍍掛鍍區(qū)別分析
評論
0/150
提交評論