語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第1頁(yè)
語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第2頁(yè)
語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第3頁(yè)
語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第4頁(yè)
語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1 緒論1.1 綜述 語(yǔ)音是人類(lèi)信息活動(dòng)的重要手段之一,語(yǔ)音不僅是人與人之間進(jìn)行信息交流的最直接最方便的和最有效的工具。人機(jī)對(duì)話(huà)意味著計(jì)算機(jī)應(yīng)該具有語(yǔ)音輸入和語(yǔ)音識(shí)別的功能,即計(jì)算機(jī)具有聽(tīng)覺(jué),能夠“聽(tīng)懂”人話(huà),這就是語(yǔ)音識(shí)別的功能。無(wú)論,人與人之間,還是人與計(jì)算機(jī)之間的語(yǔ)音通信,語(yǔ)音信號(hào)處理,特別是語(yǔ)音信號(hào)處理的理論和技術(shù),都具有特別重要的作用。數(shù)字語(yǔ)音處理包含三個(gè)方面內(nèi)容:語(yǔ)音信號(hào)的數(shù)字表達(dá)方法語(yǔ)音信號(hào)的數(shù)字處理的各種方法以及數(shù)字語(yǔ)音處理理論和技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。這些內(nèi)容涉及到了數(shù)字信號(hào)處理計(jì)算機(jī)科學(xué)模式識(shí)別語(yǔ)音學(xué)生理學(xué)等學(xué)科,還涉及到通信和電子系統(tǒng),信號(hào)和信息處理系統(tǒng)等具體的應(yīng)用領(lǐng)域。對(duì)于語(yǔ)音信號(hào),數(shù)字處理比模擬處理具有更多優(yōu)點(diǎn)。這是因?yàn)椋旱谝?,?shù)字技術(shù)能夠完成很多很復(fù)雜的信號(hào)處理工作;第二,通過(guò)語(yǔ)音進(jìn)行交換的信息,本質(zhì)上具有離散的性質(zhì),因?yàn)檎Z(yǔ)音可以看成是語(yǔ)素的組合,這就特別適用于數(shù)字處理;第三,數(shù)字語(yǔ)音具有更高的可靠性?xún)r(jià)廉緊湊快速等特點(diǎn),很容易完成實(shí)時(shí)處理要求;第四,數(shù)字語(yǔ)音具有在強(qiáng)干擾信道中傳輸?shù)奶攸c(diǎn),易于和數(shù)據(jù)一起在通信網(wǎng)中傳輸,也易于進(jìn)行加密傳輸,因此,數(shù)字語(yǔ)音也是主要研究方向。語(yǔ)音信號(hào)處理的方法是多種多樣的。和一般的數(shù)字與信號(hào)的處理相類(lèi)似,其方法可以是時(shí)域的,也可以是頻域的,但都應(yīng)考慮到語(yǔ)音信號(hào)本身的特點(diǎn)。語(yǔ)音信號(hào)是時(shí)變信號(hào),只是在一個(gè)一個(gè)短段內(nèi)才可以看成平穩(wěn)的,因此,短時(shí)處理是處理語(yǔ)音信號(hào)的一種基本方法。在時(shí)域內(nèi),這就是各種短時(shí)處理技術(shù)的方法,如短時(shí)能量短是平均過(guò)零率及短時(shí)自相關(guān)函數(shù)等計(jì)算;在頻域內(nèi),這就是短時(shí)傅立葉變換方法。線(xiàn)性預(yù)測(cè)技術(shù)本質(zhì)上屬于時(shí)域分析方法,但結(jié)果可以是頻域的參數(shù)。數(shù)字語(yǔ)音處理有著廣泛的應(yīng)用領(lǐng)域,其中最重要的包括:語(yǔ)音壓縮語(yǔ)音合成、語(yǔ)音識(shí)別以及語(yǔ)音增強(qiáng)。這些方面的研究以深入到通信辦公自動(dòng)化遠(yuǎn)距離控制聲控電話(huà)撥號(hào)計(jì)算機(jī)語(yǔ)音應(yīng)答,以及機(jī)器人聽(tīng)覺(jué)和口語(yǔ)系統(tǒng)等實(shí)用的系統(tǒng)中。1.2主要研究?jī)?nèi)容根據(jù)設(shè)計(jì)任務(wù)書(shū)的要求,本設(shè)計(jì)主要內(nèi)容如下:(1) 語(yǔ)音信號(hào)產(chǎn)生的數(shù)字模型,以及語(yǔ)音信號(hào)模型的建立機(jī)理。(2) 語(yǔ)音信號(hào)的時(shí)域分析。(3) 語(yǔ)音信號(hào)的頻域分析。(4) 語(yǔ)音信號(hào)的線(xiàn)性預(yù)測(cè)技術(shù)。(5) matlab軟件編程。第三第四章主要是介紹如何將本不平穩(wěn)的語(yǔ)音信號(hào)轉(zhuǎn)換為平穩(wěn)的語(yǔ)音信號(hào),以及短時(shí)處理的一些基本理論和方法。第五章是本書(shū)要重點(diǎn)研究的內(nèi)容,也是語(yǔ)音處理一種非常重要的方法。 第六章是對(duì)matlab的一些基本介紹和程序上的運(yùn)用。1.3語(yǔ)音處理技術(shù)的發(fā)展概況語(yǔ)音處理研究的歷史可追溯到1876年貝爾發(fā)明電話(huà),那是首次采用聲電電聲轉(zhuǎn)換技術(shù)實(shí)現(xiàn)遠(yuǎn)距離語(yǔ)音通訊。1939年h.dudley 研制成功了第一個(gè)聲碼器,這一發(fā)明奠定了語(yǔ)音數(shù)字模型的基本思想,在語(yǔ)音信號(hào)處理領(lǐng)域具有劃時(shí)代的意義。1958年duddley等人改進(jìn)了數(shù)字實(shí)驗(yàn)裝置,將語(yǔ)音分割為元音和輔音等單元。六十年代以來(lái),有關(guān)語(yǔ)音信號(hào)處理的論文數(shù)量達(dá)到高峰,但處理方多以軟件形式出現(xiàn)。八十年代以來(lái)出現(xiàn)的語(yǔ)音信號(hào)處理產(chǎn)品的熱潮.ibm于1997年推出的漢語(yǔ)聽(tīng)寫(xiě)機(jī),為語(yǔ)音識(shí)別技術(shù)的實(shí)際應(yīng)用開(kāi)辟了新的道路。近幾年來(lái),語(yǔ)音信號(hào)處理不僅在理論上取得了重大進(jìn)步,而且其應(yīng)用范圍也不斷擴(kuò)大。如自動(dòng)控制系統(tǒng),公共交通中的自動(dòng)報(bào)站各種場(chǎng)合的自動(dòng)報(bào)警公安機(jī)關(guān)破案等國(guó)家安全事務(wù)有重要應(yīng)用。現(xiàn)在,語(yǔ)音信號(hào)處理的理論與方法已成為許多專(zhuān)業(yè)的共同基礎(chǔ)。2 語(yǔ)音信號(hào)的數(shù)字建模語(yǔ)音信號(hào)分析大體上有時(shí)域、頻域、倒譜域等分析方法。但是按語(yǔ)音學(xué)觀(guān)點(diǎn),可將它分為模型分析法和非模型分析法兩種。模型分析法是依據(jù)語(yǔ)音信號(hào)的數(shù)學(xué)模型的理論來(lái)求得這些模型參數(shù),而將其它分析方法籠統(tǒng)地歸于非模型分析法中。模型分析法中的各種模型只適合于信號(hào)是平穩(wěn)或局部平穩(wěn)的情形。由于不同的語(yǔ)音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種肌肉運(yùn)動(dòng)相對(duì)于語(yǔ)音頻率來(lái)說(shuō)是極緩慢的,因此一般認(rèn)為在2040ms的短時(shí)間內(nèi)語(yǔ)音信號(hào)是平穩(wěn)的,所以完全可以用短時(shí)平穩(wěn)的分析方法。語(yǔ)音信號(hào)產(chǎn)生模型是對(duì)發(fā)聲器官的模擬和仿真。數(shù)字模型就是用數(shù)字處理方法實(shí)現(xiàn)這種物理系統(tǒng)的模擬,由此可估計(jì)出語(yǔ)音波形的參數(shù),因此,這種數(shù)字模型也是語(yǔ)音參數(shù)模型。我們知道發(fā)聲器官能發(fā)出一系列的聲波是出于聲道受到氣流的激勵(lì)而產(chǎn)生的。聲道的一端是喉,另一端是嘴,其中包含有聲帶、聲門(mén)、口腔和鼻腔等。根據(jù)聲帶振動(dòng)與否,語(yǔ)音可分為濁音和清音兩大類(lèi)。聲帶在氣流的作用下發(fā)生振動(dòng),從而產(chǎn)生準(zhǔn)周期的聲波激勵(lì),這種激勵(lì)經(jīng)過(guò)口腔和鼻腔的諧振作用而形成濁音,有時(shí)稱(chēng)為有聲音。氣流經(jīng)過(guò)口腔的唇齒部分,如果引起湍流就產(chǎn)生摩擦音,有時(shí)因?yàn)榇讲客蝗粡堥_(kāi)而形成爆破音。凡是聲帶不振動(dòng)的聲音,統(tǒng)稱(chēng)清音,有時(shí)也稱(chēng)為無(wú)聲音。用數(shù)字方法模擬這種功能時(shí),用準(zhǔn)周期的脈沖序列來(lái)模擬聲帶振動(dòng)的激勵(lì),而用隨機(jī)噪聲模擬清音的激勵(lì),口腔、鼻腔等所組成的聲道諧振特性可用時(shí)變數(shù)字濾波器來(lái)模擬。所謂建立數(shù)學(xué)模型,就是要尋找一種可以表達(dá)一定物理狀態(tài)下量與量的數(shù)學(xué)表示。建立了數(shù)學(xué)模型才能夠用計(jì)算機(jī)對(duì)語(yǔ)音信號(hào)進(jìn)行模擬和處理。建立數(shù)學(xué)模型的基本原則是要使這種關(guān)系不僅能具有最大的精確度,還要最簡(jiǎn)單。數(shù)字濾波器的頻率響應(yīng)受到一些參數(shù)的控制。不斷控制清濁音開(kāi)關(guān)、激勵(lì)脈沖的周期以及噪聲源強(qiáng)度,同時(shí)隨著不同的發(fā)音改變?yōu)V波器特性,輸出的信號(hào)就是所要求的語(yǔ)音信號(hào)序列。通過(guò)對(duì)發(fā)音機(jī)理和語(yǔ)音信號(hào)的產(chǎn)生機(jī)理的分析,可以將語(yǔ)音信號(hào)分為三個(gè)部分,在聲帶以下,稱(chēng)為“聲門(mén)子系統(tǒng)”,它負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng),是“激勵(lì)系統(tǒng)”;從聲門(mén)到嘴唇的呼氣通道是聲道,是“聲道系統(tǒng)”;語(yǔ)音從嘴唇輻射出去,所以嘴唇以外是“輻射系統(tǒng)”。如圖2-1所示為語(yǔ)音信號(hào)的產(chǎn)生模型:圖2-1 語(yǔ)音信號(hào)產(chǎn)生模型語(yǔ)音信號(hào)是一個(gè)局部平穩(wěn)的隨機(jī)信號(hào),它的激勵(lì)參數(shù)和聲道濾波器的參數(shù)均隨時(shí)間而變化,但是由于發(fā)聲器官的慣性使這些參數(shù)的變化速度受到限制, 對(duì)于聲道參數(shù),在一較短的時(shí)間內(nèi)(1030ms)可近似認(rèn)為是不變的,因此語(yǔ)音的短時(shí)分析幀長(zhǎng)一般取為20ms左右。對(duì)于激勵(lì)源參數(shù),大多數(shù)情況下這一結(jié)論也是正確的。但是有些音的變化速度特別快,例如塞音或塞擦音的爆破段,20ms的時(shí)間間隔就過(guò)長(zhǎng),這時(shí)取5ms的間隔更為恰當(dāng)。模型中將語(yǔ)音信號(hào)截然分為受周期脈沖激勵(lì)和噪聲激勵(lì)兩種情況,與實(shí)際情況并不完全符合,將清濁音開(kāi)關(guān)換為疊加號(hào)更為合適,這樣激勵(lì)信號(hào)可以是上述兩種激勵(lì)按任意比例相疊加,這更加符合實(shí)際情況(即使如此,這個(gè)模型也不能完全包括所有的情況)。除了這些限制以外,這個(gè)模型的局限性主要表現(xiàn)在它的傳輸函數(shù)不包含有限傳輸零點(diǎn),而像鼻音、擦音這樣一些音的聲道傳輸函數(shù)中是包含有限零點(diǎn)的。一種解決問(wèn)題的方法是在聲道模型中引入若干有限傳輸零點(diǎn),但是這將使模型復(fù)雜化。另一種方法是適當(dāng)提高階數(shù)p,使得全極點(diǎn)模型能更好地逼近具有此種零點(diǎn)的傳輸函數(shù)。綜上所述,完整的語(yǔ)音信號(hào)得數(shù)字模型可以用三個(gè)子模型:激勵(lì)模型聲道模型和輻射模型的串聯(lián)來(lái)表示。它的傳遞函數(shù)可表示為:h(z)=au(z)v(z)r(z) (2-1)這里,u(z)是激勵(lì)信號(hào),濁音時(shí)u(z)是聲門(mén)脈沖即斜三角脈沖序列的z變換;在清音的情況下,u(z)是一個(gè)隨機(jī)噪聲的z變換。v(z)是聲道傳輸函數(shù),既可以用聲管模型,也可以用共峰模型來(lái)描述。實(shí)際上就是全集點(diǎn)模型: 應(yīng)該指出,式(2-1)所示模型的內(nèi)部結(jié)構(gòu)并不和物理過(guò)程相一致,但這種模型和真實(shí)的模型在輸出上是一致的。另外,這種模型是“短時(shí)”的模型,因?yàn)橐恍┱Z(yǔ)音信號(hào)的變化是緩慢的,例如元音在1020ms內(nèi)其參數(shù)是假定不變的。這里聲道轉(zhuǎn)移函數(shù)v(z)是一個(gè)參數(shù)隨時(shí)間變化的模型。另外,這一模型認(rèn)為語(yǔ)音是聲門(mén)激勵(lì)線(xiàn)形預(yù)測(cè)系統(tǒng)聲道所產(chǎn)生的;實(shí)際上,聲帶-聲道相互作用的非線(xiàn)形特征還有待研究。另外,模型中,用濁音和清音這種簡(jiǎn)單的劃分方法是有缺陷的,對(duì)于某些音是不適用的,例如濁音當(dāng)中的摩擦音。這種音要有發(fā)濁音和發(fā)清音的兩種激勵(lì),而且兩者不是簡(jiǎn)單的疊加關(guān)系。對(duì)于這些音可以用一些修正模型或更精確的模型來(lái)模擬.3 語(yǔ)音信號(hào)的時(shí)域分析語(yǔ)言信號(hào)的時(shí)域分析就是分析和提取語(yǔ)音信號(hào)的時(shí)域參數(shù)。進(jìn)行語(yǔ)音分析時(shí),最先接觸到并且也是最直觀(guān)的是它的時(shí)域波形。語(yǔ)音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析就是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語(yǔ)音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語(yǔ)音的分割、預(yù)處理、大分類(lèi)等。這種分析方法的特點(diǎn)是:(1)表示語(yǔ)音信號(hào)比較直觀(guān)、物理意義明確。(2)實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單、運(yùn)算量少。(3)可以得到語(yǔ)音的一些重要參數(shù)。(4)只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。語(yǔ)音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)和短視平均幅度差函數(shù)等,這是語(yǔ)音信號(hào)的一組最基本的短時(shí)參量,在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參量時(shí)使用的一般是方窗或汗明窗?,F(xiàn)在分別討論如下。3.1短時(shí)能量及短時(shí)平均幅度分析設(shè)語(yǔ)音波形時(shí)域信號(hào)為x(l)、加窗分鎮(zhèn)處理后得到的第n真語(yǔ)音信號(hào)為xn(m), 則xn(m)滿(mǎn)足下式: xn(m)=w(m)x(n+m) 0m0)。因此由式(5-16)看出 , k-10或l0)的情況下,h(z)只有極點(diǎn),即 (5-20)相應(yīng)的差分方程為 (5-21)信號(hào)的功率譜為 (5-22)這種形式的信號(hào)模型稱(chēng)為全極點(diǎn)模型或自回歸模型(簡(jiǎn)稱(chēng)為ar模型)。p階自回歸模型一般表示為ar(p)。這是一種最重要,應(yīng)用最廣的模型。對(duì)于ar(p)模型,式(6.20)中的bl應(yīng)代之以單位取樣序列,于是得到 (5-23) 考慮到h(k)的因果性,即當(dāng)k0時(shí)有h(-k)=0;同時(shí)根據(jù)初值定理1知道 (5-24)所以,式(6.24)可簡(jiǎn): (5-25) 式中a0=1。這就是ar(p)模型的模型參數(shù)與信號(hào)自相關(guān)函數(shù)之間的關(guān)系式。將其與線(xiàn)性預(yù)測(cè)的yule-walker方程式(5-11)對(duì)照可以看出,如果線(xiàn)性預(yù)測(cè)和信號(hào)模型是對(duì)同一信號(hào)而言的,即兩個(gè)方程組中的已知數(shù)相同rzz(k-l)=r(k-l),那么兩組方程的解應(yīng)當(dāng)相同(可以證明,只要r(k-l)或rzz(k-l)是正定的,則兩組方程有唯一解),即 (5-26)這意味著,解最佳線(xiàn)性預(yù)測(cè)問(wèn)題等效于解信號(hào)模型問(wèn)題。具體地說(shuō),信號(hào)x(n)的線(xiàn)性系數(shù)和它的ar(p)模型參數(shù)al相同,而預(yù)測(cè)誤差功率與模型的極力源的功率相同。一個(gè)平穩(wěn)隨機(jī)過(guò)程,如果它是p階自回歸過(guò)程,那么用一個(gè)ar(p)模型就能精確地描述它。在第二章曾經(jīng)討論過(guò),語(yǔ)音信號(hào)可以看成是一個(gè)線(xiàn)性時(shí)變系統(tǒng)在準(zhǔn)周期脈沖序列(相應(yīng)于濁音)或隨機(jī)噪聲(相應(yīng)與清音)激勵(lì)下所產(chǎn)生的輸出,參看圖2.1。在語(yǔ)音信號(hào)的這個(gè)數(shù)字模型中,時(shí)變線(xiàn)性系統(tǒng)綜合反映了輻射、聲門(mén)脈沖以及聲道的總的影響,并且對(duì)于除鼻音和摩擦音以外的大多數(shù)語(yǔ)音來(lái)說(shuō),都可以用一個(gè)全極點(diǎn)系統(tǒng)來(lái)表示。這個(gè)全極點(diǎn)時(shí)變線(xiàn)性系統(tǒng)的參數(shù)隨著時(shí)間的變化是非常緩慢的,因而可以近似地認(rèn)為,在一 語(yǔ)音時(shí)間內(nèi)它是非時(shí)變的。這樣一來(lái),圖2.1所表示的語(yǔ)音信號(hào)模型,正是一個(gè)平穩(wěn)隨機(jī)過(guò)程的自回歸模型(在短時(shí)間內(nèi)可以近似的認(rèn)為語(yǔ)音信號(hào)是平穩(wěn)的)。根據(jù)本節(jié)前面的討論,很容易理解,線(xiàn)性預(yù)測(cè)是描述語(yǔ)音信號(hào)的一種很精確的方法。對(duì)語(yǔ)音信號(hào)進(jìn)行線(xiàn)性預(yù)測(cè)分析,其合理性和精確性可以從另一個(gè)角度來(lái)加以解釋。線(xiàn)性預(yù)測(cè)系數(shù)(等效于語(yǔ)音信號(hào)的模型參數(shù))是根據(jù)最小均方誤差準(zhǔn)則來(lái)決定的,而最小均方誤差恰等于信號(hào)模型的激勵(lì)源的方差;另一方面,語(yǔ)音信號(hào)模型的激勵(lì)源只能是準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì),而這兩種序列的均方值都是最小的。由此可見(jiàn),對(duì)語(yǔ)音信號(hào)進(jìn)行線(xiàn)性預(yù)測(cè)分析是合理的。反過(guò)來(lái)說(shuō),如果用某個(gè)準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì)一個(gè)全極點(diǎn)系統(tǒng),產(chǎn)生出某個(gè)信號(hào),然后根據(jù)該信號(hào)p個(gè)取樣值對(duì)信號(hào)的當(dāng)前值進(jìn)行預(yù)測(cè),而且在均方誤差最小的意義上這種預(yù)測(cè)是最佳的,那么預(yù)測(cè)系數(shù)必將等于全極點(diǎn)系統(tǒng)的參數(shù)。最后需要指出,對(duì)語(yǔ)音信號(hào)x(n) 進(jìn)行線(xiàn)性預(yù)測(cè),實(shí)際上意味著建立一個(gè)由白噪聲源激勵(lì)一個(gè)全極點(diǎn)系統(tǒng)的自回歸模型,使得該模型產(chǎn)生的信號(hào)在z(n)的自相關(guān)函數(shù)與語(yǔ)音信號(hào)x(n)的自相關(guān)函數(shù)相匹配,或者說(shuō)使得z(n)和x(n)的譜包絡(luò)相匹配。5.4 levinson-durbin 算法通過(guò)以上討論可以看到:求取信號(hào)的模型參數(shù)可以通過(guò)線(xiàn)性預(yù)測(cè)來(lái)完成,而線(xiàn)性預(yù)測(cè)系數(shù)以及預(yù)測(cè)誤差功率可以有式(5.11)所表示的yule-walker方程解出。本節(jié)討論由已知的自相關(guān)函數(shù),通過(guò)解式(5.11)以求取線(xiàn)性預(yù)測(cè)系數(shù)及預(yù)測(cè)誤差功率的方法。將式(5.11)寫(xiě)成矩陣形式,并注意到平穩(wěn)隨機(jī)信號(hào)的自相關(guān)函數(shù)的對(duì)稱(chēng)性質(zhì),可以得到下面的結(jié)果: (5-27)值得注意的是,上列方程組的系數(shù)矩陣中,沿任何一條對(duì)角線(xiàn)上的元素都相同,這樣的矩陣稱(chēng)為toeplitz矩陣,同時(shí)系數(shù)矩陣還是一個(gè)對(duì)稱(chēng)矩陣。利用系數(shù)矩陣的對(duì)稱(chēng)toeplitz性質(zhì),提出了一種高效算法來(lái)求解該方程組,這就是著名的levinson-durbin算法,簡(jiǎn)稱(chēng)為levinson算法,該算法的運(yùn)算數(shù)量級(jí)為o(p2),而線(xiàn)性方程組的一般解法的運(yùn)算量數(shù)量級(jí)為o(p3),后者比前者要大的多。levinson算法是一個(gè)迭代計(jì)算過(guò)程。它從最低預(yù)測(cè)器開(kāi)始,由低階到高階,逐階進(jìn)行遞推計(jì)算。即是說(shuō),總是由前一階段預(yù)測(cè)器求出了所要求的p階預(yù)測(cè)器的系數(shù),而且得到了所有低階預(yù)測(cè)器的系數(shù)。在圖5-2中,最上面表示了過(guò)去p個(gè)取樣值預(yù)測(cè)當(dāng)前值xn;下面依次畫(huà)出了1階、2階、3階、p階預(yù)測(cè)器的預(yù)測(cè)系數(shù);旁邊寫(xiě)出了個(gè)階預(yù)測(cè)誤差。預(yù)測(cè)系數(shù)有兩個(gè)下標(biāo),第一個(gè)下標(biāo)表示階數(shù),第二個(gè)下標(biāo)表示該階預(yù)測(cè)器系數(shù)的序數(shù)。 1 1 1 1 圖5-2levinson算法遞推示意圖為了說(shuō)明levinson算法的迭代計(jì)算過(guò)程,現(xiàn)在討論在已知第p階預(yù)測(cè)器系數(shù)后如何求出第p+1階預(yù)測(cè)器系數(shù)的問(wèn)題。圖5.3表示了第p階預(yù)測(cè)器和第p+1階預(yù)測(cè)器,其中第p階預(yù)測(cè)器假定是已知的。現(xiàn)在的問(wèn)題是,如何根據(jù)第p階預(yù)測(cè)器系數(shù)計(jì)算出第p+1階預(yù)測(cè)器的系數(shù),說(shuō)者說(shuō),如何找出二者的迭代計(jì)算關(guān)系式。levinson算法的推導(dǎo)方法有多種,下面介紹1980年提出的一種推導(dǎo)方法,稱(chēng)之為缺口推導(dǎo)方法(gapped function method)23 1 1圖5-3 由p階預(yù)測(cè)器遞推p+1階預(yù)測(cè)器缺口函數(shù)定義為預(yù)測(cè)誤差與觀(guān)測(cè)數(shù)據(jù)(即xn-1,xn-2, ,xn-p)之間的相互關(guān),即 (5-28)式中rex(k)代表與xn-1,xn-2, , xn-p之間的互相關(guān)函數(shù),r(k-l)代表滯后為(k-l)時(shí)x(n)的自相關(guān)函數(shù)。根據(jù)正交定理(見(jiàn)式(5-6)可得到 (5-29)這是p階預(yù)測(cè)器應(yīng)該滿(mǎn)足的條件?,F(xiàn)在的任務(wù)是利用 造p+1階預(yù)測(cè)器的缺口函數(shù).顯然,gp+1(k)的缺口應(yīng)該等于p+1.為此,先將對(duì)稱(chēng)于縱軸進(jìn)行折疊,得 ;然后將其右移p+1個(gè)單位,于是得到 現(xiàn)在 與 的缺口已經(jīng)對(duì)齊了。為了得到一個(gè)缺口寬度為p+1的新的缺口函數(shù),可將 乘以某個(gè)常量 ,然后將其從 中減去,這樣便得到一個(gè)新的缺口函數(shù),用 表示,即 (5-30)式中 的選擇應(yīng)使缺口擴(kuò)大一個(gè)單位(從原來(lái)的p增為p+1)。為此,選擇 使下式成立: (5-31)這就是說(shuō),選擇 使得 的缺口右邊的第一個(gè)取樣值經(jīng)加權(quán)后恰好等于 缺口右邊的第一個(gè)取樣值。式(5-31)即 (5-32)由此得到 (5-33)根據(jù)式(5-28)關(guān)于缺口函數(shù)的定義,可以得到 (5-34)將式(5-34)代入(5-33),得到 (5-35)這個(gè)加權(quán)系數(shù)稱(chēng)做為反射系數(shù)。由式(6.10)知道,最小均方誤差等于 (5-36)為了區(qū)別不同階段的預(yù)測(cè)器的最小均方預(yù)測(cè)誤差,用下標(biāo)來(lái)表示階,例如第p階預(yù)測(cè)器的最小均方預(yù)測(cè)誤差用 表示。于是,有聯(lián)系到缺口函數(shù)的定義式(5-28),式(5-36)也可以寫(xiě)成類(lèi)似地有 (5-37)將式(5-33)代入上式,得到 (5-38)這就是最小均方預(yù)測(cè)誤差的遞推計(jì)算公式。下面推導(dǎo)線(xiàn)性預(yù)測(cè)系數(shù)的遞推計(jì)算公式。首先寫(xiě)出p階和p+1階線(xiàn)性預(yù)測(cè)器的缺口函數(shù)的定義式: (5-39)對(duì)上二式求z變換得到 (5-40)式中的和 是 和 的z變換; 是r(k)的z變換,即信號(hào)x(n)的功率譜; 和 分別是序列 (l=0,1, ,p+1)的z變換,稱(chēng)為預(yù)測(cè)多項(xiàng)式,即 (5-41)另一方面,取式(5-31)的z變換得到 (5-42)將式(5-40)代入式(5-42),得 (5-43)考慮到自相關(guān)函數(shù)的對(duì)稱(chēng)性,由上式可以得出這就是由p階預(yù)測(cè)多項(xiàng)式迭代計(jì)算p+1階預(yù)測(cè)多項(xiàng)式的公式。對(duì)上式取反z變換,便得到預(yù)測(cè)系數(shù)的迭代計(jì)算式 (5-44)或 (5-45)以上三個(gè)式子是相互等效的??偟膩?lái)說(shuō),式(5-35),(5-38),和(5-43)便構(gòu)成了完整的levinson迭代算法。迭代計(jì)算從零階即從p=0開(kāi)始。零階預(yù)測(cè)即不做預(yù)測(cè),這時(shí)預(yù)測(cè)多項(xiàng)式為 預(yù)測(cè)誤差為預(yù)測(cè)誤差功率為以上便是迭代計(jì)算的初始條件。迭代計(jì)算步驟如下:(1) 初始化(2)假設(shè)已知p階預(yù)測(cè)器的參數(shù),即已知 和 。(3)計(jì)算p+1階預(yù)測(cè)器的反射系數(shù)(4)計(jì)算p+1階預(yù)測(cè)器的預(yù)測(cè)多項(xiàng)式(5)計(jì)算p+1階預(yù)測(cè)誤差功率(式(5-38))(6)返回第(2)步。當(dāng)?shù)^(guò)程達(dá)到預(yù)先指定的階時(shí),迭代計(jì)算終止。計(jì)算結(jié)束后,得到了以下三類(lèi)結(jié)果: (1)各階預(yù)測(cè)器的預(yù)測(cè)系數(shù)。(2)各階預(yù)測(cè)器的反射系數(shù)。(2) 各階預(yù)測(cè)器誤差功率。5.5 線(xiàn)性預(yù)測(cè)的頻域解釋迄今為止,一直是在時(shí)域中根據(jù)差分方程和相關(guān)函數(shù)來(lái)討論線(xiàn)性預(yù)測(cè)問(wèn)題。本節(jié)將從頻域的角度對(duì)線(xiàn)性預(yù)測(cè)做出解釋?zhuān)瑥亩玫礁羁痰恼J(rèn)識(shí)。對(duì)語(yǔ)音進(jìn)行線(xiàn)性預(yù)測(cè)分析的結(jié)果,對(duì)應(yīng)于每一幀語(yǔ)音將得到一組線(xiàn)性預(yù)測(cè)系數(shù)。這組系數(shù)正是語(yǔ)音產(chǎn)生模型中全極點(diǎn)線(xiàn)性濾波器的參數(shù)。說(shuō)的準(zhǔn)確些,這組系數(shù)正是濾波器的傳輸函數(shù)的分母和多項(xiàng)式的系數(shù)。由于全極點(diǎn)濾波器是聲門(mén),聲道的共振特性。當(dāng)根據(jù)一幀語(yǔ)音取樣求得一組線(xiàn)性預(yù)測(cè)系數(shù)后,也就意味著求得了這真語(yǔ)音信號(hào)的產(chǎn)生模型中全極點(diǎn)線(xiàn)性濾波器的頻率特性。根據(jù)語(yǔ)音信號(hào)的產(chǎn)生模型,語(yǔ)音的功率譜等于激勵(lì)源的功率譜與全極點(diǎn)線(xiàn)性濾波器頻率特性的摸的平方的乘積。激勵(lì)源是(準(zhǔn)周期)沖激序列或白噪聲,其功率譜是平坦的,因此語(yǔ)音的功率譜主要地由全極點(diǎn)濾波器的頻率特性所確定,這樣,線(xiàn)性預(yù)測(cè)可以看成是對(duì)語(yǔ)音信號(hào)的短時(shí)譜進(jìn)行估計(jì)的一種有效方法。 6 算法的軟件實(shí)現(xiàn)本設(shè)計(jì)選擇了levinson-durbin算法,并對(duì)其進(jìn)行了軟件實(shí)現(xiàn)。首先我先采用c語(yǔ)言對(duì)此算法進(jìn)行了編程,然后又用vc語(yǔ)言使其生成一個(gè)動(dòng)態(tài)鏈接庫(kù),最后用matlab調(diào)用該動(dòng)態(tài)鏈接庫(kù),最終完成了matlab對(duì)該算法的軟件實(shí)現(xiàn)。在以下的章節(jié),將對(duì)上述步驟做進(jìn)一步的闡述。為了使運(yùn)算結(jié)果清晰直觀(guān),在matlab中還采用了界面顯示結(jié)果的方式,使得處理的運(yùn)算結(jié)果更加直觀(guān)。關(guān)于圖形用戶(hù)界面的生成,雖然不屬于本設(shè)計(jì)的主體部分,但本設(shè)計(jì)也做了一定層面的研究。6.1 matlab語(yǔ)言簡(jiǎn)介matlab是matrix和laboratory前三個(gè)字母的縮寫(xiě),意思是“矩陣實(shí)驗(yàn)室”,是mathworks公司推出的數(shù)學(xué)類(lèi)科技應(yīng)用軟件。其dos版本發(fā)行于1984年,現(xiàn)已推出了windows版本。經(jīng)過(guò)十多年的不斷發(fā)展和完善,它已成為國(guó)際上公認(rèn)的最優(yōu)秀的科技應(yīng)用軟件。它具有如下主要特點(diǎn):1)具有豐富的數(shù)學(xué)功能,其中包括矩陣各種運(yùn)算,如正交變換,三角分解,特征值,常見(jiàn)的特殊矩陣;包括各種特殊函數(shù),如貝塞爾函數(shù),勒讓德函數(shù),伽嗎函數(shù),貝塔函數(shù),橢圓函數(shù)等;包括各種數(shù)學(xué)運(yùn)算功能,如數(shù)值微分,數(shù)值積分,插值,求極值,方程求根,fft,常微分方程的數(shù)值解,殘數(shù)計(jì)算等等。也就是說(shuō),matlab給使用者提供了足夠多的數(shù)學(xué)工具,以便他們來(lái)解決各種各樣的理論問(wèn)題和工程問(wèn)題。2)具有很好的繪圖功能,可方便地畫(huà)出二維和三維圖形,如直角坐標(biāo)曲線(xiàn)圖,極坐標(biāo)曲線(xiàn),直方圖,對(duì)數(shù)坐標(biāo)曲線(xiàn),網(wǎng)格圖,三維曲面圖,等高線(xiàn)圖,區(qū)域圖等,同時(shí)屏幕上出現(xiàn)的各種圖形均可輸送到打印機(jī)直接打印,或輸送到windows的剪貼板內(nèi)供各種應(yīng)用軟件調(diào)用。3)使用方便,便于掌握,便于修改,使用matlab語(yǔ)言編寫(xiě)的程序可直接運(yùn)行而無(wú)須進(jìn)行編譯。具有很友好的圖形界面,且使用者可根據(jù)自己的需求方便的編寫(xiě)出自己所希望的圖形界面。擴(kuò)充性能很好,使用者可使用此語(yǔ)言編寫(xiě)出自己所需的各種函數(shù),同時(shí)采用一定的措施之后可以直接調(diào)用c語(yǔ)言的函數(shù)及fortran語(yǔ)言的子程序。4)具有若干功能強(qiáng)大的應(yīng)用工具箱,如語(yǔ)音處理,通信,小波變換,圖象處理,統(tǒng)計(jì),仿真,插值,符號(hào)運(yùn)算,系統(tǒng)識(shí)別,系統(tǒng)優(yōu)化,神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)庫(kù),功率系統(tǒng),地圖,偏微分方程,系統(tǒng)控制,模糊邏輯等。5)可以直接處理計(jì)算機(jī)內(nèi)的聲音文件;安裝圖形處理工具箱后,可以直接處理各種格式的圖形文件,如:bmp,gif,pcx,和jpeg等等。matlab的命令又稱(chēng)為函數(shù),其名稱(chēng)的后綴為.m。matlab語(yǔ)言采用解釋運(yùn)行的方式,在這一點(diǎn)上它的運(yùn)行方式與basic語(yǔ)言類(lèi)似,在程序運(yùn)行的過(guò)程中可以隨時(shí)顯示中間的結(jié)果,這樣便于查找程序中的錯(cuò)誤。另外由于用matlab語(yǔ)言編寫(xiě)的程序無(wú)須進(jìn)行編譯,因此它本身就像一個(gè)超級(jí)的函數(shù)計(jì)算器。由于很多的matlab語(yǔ)言的命令與人們通常的書(shū)寫(xiě)習(xí)慣類(lèi)似,因此有人又稱(chēng)之為演算紙似的科學(xué)工程計(jì)算語(yǔ)言。由于matlab語(yǔ)言本身所具有的種種特點(diǎn),它特別適合對(duì)電子系統(tǒng)進(jìn)行信號(hào)處理,在通信等工具箱內(nèi),設(shè)有專(zhuān)門(mén)為電子系統(tǒng)設(shè)計(jì)的各種專(zhuān)門(mén)的函數(shù),可以進(jìn)行各種模擬和數(shù)字濾波器的設(shè)計(jì)和分析。matlab語(yǔ)言的另一個(gè)突出的優(yōu)點(diǎn)就是便于學(xué)習(xí),容易掌握。一般來(lái)說(shuō),一個(gè)初學(xué)者可在幾十分鐘內(nèi)學(xué)會(huì)并掌握它的基本操作命令,進(jìn)而就可以解決一些比較煩瑣的數(shù)學(xué)運(yùn)算問(wèn)題,如矩陣求逆。由于matlab給使用者提供了極為豐富的,現(xiàn)成的數(shù)學(xué)工具,因此使用者無(wú)須掌握很復(fù)雜的編程技巧,如排隊(duì),指針,堆棧等等。另外,matlab本身提供了十分明確,十分詳細(xì)的聯(lián)機(jī)幫助文件,便于使用者進(jìn)行自學(xué),而無(wú)須依賴(lài)教師指導(dǎo)。6.2 vc中mex程序的建立和設(shè)置 一個(gè)mex程序?qū)嶋H上就是一個(gè)特別的dll,它的輸出函數(shù)為mexfunction。 那么在vc中就可用project wizard 建立一個(gè)dll工程,并為其指定輸出函數(shù)為mexfunction。1. 建立新的dll工程啟動(dòng)vc,選擇菜單file/new,在projects頁(yè)面中選擇mfc appwizard(dll),輸入路徑名和工程名,并單擊ok按鈕。這里將工程命名為mextest。2. 設(shè)定輸出函數(shù) appwizard 將會(huì)自動(dòng)生成如下幾個(gè)文件:* mextest.cpp* mextest.def * mextest.rc * stdafx.cpp需要mextest.def中指定該dll文件的輸出函數(shù),也就是mexfunction。為此,在vc的workspace欄中,單擊“fileview”屬性頁(yè),展開(kāi)“sourse files”欄,打開(kāi)文件mextest.def,將其內(nèi)容進(jìn)行編譯,在“exports”后面加入mexfunction一行。3. 環(huán)境設(shè)置 由于再編譯和連接mex程序的時(shí)候,需要用到matlab提供的若干頭文件和庫(kù)文件,因此應(yīng)該對(duì)這些文件的路徑進(jìn)行指定。在matlab6以前的版本中,沒(méi)有提供必要的庫(kù)文件,只提供了必要的def文件,必須由用戶(hù)自己用lib命令手工將def文件轉(zhuǎn)換為lib文件,步驟比較麻煩。在matlab6中,則直接提供lib文件,不需要用戶(hù)生成了。matlab對(duì)于不同版本的編譯器提供了不同的庫(kù)文件,分別放在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論