語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc

上傳人：伐*** IP屬地：寧夏上傳時(shí)間：2019-01-27 格式：DOC 頁(yè)數(shù)：68 大小：983KB 積分：20 舉報(bào) 版權(quán)申訴

語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第2頁(yè)

語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第3頁(yè)

語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第4頁(yè)

語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc_第5頁(yè)

已閱讀5頁(yè)，還剩63頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1 緒論1.1 綜述語(yǔ)音是人類(lèi)信息活動(dòng)的重要手段之一，語(yǔ)音不僅是人與人之間進(jìn)行信息交流的最直接最方便的和最有效的工具。人機(jī)對(duì)話(huà)意味著計(jì)算機(jī)應(yīng)該具有語(yǔ)音輸入和語(yǔ)音識(shí)別的功能，即計(jì)算機(jī)具有聽(tīng)覺(jué)，能夠“聽(tīng)懂”人話(huà)，這就是語(yǔ)音識(shí)別的功能。無(wú)論，人與人之間，還是人與計(jì)算機(jī)之間的語(yǔ)音通信，語(yǔ)音信號(hào)處理，特別是語(yǔ)音信號(hào)處理的理論和技術(shù)，都具有特別重要的作用。數(shù)字語(yǔ)音處理包含三個(gè)方面內(nèi)容：語(yǔ)音信號(hào)的數(shù)字表達(dá)方法語(yǔ)音信號(hào)的數(shù)字處理的各種方法以及數(shù)字語(yǔ)音處理理論和技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。這些內(nèi)容涉及到了數(shù)字信號(hào)處理計(jì)算機(jī)科學(xué)模式識(shí)別語(yǔ)音學(xué)生理學(xué)等學(xué)科，還涉及到通信和電子系統(tǒng)，信號(hào)和信息處理系統(tǒng)等具體的應(yīng)用領(lǐng)域。對(duì)于語(yǔ)音信號(hào)，數(shù)字處理比模擬處理具有更多優(yōu)點(diǎn)。這是因?yàn)椋旱谝?，?shù)字技術(shù)能夠完成很多很復(fù)雜的信號(hào)處理工作；第二，通過(guò)語(yǔ)音進(jìn)行交換的信息，本質(zhì)上具有離散的性質(zhì)，因?yàn)檎Z(yǔ)音可以看成是語(yǔ)素的組合，這就特別適用于數(shù)字處理；第三，數(shù)字語(yǔ)音具有更高的可靠性?xún)r(jià)廉緊湊快速等特點(diǎn)，很容易完成實(shí)時(shí)處理要求；第四，數(shù)字語(yǔ)音具有在強(qiáng)干擾信道中傳輸?shù)奶攸c(diǎn)，易于和數(shù)據(jù)一起在通信網(wǎng)中傳輸，也易于進(jìn)行加密傳輸，因此，數(shù)字語(yǔ)音也是主要研究方向。語(yǔ)音信號(hào)處理的方法是多種多樣的。和一般的數(shù)字與信號(hào)的處理相類(lèi)似，其方法可以是時(shí)域的，也可以是頻域的，但都應(yīng)考慮到語(yǔ)音信號(hào)本身的特點(diǎn)。語(yǔ)音信號(hào)是時(shí)變信號(hào)，只是在一個(gè)一個(gè)短段內(nèi)才可以看成平穩(wěn)的，因此，短時(shí)處理是處理語(yǔ)音信號(hào)的一種基本方法。在時(shí)域內(nèi)，這就是各種短時(shí)處理技術(shù)的方法，如短時(shí)能量短是平均過(guò)零率及短時(shí)自相關(guān)函數(shù)等計(jì)算；在頻域內(nèi)，這就是短時(shí)傅立葉變換方法。線(xiàn)性預(yù)測(cè)技術(shù)本質(zhì)上屬于時(shí)域分析方法，但結(jié)果可以是頻域的參數(shù)。數(shù)字語(yǔ)音處理有著廣泛的應(yīng)用領(lǐng)域，其中最重要的包括：語(yǔ)音壓縮語(yǔ)音合成、語(yǔ)音識(shí)別以及語(yǔ)音增強(qiáng)。這些方面的研究以深入到通信辦公自動(dòng)化遠(yuǎn)距離控制聲控電話(huà)撥號(hào)計(jì)算機(jī)語(yǔ)音應(yīng)答，以及機(jī)器人聽(tīng)覺(jué)和口語(yǔ)系統(tǒng)等實(shí)用的系統(tǒng)中。1.2主要研究?jī)?nèi)容根據(jù)設(shè)計(jì)任務(wù)書(shū)的要求，本設(shè)計(jì)主要內(nèi)容如下：(1) 語(yǔ)音信號(hào)產(chǎn)生的數(shù)字模型，以及語(yǔ)音信號(hào)模型的建立機(jī)理。(2) 語(yǔ)音信號(hào)的時(shí)域分析。(3) 語(yǔ)音信號(hào)的頻域分析。(4) 語(yǔ)音信號(hào)的線(xiàn)性預(yù)測(cè)技術(shù)。(5) matlab軟件編程。第三第四章主要是介紹如何將本不平穩(wěn)的語(yǔ)音信號(hào)轉(zhuǎn)換為平穩(wěn)的語(yǔ)音信號(hào)，以及短時(shí)處理的一些基本理論和方法。第五章是本書(shū)要重點(diǎn)研究的內(nèi)容，也是語(yǔ)音處理一種非常重要的方法。第六章是對(duì)matlab的一些基本介紹和程序上的運(yùn)用。1.3語(yǔ)音處理技術(shù)的發(fā)展概況語(yǔ)音處理研究的歷史可追溯到1876年貝爾發(fā)明電話(huà)，那是首次采用聲電電聲轉(zhuǎn)換技術(shù)實(shí)現(xiàn)遠(yuǎn)距離語(yǔ)音通訊。1939年h.dudley 研制成功了第一個(gè)聲碼器，這一發(fā)明奠定了語(yǔ)音數(shù)字模型的基本思想，在語(yǔ)音信號(hào)處理領(lǐng)域具有劃時(shí)代的意義。1958年duddley等人改進(jìn)了數(shù)字實(shí)驗(yàn)裝置，將語(yǔ)音分割為元音和輔音等單元。六十年代以來(lái)，有關(guān)語(yǔ)音信號(hào)處理的論文數(shù)量達(dá)到高峰，但處理方多以軟件形式出現(xiàn)。八十年代以來(lái)出現(xiàn)的語(yǔ)音信號(hào)處理產(chǎn)品的熱潮.ibm于1997年推出的漢語(yǔ)聽(tīng)寫(xiě)機(jī)，為語(yǔ)音識(shí)別技術(shù)的實(shí)際應(yīng)用開(kāi)辟了新的道路。近幾年來(lái)，語(yǔ)音信號(hào)處理不僅在理論上取得了重大進(jìn)步，而且其應(yīng)用范圍也不斷擴(kuò)大。如自動(dòng)控制系統(tǒng)，公共交通中的自動(dòng)報(bào)站各種場(chǎng)合的自動(dòng)報(bào)警公安機(jī)關(guān)破案等國(guó)家安全事務(wù)有重要應(yīng)用。現(xiàn)在，語(yǔ)音信號(hào)處理的理論與方法已成為許多專(zhuān)業(yè)的共同基礎(chǔ)。2 語(yǔ)音信號(hào)的數(shù)字建模語(yǔ)音信號(hào)分析大體上有時(shí)域、頻域、倒譜域等分析方法。但是按語(yǔ)音學(xué)觀(guān)點(diǎn)，可將它分為模型分析法和非模型分析法兩種。模型分析法是依據(jù)語(yǔ)音信號(hào)的數(shù)學(xué)模型的理論來(lái)求得這些模型參數(shù)，而將其它分析方法籠統(tǒng)地歸于非模型分析法中。模型分析法中的各種模型只適合于信號(hào)是平穩(wěn)或局部平穩(wěn)的情形。由于不同的語(yǔ)音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng)，而這種肌肉運(yùn)動(dòng)相對(duì)于語(yǔ)音頻率來(lái)說(shuō)是極緩慢的，因此一般認(rèn)為在2040ms的短時(shí)間內(nèi)語(yǔ)音信號(hào)是平穩(wěn)的，所以完全可以用短時(shí)平穩(wěn)的分析方法。語(yǔ)音信號(hào)產(chǎn)生模型是對(duì)發(fā)聲器官的模擬和仿真。數(shù)字模型就是用數(shù)字處理方法實(shí)現(xiàn)這種物理系統(tǒng)的模擬，由此可估計(jì)出語(yǔ)音波形的參數(shù)，因此，這種數(shù)字模型也是語(yǔ)音參數(shù)模型。我們知道發(fā)聲器官能發(fā)出一系列的聲波是出于聲道受到氣流的激勵(lì)而產(chǎn)生的。聲道的一端是喉，另一端是嘴，其中包含有聲帶、聲門(mén)、口腔和鼻腔等。根據(jù)聲帶振動(dòng)與否，語(yǔ)音可分為濁音和清音兩大類(lèi)。聲帶在氣流的作用下發(fā)生振動(dòng)，從而產(chǎn)生準(zhǔn)周期的聲波激勵(lì)，這種激勵(lì)經(jīng)過(guò)口腔和鼻腔的諧振作用而形成濁音，有時(shí)稱(chēng)為有聲音。氣流經(jīng)過(guò)口腔的唇齒部分，如果引起湍流就產(chǎn)生摩擦音，有時(shí)因?yàn)榇讲客蝗粡堥_(kāi)而形成爆破音。凡是聲帶不振動(dòng)的聲音，統(tǒng)稱(chēng)清音，有時(shí)也稱(chēng)為無(wú)聲音。用數(shù)字方法模擬這種功能時(shí)，用準(zhǔn)周期的脈沖序列來(lái)模擬聲帶振動(dòng)的激勵(lì)，而用隨機(jī)噪聲模擬清音的激勵(lì)，口腔、鼻腔等所組成的聲道諧振特性可用時(shí)變數(shù)字濾波器來(lái)模擬。所謂建立數(shù)學(xué)模型，就是要尋找一種可以表達(dá)一定物理狀態(tài)下量與量的數(shù)學(xué)表示。建立了數(shù)學(xué)模型才能夠用計(jì)算機(jī)對(duì)語(yǔ)音信號(hào)進(jìn)行模擬和處理。建立數(shù)學(xué)模型的基本原則是要使這種關(guān)系不僅能具有最大的精確度，還要最簡(jiǎn)單。數(shù)字濾波器的頻率響應(yīng)受到一些參數(shù)的控制。不斷控制清濁音開(kāi)關(guān)、激勵(lì)脈沖的周期以及噪聲源強(qiáng)度，同時(shí)隨著不同的發(fā)音改變?yōu)V波器特性，輸出的信號(hào)就是所要求的語(yǔ)音信號(hào)序列。通過(guò)對(duì)發(fā)音機(jī)理和語(yǔ)音信號(hào)的產(chǎn)生機(jī)理的分析，可以將語(yǔ)音信號(hào)分為三個(gè)部分，在聲帶以下，稱(chēng)為“聲門(mén)子系統(tǒng)”，它負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng)，是“激勵(lì)系統(tǒng)”；從聲門(mén)到嘴唇的呼氣通道是聲道，是“聲道系統(tǒng)”；語(yǔ)音從嘴唇輻射出去，所以嘴唇以外是“輻射系統(tǒng)”。如圖2-1所示為語(yǔ)音信號(hào)的產(chǎn)生模型：圖2-1 語(yǔ)音信號(hào)產(chǎn)生模型語(yǔ)音信號(hào)是一個(gè)局部平穩(wěn)的隨機(jī)信號(hào)，它的激勵(lì)參數(shù)和聲道濾波器的參數(shù)均隨時(shí)間而變化，但是由于發(fā)聲器官的慣性使這些參數(shù)的變化速度受到限制，對(duì)于聲道參數(shù)，在一較短的時(shí)間內(nèi)(1030ms)可近似認(rèn)為是不變的，因此語(yǔ)音的短時(shí)分析幀長(zhǎng)一般取為20ms左右。對(duì)于激勵(lì)源參數(shù)，大多數(shù)情況下這一結(jié)論也是正確的。但是有些音的變化速度特別快，例如塞音或塞擦音的爆破段，20ms的時(shí)間間隔就過(guò)長(zhǎng)，這時(shí)取5ms的間隔更為恰當(dāng)。模型中將語(yǔ)音信號(hào)截然分為受周期脈沖激勵(lì)和噪聲激勵(lì)兩種情況，與實(shí)際情況并不完全符合，將清濁音開(kāi)關(guān)換為疊加號(hào)更為合適，這樣激勵(lì)信號(hào)可以是上述兩種激勵(lì)按任意比例相疊加，這更加符合實(shí)際情況(即使如此，這個(gè)模型也不能完全包括所有的情況)。除了這些限制以外，這個(gè)模型的局限性主要表現(xiàn)在它的傳輸函數(shù)不包含有限傳輸零點(diǎn)，而像鼻音、擦音這樣一些音的聲道傳輸函數(shù)中是包含有限零點(diǎn)的。一種解決問(wèn)題的方法是在聲道模型中引入若干有限傳輸零點(diǎn)，但是這將使模型復(fù)雜化。另一種方法是適當(dāng)提高階數(shù)p，使得全極點(diǎn)模型能更好地逼近具有此種零點(diǎn)的傳輸函數(shù)。綜上所述，完整的語(yǔ)音信號(hào)得數(shù)字模型可以用三個(gè)子模型：激勵(lì)模型聲道模型和輻射模型的串聯(lián)來(lái)表示。它的傳遞函數(shù)可表示為：h（z）=au（z）v（z）r（z）（2-1）這里，u（z）是激勵(lì)信號(hào)，濁音時(shí)u（z）是聲門(mén)脈沖即斜三角脈沖序列的z變換；在清音的情況下，u（z）是一個(gè)隨機(jī)噪聲的z變換。v（z）是聲道傳輸函數(shù)，既可以用聲管模型，也可以用共峰模型來(lái)描述。實(shí)際上就是全集點(diǎn)模型：應(yīng)該指出，式（2-1）所示模型的內(nèi)部結(jié)構(gòu)并不和物理過(guò)程相一致，但這種模型和真實(shí)的模型在輸出上是一致的。另外，這種模型是“短時(shí)”的模型，因?yàn)橐恍┱Z(yǔ)音信號(hào)的變化是緩慢的，例如元音在1020ms內(nèi)其參數(shù)是假定不變的。這里聲道轉(zhuǎn)移函數(shù)v（z）是一個(gè)參數(shù)隨時(shí)間變化的模型。另外，這一模型認(rèn)為語(yǔ)音是聲門(mén)激勵(lì)線(xiàn)形預(yù)測(cè)系統(tǒng)聲道所產(chǎn)生的；實(shí)際上，聲帶-聲道相互作用的非線(xiàn)形特征還有待研究。另外，模型中，用濁音和清音這種簡(jiǎn)單的劃分方法是有缺陷的，對(duì)于某些音是不適用的，例如濁音當(dāng)中的摩擦音。這種音要有發(fā)濁音和發(fā)清音的兩種激勵(lì)，而且兩者不是簡(jiǎn)單的疊加關(guān)系。對(duì)于這些音可以用一些修正模型或更精確的模型來(lái)模擬.3 語(yǔ)音信號(hào)的時(shí)域分析語(yǔ)言信號(hào)的時(shí)域分析就是分析和提取語(yǔ)音信號(hào)的時(shí)域參數(shù)。進(jìn)行語(yǔ)音分析時(shí)，最先接觸到并且也是最直觀(guān)的是它的時(shí)域波形。語(yǔ)音信號(hào)本身就是時(shí)域信號(hào)，因而時(shí)域分析就是最早使用，也是應(yīng)用最廣泛的一種分析方法，這種方法直接利用語(yǔ)音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用，如語(yǔ)音的分割、預(yù)處理、大分類(lèi)等。這種分析方法的特點(diǎn)是：（1）表示語(yǔ)音信號(hào)比較直觀(guān)、物理意義明確。（2）實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單、運(yùn)算量少。（3）可以得到語(yǔ)音的一些重要參數(shù)。（4）只使用示波器等通用設(shè)備，使用較為簡(jiǎn)單等。語(yǔ)音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)和短視平均幅度差函數(shù)等，這是語(yǔ)音信號(hào)的一組最基本的短時(shí)參量，在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參量時(shí)使用的一般是方窗或汗明窗?，F(xiàn)在分別討論如下。3.1短時(shí)能量及短時(shí)平均幅度分析設(shè)語(yǔ)音波形時(shí)域信號(hào)為x(l)、加窗分鎮(zhèn)處理后得到的第n真語(yǔ)音信號(hào)為xn(m), 則xn(m)滿(mǎn)足下式： xn(m)=w(m)x(n+m) 0m0)。因此由式（5-16）看出 , k-10或l0)的情況下，h(z)只有極點(diǎn)，即 (5-20)相應(yīng)的差分方程為 (5-21)信號(hào)的功率譜為 (5-22)這種形式的信號(hào)模型稱(chēng)為全極點(diǎn)模型或自回歸模型（簡(jiǎn)稱(chēng)為ar模型）。p階自回歸模型一般表示為ar（p）。這是一種最重要，應(yīng)用最廣的模型。對(duì)于ar(p)模型，式(6.20)中的bl應(yīng)代之以單位取樣序列，于是得到 (5-23) 考慮到h(k)的因果性，即當(dāng)k0時(shí)有h(-k)=0；同時(shí)根據(jù)初值定理1知道 (5-24)所以，式(6.24)可簡(jiǎn): (5-25) 式中a0=1。這就是ar(p)模型的模型參數(shù)與信號(hào)自相關(guān)函數(shù)之間的關(guān)系式。將其與線(xiàn)性預(yù)測(cè)的yule-walker方程式(5-11)對(duì)照可以看出，如果線(xiàn)性預(yù)測(cè)和信號(hào)模型是對(duì)同一信號(hào)而言的，即兩個(gè)方程組中的已知數(shù)相同rzz(k-l)=r(k-l),那么兩組方程的解應(yīng)當(dāng)相同（可以證明，只要r（k-l）或rzz(k-l)是正定的，則兩組方程有唯一解），即 (5-26)這意味著，解最佳線(xiàn)性預(yù)測(cè)問(wèn)題等效于解信號(hào)模型問(wèn)題。具體地說(shuō)，信號(hào)x(n)的線(xiàn)性系數(shù)和它的ar(p)模型參數(shù)al相同，而預(yù)測(cè)誤差功率與模型的極力源的功率相同。一個(gè)平穩(wěn)隨機(jī)過(guò)程，如果它是p階自回歸過(guò)程，那么用一個(gè)ar（p）模型就能精確地描述它。在第二章曾經(jīng)討論過(guò)，語(yǔ)音信號(hào)可以看成是一個(gè)線(xiàn)性時(shí)變系統(tǒng)在準(zhǔn)周期脈沖序列（相應(yīng)于濁音）或隨機(jī)噪聲（相應(yīng)與清音）激勵(lì)下所產(chǎn)生的輸出，參看圖2.1。在語(yǔ)音信號(hào)的這個(gè)數(shù)字模型中，時(shí)變線(xiàn)性系統(tǒng)綜合反映了輻射、聲門(mén)脈沖以及聲道的總的影響，并且對(duì)于除鼻音和摩擦音以外的大多數(shù)語(yǔ)音來(lái)說(shuō)，都可以用一個(gè)全極點(diǎn)系統(tǒng)來(lái)表示。這個(gè)全極點(diǎn)時(shí)變線(xiàn)性系統(tǒng)的參數(shù)隨著時(shí)間的變化是非常緩慢的，因而可以近似地認(rèn)為，在一語(yǔ)音時(shí)間內(nèi)它是非時(shí)變的。這樣一來(lái)，圖2.1所表示的語(yǔ)音信號(hào)模型，正是一個(gè)平穩(wěn)隨機(jī)過(guò)程的自回歸模型（在短時(shí)間內(nèi)可以近似的認(rèn)為語(yǔ)音信號(hào)是平穩(wěn)的）。根據(jù)本節(jié)前面的討論，很容易理解，線(xiàn)性預(yù)測(cè)是描述語(yǔ)音信號(hào)的一種很精確的方法。對(duì)語(yǔ)音信號(hào)進(jìn)行線(xiàn)性預(yù)測(cè)分析，其合理性和精確性可以從另一個(gè)角度來(lái)加以解釋。線(xiàn)性預(yù)測(cè)系數(shù)（等效于語(yǔ)音信號(hào)的模型參數(shù)）是根據(jù)最小均方誤差準(zhǔn)則來(lái)決定的，而最小均方誤差恰等于信號(hào)模型的激勵(lì)源的方差；另一方面，語(yǔ)音信號(hào)模型的激勵(lì)源只能是準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì)，而這兩種序列的均方值都是最小的。由此可見(jiàn)，對(duì)語(yǔ)音信號(hào)進(jìn)行線(xiàn)性預(yù)測(cè)分析是合理的。反過(guò)來(lái)說(shuō)，如果用某個(gè)準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì)一個(gè)全極點(diǎn)系統(tǒng)，產(chǎn)生出某個(gè)信號(hào)，然后根據(jù)該信號(hào)p個(gè)取樣值對(duì)信號(hào)的當(dāng)前值進(jìn)行預(yù)測(cè)，而且在均方誤差最小的意義上這種預(yù)測(cè)是最佳的，那么預(yù)測(cè)系數(shù)必將等于全極點(diǎn)系統(tǒng)的參數(shù)。最后需要指出，對(duì)語(yǔ)音信號(hào)x(n) 進(jìn)行線(xiàn)性預(yù)測(cè)，實(shí)際上意味著建立一個(gè)由白噪聲源激勵(lì)一個(gè)全極點(diǎn)系統(tǒng)的自回歸模型，使得該模型產(chǎn)生的信號(hào)在z(n)的自相關(guān)函數(shù)與語(yǔ)音信號(hào)x(n)的自相關(guān)函數(shù)相匹配，或者說(shuō)使得z(n)和x(n)的譜包絡(luò)相匹配。5.4 levinson-durbin 算法通過(guò)以上討論可以看到：求取信號(hào)的模型參數(shù)可以通過(guò)線(xiàn)性預(yù)測(cè)來(lái)完成，而線(xiàn)性預(yù)測(cè)系數(shù)以及預(yù)測(cè)誤差功率可以有式（5.11）所表示的yule-walker方程解出。本節(jié)討論由已知的自相關(guān)函數(shù)，通過(guò)解式(5.11)以求取線(xiàn)性預(yù)測(cè)系數(shù)及預(yù)測(cè)誤差功率的方法。將式(5.11)寫(xiě)成矩陣形式，并注意到平穩(wěn)隨機(jī)信號(hào)的自相關(guān)函數(shù)的對(duì)稱(chēng)性質(zhì)，可以得到下面的結(jié)果：（5-27）值得注意的是，上列方程組的系數(shù)矩陣中，沿任何一條對(duì)角線(xiàn)上的元素都相同，這樣的矩陣稱(chēng)為toeplitz矩陣，同時(shí)系數(shù)矩陣還是一個(gè)對(duì)稱(chēng)矩陣。利用系數(shù)矩陣的對(duì)稱(chēng)toeplitz性質(zhì)，提出了一種高效算法來(lái)求解該方程組，這就是著名的levinson-durbin算法，簡(jiǎn)稱(chēng)為levinson算法，該算法的運(yùn)算數(shù)量級(jí)為o(p2)，而線(xiàn)性方程組的一般解法的運(yùn)算量數(shù)量級(jí)為o(p3)，后者比前者要大的多。levinson算法是一個(gè)迭代計(jì)算過(guò)程。它從最低預(yù)測(cè)器開(kāi)始，由低階到高階，逐階進(jìn)行遞推計(jì)算。即是說(shuō)，總是由前一階段預(yù)測(cè)器求出了所要求的p階預(yù)測(cè)器的系數(shù)，而且得到了所有低階預(yù)測(cè)器的系數(shù)。在圖5-2中，最上面表示了過(guò)去p個(gè)取樣值預(yù)測(cè)當(dāng)前值xn；下面依次畫(huà)出了1階、2階、3階、p階預(yù)測(cè)器的預(yù)測(cè)系數(shù)；旁邊寫(xiě)出了個(gè)階預(yù)測(cè)誤差。預(yù)測(cè)系數(shù)有兩個(gè)下標(biāo)，第一個(gè)下標(biāo)表示階數(shù)，第二個(gè)下標(biāo)表示該階預(yù)測(cè)器系數(shù)的序數(shù)。 1 1 1 1 圖5-2levinson算法遞推示意圖為了說(shuō)明levinson算法的迭代計(jì)算過(guò)程，現(xiàn)在討論在已知第p階預(yù)測(cè)器系數(shù)后如何求出第p+1階預(yù)測(cè)器系數(shù)的問(wèn)題。圖5.3表示了第p階預(yù)測(cè)器和第p+1階預(yù)測(cè)器，其中第p階預(yù)測(cè)器假定是已知的。現(xiàn)在的問(wèn)題是，如何根據(jù)第p階預(yù)測(cè)器系數(shù)計(jì)算出第p+1階預(yù)測(cè)器的系數(shù)，說(shuō)者說(shuō)，如何找出二者的迭代計(jì)算關(guān)系式。levinson算法的推導(dǎo)方法有多種，下面介紹1980年提出的一種推導(dǎo)方法，稱(chēng)之為缺口推導(dǎo)方法(gapped function method)23 1 1圖5-3 由p階預(yù)測(cè)器遞推p+1階預(yù)測(cè)器缺口函數(shù)定義為預(yù)測(cè)誤差與觀(guān)測(cè)數(shù)據(jù)（即xn-1,xn-2, ,xn-p）之間的相互關(guān)，即（5-28）式中rex（k）代表與xn-1,xn-2, , xn-p之間的互相關(guān)函數(shù)，r（k-l）代表滯后為(k-l)時(shí)x(n)的自相關(guān)函數(shù)。根據(jù)正交定理(見(jiàn)式(5-6)可得到 (5-29)這是p階預(yù)測(cè)器應(yīng)該滿(mǎn)足的條件?，F(xiàn)在的任務(wù)是利用造p+1階預(yù)測(cè)器的缺口函數(shù).顯然,gp+1(k)的缺口應(yīng)該等于p+1.為此，先將對(duì)稱(chēng)于縱軸進(jìn)行折疊，得；然后將其右移p+1個(gè)單位，于是得到現(xiàn)在與的缺口已經(jīng)對(duì)齊了。為了得到一個(gè)缺口寬度為p+1的新的缺口函數(shù)，可將乘以某個(gè)常量 ,然后將其從中減去，這樣便得到一個(gè)新的缺口函數(shù)，用表示，即（5-30）式中的選擇應(yīng)使缺口擴(kuò)大一個(gè)單位（從原來(lái)的p增為p+1）。為此，選擇使下式成立：（5-31）這就是說(shuō)，選擇使得的缺口右邊的第一個(gè)取樣值經(jīng)加權(quán)后恰好等于缺口右邊的第一個(gè)取樣值。式(5-31)即（5-32）由此得到（5-33）根據(jù)式（5-28）關(guān)于缺口函數(shù)的定義，可以得到（5-34）將式(5-34)代入(5-33),得到（5-35）這個(gè)加權(quán)系數(shù)稱(chēng)做為反射系數(shù)。由式（6.10）知道，最小均方誤差等于（5-36）為了區(qū)別不同階段的預(yù)測(cè)器的最小均方預(yù)測(cè)誤差，用下標(biāo)來(lái)表示階，例如第p階預(yù)測(cè)器的最小均方預(yù)測(cè)誤差用表示。于是，有聯(lián)系到缺口函數(shù)的定義式（5-28），式（5-36）也可以寫(xiě)成類(lèi)似地有（5-37）將式（5-33）代入上式，得到（5-38）這就是最小均方預(yù)測(cè)誤差的遞推計(jì)算公式。下面推導(dǎo)線(xiàn)性預(yù)測(cè)系數(shù)的遞推計(jì)算公式。首先寫(xiě)出p階和p+1階線(xiàn)性預(yù)測(cè)器的缺口函數(shù)的定義式：（5-39）對(duì)上二式求z變換得到（5-40）式中的和是和的z變換；是r(k)的z變換，即信號(hào)x(n)的功率譜；和分別是序列 (l=0,1, ,p+1)的z變換，稱(chēng)為預(yù)測(cè)多項(xiàng)式，即（5-41）另一方面，取式（5-31）的z變換得到（5-42）將式（5-40）代入式（5-42）,得（5-43）考慮到自相關(guān)函數(shù)的對(duì)稱(chēng)性,由上式可以得出這就是由p階預(yù)測(cè)多項(xiàng)式迭代計(jì)算p+1階預(yù)測(cè)多項(xiàng)式的公式。對(duì)上式取反z變換，便得到預(yù)測(cè)系數(shù)的迭代計(jì)算式（5-44）或（5-45）以上三個(gè)式子是相互等效的?？偟膩?lái)說(shuō)，式(5-35)，（5-38），和（5-43）便構(gòu)成了完整的levinson迭代算法。迭代計(jì)算從零階即從p=0開(kāi)始。零階預(yù)測(cè)即不做預(yù)測(cè)，這時(shí)預(yù)測(cè)多項(xiàng)式為預(yù)測(cè)誤差為預(yù)測(cè)誤差功率為以上便是迭代計(jì)算的初始條件。迭代計(jì)算步驟如下：（1）初始化（2）假設(shè)已知p階預(yù)測(cè)器的參數(shù)，即已知和。（3）計(jì)算p+1階預(yù)測(cè)器的反射系數(shù)（4）計(jì)算p+1階預(yù)測(cè)器的預(yù)測(cè)多項(xiàng)式（5）計(jì)算p+1階預(yù)測(cè)誤差功率(式（5-38）)（6）返回第（2）步。當(dāng)?shù)^(guò)程達(dá)到預(yù)先指定的階時(shí)，迭代計(jì)算終止。計(jì)算結(jié)束后，得到了以下三類(lèi)結(jié)果：（1）各階預(yù)測(cè)器的預(yù)測(cè)系數(shù)。（2）各階預(yù)測(cè)器的反射系數(shù)。（2）各階預(yù)測(cè)器誤差功率。5.5 線(xiàn)性預(yù)測(cè)的頻域解釋迄今為止，一直是在時(shí)域中根據(jù)差分方程和相關(guān)函數(shù)來(lái)討論線(xiàn)性預(yù)測(cè)問(wèn)題。本節(jié)將從頻域的角度對(duì)線(xiàn)性預(yù)測(cè)做出解釋?zhuān)瑥亩玫礁羁痰恼J(rèn)識(shí)。對(duì)語(yǔ)音進(jìn)行線(xiàn)性預(yù)測(cè)分析的結(jié)果，對(duì)應(yīng)于每一幀語(yǔ)音將得到一組線(xiàn)性預(yù)測(cè)系數(shù)。這組系數(shù)正是語(yǔ)音產(chǎn)生模型中全極點(diǎn)線(xiàn)性濾波器的參數(shù)。說(shuō)的準(zhǔn)確些，這組系數(shù)正是濾波器的傳輸函數(shù)的分母和多項(xiàng)式的系數(shù)。由于全極點(diǎn)濾波器是聲門(mén)，聲道的共振特性。當(dāng)根據(jù)一幀語(yǔ)音取樣求得一組線(xiàn)性預(yù)測(cè)系數(shù)后，也就意味著求得了這真語(yǔ)音信號(hào)的產(chǎn)生模型中全極點(diǎn)線(xiàn)性濾波器的頻率特性。根據(jù)語(yǔ)音信號(hào)的產(chǎn)生模型，語(yǔ)音的功率譜等于激勵(lì)源的功率譜與全極點(diǎn)線(xiàn)性濾波器頻率特性的摸的平方的乘積。激勵(lì)源是（準(zhǔn)周期）沖激序列或白噪聲，其功率譜是平坦的，因此語(yǔ)音的功率譜主要地由全極點(diǎn)濾波器的頻率特性所確定，這樣，線(xiàn)性預(yù)測(cè)可以看成是對(duì)語(yǔ)音信號(hào)的短時(shí)譜進(jìn)行估計(jì)的一種有效方法。 6 算法的軟件實(shí)現(xiàn)本設(shè)計(jì)選擇了levinson-durbin算法，并對(duì)其進(jìn)行了軟件實(shí)現(xiàn)。首先我先采用c語(yǔ)言對(duì)此算法進(jìn)行了編程，然后又用vc語(yǔ)言使其生成一個(gè)動(dòng)態(tài)鏈接庫(kù)，最后用matlab調(diào)用該動(dòng)態(tài)鏈接庫(kù)，最終完成了matlab對(duì)該算法的軟件實(shí)現(xiàn)。在以下的章節(jié)，將對(duì)上述步驟做進(jìn)一步的闡述。為了使運(yùn)算結(jié)果清晰直觀(guān)，在matlab中還采用了界面顯示結(jié)果的方式，使得處理的運(yùn)算結(jié)果更加直觀(guān)。關(guān)于圖形用戶(hù)界面的生成，雖然不屬于本設(shè)計(jì)的主體部分，但本設(shè)計(jì)也做了一定層面的研究。6.1 matlab語(yǔ)言簡(jiǎn)介matlab是matrix和laboratory前三個(gè)字母的縮寫(xiě)，意思是“矩陣實(shí)驗(yàn)室”，是mathworks公司推出的數(shù)學(xué)類(lèi)科技應(yīng)用軟件。其dos版本發(fā)行于1984年，現(xiàn)已推出了windows版本。經(jīng)過(guò)十多年的不斷發(fā)展和完善，它已成為國(guó)際上公認(rèn)的最優(yōu)秀的科技應(yīng)用軟件。它具有如下主要特點(diǎn)：1）具有豐富的數(shù)學(xué)功能，其中包括矩陣各種運(yùn)算，如正交變換,三角分解，特征值，常見(jiàn)的特殊矩陣；包括各種特殊函數(shù)，如貝塞爾函數(shù)，勒讓德函數(shù)，伽嗎函數(shù)，貝塔函數(shù)，橢圓函數(shù)等；包括各種數(shù)學(xué)運(yùn)算功能，如數(shù)值微分，數(shù)值積分，插值，求極值，方程求根，fft，常微分方程的數(shù)值解，殘數(shù)計(jì)算等等。也就是說(shuō)，matlab給使用者提供了足夠多的數(shù)學(xué)工具，以便他們來(lái)解決各種各樣的理論問(wèn)題和工程問(wèn)題。2）具有很好的繪圖功能，可方便地畫(huà)出二維和三維圖形，如直角坐標(biāo)曲線(xiàn)圖，極坐標(biāo)曲線(xiàn)，直方圖，對(duì)數(shù)坐標(biāo)曲線(xiàn)，網(wǎng)格圖，三維曲面圖，等高線(xiàn)圖，區(qū)域圖等，同時(shí)屏幕上出現(xiàn)的各種圖形均可輸送到打印機(jī)直接打印，或輸送到windows的剪貼板內(nèi)供各種應(yīng)用軟件調(diào)用。3）使用方便，便于掌握，便于修改，使用matlab語(yǔ)言編寫(xiě)的程序可直接運(yùn)行而無(wú)須進(jìn)行編譯。具有很友好的圖形界面，且使用者可根據(jù)自己的需求方便的編寫(xiě)出自己所希望的圖形界面。擴(kuò)充性能很好，使用者可使用此語(yǔ)言編寫(xiě)出自己所需的各種函數(shù)，同時(shí)采用一定的措施之后可以直接調(diào)用c語(yǔ)言的函數(shù)及fortran語(yǔ)言的子程序。4）具有若干功能強(qiáng)大的應(yīng)用工具箱，如語(yǔ)音處理，通信，小波變換，圖象處理，統(tǒng)計(jì)，仿真，插值，符號(hào)運(yùn)算，系統(tǒng)識(shí)別，系統(tǒng)優(yōu)化，神經(jīng)網(wǎng)絡(luò)，數(shù)據(jù)庫(kù)，功率系統(tǒng)，地圖，偏微分方程，系統(tǒng)控制，模糊邏輯等。5）可以直接處理計(jì)算機(jī)內(nèi)的聲音文件；安裝圖形處理工具箱后，可以直接處理各種格式的圖形文件，如：bmp,gif,pcx,和jpeg等等。matlab的命令又稱(chēng)為函數(shù)，其名稱(chēng)的后綴為.m。matlab語(yǔ)言采用解釋運(yùn)行的方式，在這一點(diǎn)上它的運(yùn)行方式與basic語(yǔ)言類(lèi)似，在程序運(yùn)行的過(guò)程中可以隨時(shí)顯示中間的結(jié)果，這樣便于查找程序中的錯(cuò)誤。另外由于用matlab語(yǔ)言編寫(xiě)的程序無(wú)須進(jìn)行編譯，因此它本身就像一個(gè)超級(jí)的函數(shù)計(jì)算器。由于很多的matlab語(yǔ)言的命令與人們通常的書(shū)寫(xiě)習(xí)慣類(lèi)似，因此有人又稱(chēng)之為演算紙似的科學(xué)工程計(jì)算語(yǔ)言。由于matlab語(yǔ)言本身所具有的種種特點(diǎn)，它特別適合對(duì)電子系統(tǒng)進(jìn)行信號(hào)處理，在通信等工具箱內(nèi)，設(shè)有專(zhuān)門(mén)為電子系統(tǒng)設(shè)計(jì)的各種專(zhuān)門(mén)的函數(shù)，可以進(jìn)行各種模擬和數(shù)字濾波器的設(shè)計(jì)和分析。matlab語(yǔ)言的另一個(gè)突出的優(yōu)點(diǎn)就是便于學(xué)習(xí)，容易掌握。一般來(lái)說(shuō)，一個(gè)初學(xué)者可在幾十分鐘內(nèi)學(xué)會(huì)并掌握它的基本操作命令，進(jìn)而就可以解決一些比較煩瑣的數(shù)學(xué)運(yùn)算問(wèn)題，如矩陣求逆。由于matlab給使用者提供了極為豐富的，現(xiàn)成的數(shù)學(xué)工具，因此使用者無(wú)須掌握很復(fù)雜的編程技巧，如排隊(duì)，指針，堆棧等等。另外，matlab本身提供了十分明確，十分詳細(xì)的聯(lián)機(jī)幫助文件，便于使用者進(jìn)行自學(xué)，而無(wú)須依賴(lài)教師指導(dǎo)。6.2 vc中mex程序的建立和設(shè)置一個(gè)mex程序?qū)嶋H上就是一個(gè)特別的dll，它的輸出函數(shù)為mexfunction。那么在vc中就可用project wizard 建立一個(gè)dll工程，并為其指定輸出函數(shù)為mexfunction。1. 建立新的dll工程啟動(dòng)vc，選擇菜單file/new,在projects頁(yè)面中選擇mfc appwizard(dll),輸入路徑名和工程名，并單擊ok按鈕。這里將工程命名為mextest。2. 設(shè)定輸出函數(shù) appwizard 將會(huì)自動(dòng)生成如下幾個(gè)文件：* mextest.cpp* mextest.def * mextest.rc * stdafx.cpp需要mextest.def中指定該dll文件的輸出函數(shù)，也就是mexfunction。為此，在vc的workspace欄中，單擊“fileview”屬性頁(yè)，展開(kāi)“sourse files”欄，打開(kāi)文件mextest.def，將其內(nèi)容進(jìn)行編譯，在“exports”后面加入mexfunction一行。3. 環(huán)境設(shè)置由于再編譯和連接mex程序的時(shí)候，需要用到matlab提供的若干頭文件和庫(kù)文件，因此應(yīng)該對(duì)這些文件的路徑進(jìn)行指定。在matlab6以前的版本中，沒(méi)有提供必要的庫(kù)文件，只提供了必要的def文件，必須由用戶(hù)自己用lib命令手工將def文件轉(zhuǎn)換為lib文件，步驟比較麻煩。在matlab6中，則直接提供lib文件，不需要用戶(hù)生成了。matlab對(duì)于不同版本的編譯器提供了不同的庫(kù)文件，分別放在

人人文庫(kù)> 全部分類(lèi)> 專(zhuān)業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

語(yǔ)音信號(hào)畢業(yè)設(shè)計(jì)論文.doc

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔