南郵通達(dá)語音時(shí)頻參數(shù)的提取和應(yīng)用和語音編碼實(shí)驗(yàn)_第1頁
南郵通達(dá)語音時(shí)頻參數(shù)的提取和應(yīng)用和語音編碼實(shí)驗(yàn)_第2頁
南郵通達(dá)語音時(shí)頻參數(shù)的提取和應(yīng)用和語音編碼實(shí)驗(yàn)_第3頁
南郵通達(dá)語音時(shí)頻參數(shù)的提取和應(yīng)用和語音編碼實(shí)驗(yàn)_第4頁
南郵通達(dá)語音時(shí)頻參數(shù)的提取和應(yīng)用和語音編碼實(shí)驗(yàn)_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝南京郵電大學(xué)通達(dá)學(xué)院實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)名稱語音時(shí)頻參數(shù)的提取和應(yīng)用實(shí)驗(yàn)語音編碼實(shí)驗(yàn)課程名稱信息處理技術(shù)專業(yè)綜合實(shí)驗(yàn)班級(jí)學(xué)號(hào)姓名開課時(shí)間2016/2017學(xué)年 ,第 二 學(xué)期精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝實(shí)驗(yàn)一語音時(shí)頻參數(shù)的提取和應(yīng)用一、實(shí)驗(yàn)?zāi)康氖煜せ镜恼Z音時(shí)頻參數(shù)提取方法,觀察并比較各類參數(shù)采用不同提取方法的效果,了解這些時(shí)頻參數(shù)在語音處理中的應(yīng)用。二、實(shí)驗(yàn)內(nèi)容1、編寫并調(diào)試語音時(shí)域參數(shù)提取程序,包括短時(shí)功率、短時(shí)過零率等函數(shù)。2、編寫并調(diào)試語音頻域參數(shù)提取程序,包括頻譜、語譜圖、基音頻率、共振峰等。3、利用提取出的時(shí)頻參數(shù)對(duì)語音信號(hào)進(jìn)行靜

2、/ 清 /濁音的劃分。三、實(shí)驗(yàn)原理語音信號(hào)具有短時(shí)平穩(wěn)性,需對(duì)其進(jìn)行分段(幀)處理(幀長一般取10 至 30ms之間)。根據(jù)激勵(lì)方式的不同,語音信號(hào)可以分成濁音和清音兩大類:濁音:激勵(lì)源可模擬成準(zhǔn)周期性的脈沖串。該周期稱為基音周期,其倒數(shù)就是基音頻率,基音頻率一般在幾百赫茲以內(nèi)。清音:激勵(lì)源可模擬成隨機(jī)白噪聲。簡化的語音生成數(shù)學(xué)模型如圖所示:基音周期準(zhǔn)周期脈沖序列發(fā)生器濁音時(shí)變線性清音系統(tǒng)語音取樣值隨機(jī)噪聲發(fā)生器增益控制時(shí)變參數(shù)對(duì)語音時(shí)頻波形進(jìn)行繪制與觀察,有助于了解語音的清/濁音等特性。對(duì)基音周期等聲門參數(shù)和共振峰等聲道參數(shù)進(jìn)行提取與分析,是語音處理與應(yīng)用的重要內(nèi)容。對(duì)于時(shí)變語音信號(hào)x( n

3、) ,可以計(jì)算它的短時(shí)功率Px (m) 和短時(shí)過零率Z x (m) 。第m幀(幀長為N個(gè)樣點(diǎn))的功率計(jì)算公式為:1m2x(n)Px ( m)Nn m N 1精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝過零率計(jì)算公式為:1msign x(n) sign x(n 1)Z x ( m)2N n m N 1對(duì)于濁音語音,可以利用其頻譜X () 具有豐富的諧波分量的特點(diǎn),求出其諧波乘積譜,計(jì)算公式為:RHPSx ()X ( r)r1式中, R一般取為5。在諧波乘積譜中,基頻分量變得很大,更易于估計(jì)基音周期。四、實(shí)驗(yàn)方法及程序1. 調(diào)用 matlab 中的 wavread 和 wavplay 讀入并播

4、放語音文件。2. 調(diào)用 fft 命令計(jì)算語音的頻譜。3. 調(diào)用 specgram 命令得到語音的語譜圖。4. 調(diào)用 plot 命令繪制并觀察語音的時(shí)頻域波形。5. 根據(jù)短時(shí)功率、短時(shí)過零率、諧波乘積譜的計(jì)算公式,編寫分別用以計(jì)算短時(shí) 功 率 、 短 時(shí) 過 零 率 、 基 音 頻 率 的 函 數(shù) : functionPx=stpower、 functionZx=stzerocross(x, N)和 function HPSx = hpspectrum(x,N,R)。6. 利用短時(shí)功率和短時(shí)過零率這兩個(gè)參數(shù)可以對(duì)語音信號(hào)進(jìn)行濁音/清音分類。編寫實(shí)現(xiàn)此分類功能的函數(shù)voiunvoi.m。五、實(shí)驗(yàn)結(jié)

5、果與分析1. 清音和濁音的短時(shí)功率、短時(shí)過零率各有何特點(diǎn)?清音段的能量一般比濁音段的小得多。濁音時(shí)能量集中于較低頻率段內(nèi),具有較低的過零率,而清音時(shí)能量集中于較高頻率段內(nèi),具有較高的過零率。2. 如何利用短時(shí)功率和短時(shí)過零率這兩個(gè)參數(shù)對(duì)語音信號(hào)進(jìn)行濁音/ 清音的分類?發(fā)濁音時(shí),由于聲門波引起了譜的高頻跌落。所以其語音能量集中在3kHz 以下;發(fā)清音時(shí),多數(shù)能量出現(xiàn)在高頻。高頻率意味著高的平均過零率,低頻率意味著低的平均過零率,一般可認(rèn)為濁音具有較低的平均過零率,清音具有較高的平均過零率。3. 如何根據(jù)時(shí)域波形估計(jì)各幀元音的基音周期?看圖可知四幀語音的周期均為0.01s ,第一幀0100Hz 有

6、 10個(gè)峰值點(diǎn),基頻約為10Hz ,第二幀0100Hz 有 5 個(gè)峰值點(diǎn),基頻約為20Hz ,第三幀0100Hz 有 5 個(gè)峰值點(diǎn),基頻約為20Hz ,第四幀0100Hz 有 4個(gè)峰值點(diǎn),基頻約為25Hz 。4. 如何根據(jù)基于 DFT 的對(duì)數(shù)幅度譜估計(jì)某幀濁音的基音周期?01172 為一個(gè)基因周期。精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝5. 如何根據(jù)基于 DFT 的對(duì)數(shù)幅度譜,估計(jì)出共振峰頻率?有 7個(gè)峰點(diǎn),因此基頻約為167 。6. 時(shí)域?qū)φZ音信號(hào)進(jìn)行加窗,反映在頻域,其窗譜對(duì)基于DFT 的對(duì)數(shù)幅度譜有何影響?如何估計(jì)出窗譜的主瓣寬度?因?yàn)闀r(shí) 間窗 幅度 的傅 立葉 變換 為脈 沖

7、狀 態(tài) ,則頻譜偏差 很小 , 當(dāng) 定常 過程 x(n) 的平均值 為零且 N 很大時(shí)ETN()=f()(12)所以加窗的周期圖TN( ) 是頻譜密度函數(shù)的無偏估計(jì)。固有TN()=1+ ( )f()。如果原始信號(hào)的頻譜成份與FFT 中的譜線完全一致,這種情況下采樣數(shù)據(jù)的長度為信號(hào)周期的整數(shù)倍,頻譜中只有主瓣。7. 如何根據(jù)窄帶、寬帶語譜圖,提取出語音的基音和共振峰軌跡?在基音提取中,廣泛采用語音波形或誤差信號(hào)波形的低通濾波。提取共振峰特性最簡便的手段是使用語譜儀。提取共振峰還有倒譜法、LPC 分析法等更為有效、準(zhǔn)確的方法。(做完試驗(yàn)后,記住要回答這些問題)實(shí)驗(yàn)過程記錄與結(jié)果分析1、進(jìn)入 mat

8、lab1.1 在 Windows 環(huán)境中,創(chuàng)建一個(gè)名為speech 的文件夾,存放語音數(shù)據(jù)和與實(shí)驗(yàn)相關(guān)的 Matlab 文件。如:E:speech 。用于實(shí)驗(yàn)的語音數(shù)據(jù)(.mat )及相應(yīng)說明(.txt )包括:digits.mat%digits.txtgliss.mat%兩個(gè)包含 /i/ 的滑音gliss.txtletters.mat%英文字母表中26 個(gè)字母的發(fā)音letters.txtma1.txtma1-1.mat%一句連續(xù)語音ma1-2.mat%一句連續(xù)語音ma1-3.mat%一句連續(xù)語音ma1-4.mat%一句連續(xù)語音timit.txttimit1.mat%一句連續(xù)語音timit2.

9、mat%一句連續(xù)語音timit3.mat%一句連續(xù)語音timit4.mat%一句連續(xù)語音vowels.mat%元音 /a/, /i/, /o/, /u/ 的發(fā)音vowels.txtwords.mat%十個(gè)孤立字的發(fā)音精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝words.txt1.2在 Windows桌面上,雙擊Matlab的圖標(biāo),進(jìn)入Matlab的工作環(huán)境。在命令窗口 >> 提示符后,鍵入cd E:speech指令,進(jìn)入實(shí)驗(yàn)文件夾路徑。1.3 在命令窗口鍵入clear all指令,清除工作空間的所有變量。2、加載語音數(shù)據(jù),熟悉matlab 命令2.1 加載“ timit1.m

10、at”語音數(shù)據(jù),命令為:load timit12.2用命令“who ”和“whos ”列出當(dāng)前工作空間中的變量。變量“timit1 ”會(huì)以包含55911 個(gè)元素的矩陣(列向量)形式出現(xiàn)Your variables are:timit1NameSizeBytesClassAttributestimit155911x1447288double2.3 利用命令“l(fā)ength ”和“ size ”查看語音信號(hào)timit1的長度和維數(shù):m = length(timit1)m,n = size(timit1)(粘貼實(shí)驗(yàn)結(jié)果)m =55911m =55911n =12.4 通過以下命令,分別查看語音信號(hào)ti

11、mit1中間的1 個(gè)、 2 個(gè)和 20 個(gè)數(shù)據(jù)值:timit1(5001)timit1(5001,5003)timit1(5001:5020)(粘貼實(shí)驗(yàn)結(jié)果)ans =精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝-0.0646ans =-0.06460.0111ans =-0.06460.03070.0111-0.02000.20210.40120.1869-0.1756-0.19020.08230.23630.17120.0637-0.0209-0.0683-0.03940.00810.01050.03110.06962.5 Matlab中,符號(hào)“”可以實(shí)現(xiàn)轉(zhuǎn)置運(yùn)算,運(yùn)行以下命令進(jìn)行觀察

12、:size (timit1)(粘貼實(shí)驗(yàn)結(jié)果)ans =1559112.6 使用函數(shù)max 和 min 可以分別得到信號(hào)的最大值和最小值:max(timit1)min(timit1)(粘貼實(shí)驗(yàn)結(jié)果)ans =1精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝ans =-0.80683、語音信號(hào)的時(shí)域分析3.1 使用以下命令,畫出語音信號(hào)timit1 (采樣頻率為16kHz ,長度為3.5 秒)的時(shí)域波形。plot (timit1)title ( timit1 )xlabel ( Time Index,it n)ylabel ( Amplitude)axis (0 length(timit1) -

13、1 1)grid3.2 分別畫出一幀濁音和一幀清音的語音時(shí)域波形(采樣頻率為16kHz ,幀長為25ms ,每幀有400 個(gè)樣點(diǎn)) 。subplot(211), plot(timit1(14501:14900)%/a/ in dark.subplot(212), plot(timit1(35501:35900)%/s/ in wash.精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝3.3 編寫個(gè)一用以計(jì)算信號(hào)短時(shí)功率的函數(shù)“stpower.m ”,其Matlab代碼如下:function Px=stpower (x, N)M = length (x);Px = zeros (M, 1);Px

14、 (N)=x (1:N)*x (1:N)/N;For (m = (N+1): M)Px (m) = Px (m-1)+ (x (m) 2-x (m-N) 2)/N;3.4 編寫一個(gè)用以計(jì)算信號(hào)短時(shí)過零率的函數(shù)“stzerocross.m ”,其Matlab代碼如下:function Zx = stzerocross(x, N)M=length(x);Zx=zeros(M,1);Zx (N+1)=sum (abs (sign (x (2:N+1)sign (x (1:N) ) ) )/ (2*N);for (m= (N+2):M)Zx (m) = Zx (m-1) + (abs (sign (x

15、 (m) )sign (x (m-1) ) ) abs(sign (x (m-N) ) sign (x (m-N-1 ) ) ) )/ (2*N); end3.5 加載“ digits.mat”語音數(shù)據(jù),該數(shù)據(jù)包含英文數(shù)字“ 0 ” 到“ 9 ”的發(fā)音。計(jì)算其中的單詞“four ”的短時(shí)功率和過零率(采樣頻率為10kHz ,幀長為30ms ,每幀有300 個(gè)樣點(diǎn)) 。load digits;N = 300; x=digits.four1;精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝Px = stpower (x,N);Zx = stzerocross (x,N);plot(Px*1e -5

16、Zxx/2000)3.6 加載“ vowels.mat ”語音數(shù)據(jù),該數(shù)據(jù)包含元音/a/, /i/, /o/, /u/ 的發(fā)音。分別畫出一幀/a/ 、一幀/i/ 、一幀 /o/和一幀 /u/ 的時(shí)域波形(采樣頻率為10kHz ,幀長為30ms ,每幀有300 個(gè)樣點(diǎn)) 。load vowelssubplot(221)plot (vowels.a_1(2001:2300)subplot(222)plot (vowels.i_1(2001:2300)subplot(223)plot (vowels.o_1(2001:2300)subplot(224)plot (vowels.u_1(2001:23

17、00)精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝3.7編寫一個(gè)利用短時(shí)功率和短時(shí)過零率這兩個(gè)參數(shù)對(duì)語音信號(hào)進(jìn)行濁音/清音分類的函數(shù)“voiunvoi.m”,其Matlab代碼如下:function voi = voiunvoi(x,N,Pth,Zth)% Short-time power Px and zero crossing Zx measures. Px = stpower(x,N);Zx = stzerocross(x,N);% Compare estimates with threshold values.voi = (Px>Pth*max(Px) & (Zx&l

18、t;Zth);% Shift the voi-flag N/2 samples to the left (middle sample in window). voi = voi(fix(N/2)+1:length(voi);voi(length(voi)*ones(fix(N/2),1);4、語音信號(hào)的頻域分析4.1 加載“ ma1_1 ”語音數(shù)據(jù)。基于DFT 變換,畫出其中一幀數(shù)據(jù)(采樣頻率為8kHz ,幀長為37.5ms ,每幀有300 個(gè)樣點(diǎn))的頻域波形(對(duì)數(shù)幅度譜)。load ma1_1;x = ma1_1 (4161:4460);subplot(121), plot(x)N = 10

19、24; k = 0:N/2-1;X = fftshift (fft (x.*hann (length (x),N);subplot(122), plot (k,20*log10 (abs(X(N/2:-1:1),axis (0N/2-1-infinf )精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝4.2 編寫一個(gè)用以計(jì)算信號(hào)諧波乘積譜的函數(shù)“hpspectrum.m ”,其Matlab代碼如下:function HPSx = hpspectrum(x,N,R)k = 1:R:N/2; K = length(k);X = fft (x.*hann(length(x), N);HPSx = X

20、(k);for (r = R-1:-1:1)HPSx = HPSx.*X (1:r:r*K);end4.3 利用函數(shù)“hpspectrum.m ”,來估計(jì)一幀濁音的基音周期。代碼如下:X = ma1_1(4161:4460);N=1024;R=5;HPSx = hpspectrum (x, N, R);plot (20*log10 (abs (HPSx)精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝4.4 加載“ vowels.mat ”語音數(shù)據(jù), 分別畫出一幀/i/ 和一幀 /u/(采樣頻率為10kHz ,幀長為30ms ,每幀有300 個(gè)樣點(diǎn))的基于DFT 的對(duì)數(shù)幅度譜。其Matlab代

21、碼如下:load vowelsx = vowels.i_1(2001:2300);N = 1024; k= -N/2:N/2-1;X = fftshift (fft (x.*hann (length(x),N);plot (k,20*log10(abs(X), axis(0 fix (N/2) 0 100)x = vowels.u_1(2001:2300);N= 1024; k = - N/2:N/2-1;X = fftshift (fft (x.*hann(length(x),N);plot (k,20*log10(abs(X), axis(0 fix(N/2) 0 100)精品文檔資料收集

22、于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝4.5 畫出一幀清音語音的基于DFT的對(duì)數(shù)幅度譜。語音數(shù)據(jù)為ma1_1中的第15701 15860 個(gè)樣點(diǎn)(采樣頻率為8kHz ,幀長為20ms ,每幀有160 個(gè)樣點(diǎn)) 。load ma1_1;x = ma1-1 (4161:4460);plot (x)N = 1024; k = - N/2;N/2-1;X = fftshift (fft (x.*hann (length (x),N);plot (k,20*log10 (abs(X), axis (0 fix (N/2)- infinf )精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝4.6加載“ timi

23、t1 ”語音數(shù)據(jù)。利用函數(shù)specgram ,畫出該句語音的語譜圖。其Matlab代碼如下:load timit1;NFFT = 256 ; Fs = 16000; Win = 256; Noverlap = 128;specgram(timit1, NFFT, Fs, Win, Noverlap);4.7 加載“ gliss ”語音數(shù)據(jù)。畫出該句語音的語譜圖。load gliss;NFFT = 256 ; Fs = 10000;Win = 256; Noverlap = 128;specgram(gliss.i_2, NFFT, Fs, Win, Noverlap);精品文檔資料收集于網(wǎng)絡(luò)如

24、有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝4.8基于濁音/ 清音分類函數(shù)voiunvoi.m和諧波乘積譜函數(shù)hpspectrum.m ,編寫一個(gè)用以計(jì)算濁音短時(shí)基音周期的函數(shù)“stpitch.m ”。其Matlab代碼如下:function Fp = stpitch(x,N,Pth,Zth,NFFT,R,Fs)M = length(x);N = 2*fix(N/2);win = hann(N);Fp = zeros(M,1);voi = voiunvoi(x,N,Pth,Zth);invoi = 0;for (m=N:N/2:M)n1 = m-N+1:m-N/2;n2 = m-N/2+1:m;n= n1 n2;

25、if (any(voi(n)if (invoi)Fp(n1) = Fmax;invoi= 0;endelseHPSmax,Fmax = max(abs(hpspectrum(x(n),NFFT,R);精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝if (invoi)Fp(n) = Fp(n) + win*Fmax;elseFp(n) = Fmax*ones(N/2,1) win(N/2+1:N);invoi = 1;endendendwsave = warning; warning('off');Fp = (Fp*Fs/NFFT).*(Fp./Fp);warning(wsav

26、e);1. 調(diào)用 matlab 中的 wavread 和 wavplay 讀入并播放語音文件。2. 調(diào)用 fft 命令計(jì)算語音的頻譜。3. 調(diào)用 specgram 命令得到語音的語譜圖。4. 調(diào)用 plot 命令繪制并觀察語音的時(shí)頻域波形。5. 根據(jù)短時(shí)功率、短時(shí)過零率、諧波乘積譜的計(jì)算公式,編寫分別用以計(jì)算短時(shí) 功 率 、 短 時(shí) 過 零 率 、 基 音 頻 率 的 函 數(shù) : functionPx=stpower、 functionZx=stzerocross(x, N)和 function HPSx = hpspectrum(x,N,R)。6. 利用短時(shí)功率和短時(shí)過零率這兩個(gè)參數(shù)可以對(duì)語

27、音信號(hào)進(jìn)行濁音/清音分類。編寫實(shí)現(xiàn)此分類功能的函數(shù)voiunvoi.m。4.9 利用函數(shù)stpitch.m ,分別求出兩句語音“timit1 ”和“ timit2 ”的基音周期。精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝實(shí)驗(yàn)二語音編碼一、實(shí)驗(yàn)?zāi)康氖煜ふZ音基本壓縮編碼的方法,觀察語音壓縮效果,加深對(duì)語音線性預(yù)測編碼( LPC )的理解。二、實(shí)驗(yàn)內(nèi)容1、編寫并調(diào)試語音LPC 參數(shù)提取程序。2、編寫并調(diào)試語音基音周期提取程序。3、編寫并調(diào)試語音LPC 合成程序。三、實(shí)驗(yàn)原理語音信號(hào)中含有大量的冗余信息,采用各種信源編碼技術(shù)減除語音信號(hào)的冗余度,并充分利用人耳的聽覺掩蔽效應(yīng),就可以將其編碼速率壓

28、縮很多倍,而仍能提供可懂語音。LPC 聲碼器是一種比較簡單實(shí)用的語音壓縮方法,其基本原理是:根據(jù)語音生成模型,將語音看作激勵(lì)源通過一個(gè)線性時(shí)不變系統(tǒng)產(chǎn)生的輸出,利用線性預(yù)測分析對(duì)聲道參數(shù)進(jìn)行估值,將求得的線性預(yù)測系數(shù),結(jié)合基音周期等少量參數(shù)進(jìn)行傳輸,就可以在接收端利用合成濾波器重構(gòu)語音信號(hào)。線性預(yù)測系數(shù)的估計(jì)方法為:假設(shè)語音的當(dāng)前樣值可以用過去的M 個(gè)語音樣值來進(jìn)行預(yù)測MaM x n Mai x n ix n a1 x n 1 a2 x n 2i 1式中ai 即為線性預(yù)測系數(shù)。實(shí)際值和預(yù)測值之間的均方誤差可表示為M22 nEx nai x n inni 1要求均方誤差總和最小,將E 關(guān)于 ai

29、 的偏導(dǎo)數(shù)設(shè)置為零,可以得到Mx nkx nai x ni0ni1通過采用自相關(guān)法、協(xié)方差法或格形法求解該方程,即可得到最優(yōu)的ai 。精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝四、實(shí)驗(yàn)方法及程序1. 調(diào)用 xcorr 命令計(jì)算一幀語音的自相關(guān)函數(shù)。2. 調(diào)用 toeplitz命令形成該幀語音的自相關(guān)矩陣。3. 調(diào)用 durbin 命令,采用杜賓遞推算法計(jì)算該幀語音的線性預(yù)測系數(shù)。4. 編寫 lpcauto.m 函數(shù),求取一句語音信號(hào)的線性預(yù)測系數(shù)及預(yù)測殘差。選擇設(shè)當(dāng)?shù)拇昂瘮?shù)對(duì)語音信號(hào)進(jìn)行分幀。5. 編寫 lpcpitch 函數(shù),由殘差信號(hào)計(jì)算該句語音的基音周期。6. 編寫 lpcgain

30、 函數(shù),由預(yù)測殘差能量,求出該句語音的增益。7. 編寫 lpcsyn 函數(shù),由該句語音的基音周期、預(yù)測殘差能量和增益進(jìn)行LPC 合成。五、實(shí)驗(yàn)結(jié)果與分析1. 如 何對(duì) 全極點(diǎn) 模型的線 性預(yù)測 參數(shù)進(jìn) 行提??? 加窗等 預(yù)處理 對(duì)提取結(jié) 果有何影響?自相關(guān)法、協(xié)方差法求解線性預(yù)測方程組、格型法。協(xié)方差法是先把計(jì)算均方誤差的間隔 N固定下來,再研究它對(duì)計(jì)算 n( i,1 )的其中 N 是基音周期值。添加漢明窗和漢寧窗可以得到效果不錯(cuò)的波形,很明顯兩個(gè)波形相似,矩形窗的波形相對(duì)不是很平穩(wěn)。通過改變幀長、幀移后波形更加的清晰,特征更加的明顯,更方便觀察。2. 如何實(shí)現(xiàn)線性預(yù)測參數(shù)的各種表現(xiàn)方式之間的

31、轉(zhuǎn)換?對(duì)于語音信號(hào),確定了各線性預(yù)測系數(shù)后,根據(jù)H ( z)可得其頻率響應(yīng)的估值即 LPC 譜。3. 使用預(yù)測殘差求基音周期有何優(yōu)點(diǎn)?該方法能進(jìn)一步去除聲道共振峰的影響,簡化清濁音判決過程,提高判決精度,有效降低發(fā)生基音倍頻和半頻的錯(cuò)誤。4. 如何根據(jù)線性預(yù)測系數(shù)求得LPC 頻譜?對(duì)于語音信號(hào),確定了各線性預(yù)測系數(shù)后,根據(jù)H ( z)可得其頻率響應(yīng)的估值即 LPC 譜。5. LPC 頻譜與基于 DFT 求得的語音對(duì)數(shù)幅度譜相比有何不同?LPC 譜優(yōu)點(diǎn)在于可以很好地表示共振峰結(jié)構(gòu)而不出現(xiàn)額外的蜂起和起伏,基本不含有噪聲,其頻率靈敏度與人耳不相匹配; DET 得到的對(duì)數(shù)幅度譜受基頻諧波的影響,最大

32、值只出現(xiàn)在諧波頻率上,共振峰測定誤差較大。6. LPC 合成語音的質(zhì)量如何?有何改進(jìn)措施?LPC 合成技術(shù)的優(yōu)點(diǎn)是簡單直觀。其合成過程實(shí)質(zhì)上只是一種簡單的解碼和拼接過程。另外,由于波形拼接技術(shù)的合成基元是語音的波形數(shù)據(jù),保存了語音的全部信息,因而對(duì)于單個(gè)合成基元來說能夠獲得很高的自然度。但是,由于自然語流中的語音和孤立狀況下的語音有著極大的區(qū)別,如果只是簡單地把各個(gè)孤立的語音生硬地拼接在一起,其整個(gè)語流的質(zhì)量勢必是不太理想的。而LPC 技術(shù)從本質(zhì)上來說只是一種錄音+ 重放,對(duì)于合成整個(gè)連續(xù)語流LPC 合成技術(shù)的效果是不理想的。因此, LPC 合成技術(shù)必須和其他技術(shù)相結(jié)合,才能明顯改善LPC 合

33、成的質(zhì)量。實(shí)驗(yàn)過程記錄與結(jié)果分析1、計(jì)算短時(shí)自相關(guān)函數(shù)1.1分別計(jì)算正弦信號(hào)和白噪聲的短時(shí)自相關(guān)函數(shù),估計(jì)正弦信號(hào)的基音周期。精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝其 Matlab 代碼如下:x=sin(2*pi*0.01*(0:499)');r,eta=xcorr(x,100,'unbiased');stem(eta,r);w=randn(500,1);r,eta=xcorr(w,100,'unbiased');stem(eta,r);精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝1.2計(jì)算正弦信號(hào)疊加白噪聲的短時(shí)自相關(guān)函數(shù),試估計(jì)正弦信號(hào)

34、的基音周期。其 Matlab 代碼如下:x=sin(2*pi*0.01*(0:499)');w=randn(500,1);x1=x+w;r,eta=xcorr(x1,100,'unbiased');stem(eta,r);精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝1.3分別畫出一幀濁音和一幀清音的語音自相關(guān)波形(采樣頻率為10kHz ,幀長為 25.6ms ,每幀有256 個(gè)樣點(diǎn)) ,估計(jì)濁音的基音周期。load digits; x=digits.three1;m=2756; N=256; n=m-N+1:m;r,eta=xcorr(x(n),250,'u

35、nbiased');plot(eta,r);m=500; N=256; n=m-N+1:m;r,eta=xcorr(x(n),250,'unbiased');plot(eta,r);精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝2、求取 LPC系數(shù)2.1加載“ digits.three1”語音數(shù)據(jù)。基于自相關(guān)法,求出其中一幀數(shù)據(jù)(采樣頻率為10kHz ,幀長為25.6ms ,每幀有256 個(gè)樣點(diǎn))的14 階 LPC 系數(shù)。畫出相應(yīng)的 LPC 譜。load digits; x=digits.three1;m=2756; N=256; n=m-N+1:m; M=14;r,

36、eta=xcorr(x(n),250,'unbiased');Rx=toeplitz(r(M+1:2*M);rx=r(M+2:2*M+1);a=Rxrx;NFFT=1024; k=1:NFFT/2;X=fft(x(n).*hann(N),NFFT);Theta=1./fft(1;-a,NFFT);plot(k,20*log10(abs(353*Theta(k) X(k)axis(0 NFFT/2inf inf)2.2 編寫一個(gè)用以實(shí)現(xiàn)杜賓遞推算法的函數(shù)“durbin.m ”,其 Matlab代碼如下:function a,xi,kappa=durbin(r,M)kappa =

37、zeros (M,1);a = zeros (M, 1);xi=r(1); zeros(M,1);for (j=1:M)kappa(j)=r(j+1)-a(1:j-1)'*r(j:-1:2)/xi(j);a(j)=kappa(j);精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝a(1:j-1)=a(1:j-1)-kappa(j)*a(j-1:-1:1);xi(j+1)=a(1:j-1)-kappa(j)*a(j-1:-1:1);xi(j+1)=xi(j)*(1-kappa(j)2);end2.3 利用函數(shù)“durbin.m ”,計(jì)算2.1 中語音數(shù)據(jù)幀的14 階 LPC 系數(shù),并與2

38、.1中的結(jié)果進(jìn)行比較:x=digits.three1;m=2756; N=256; n=m-N+1:m; M=14;r,eta=xcorr(x(n),250,'unbiased');aLD,xi,kappa=durbin(r(M+1:2*M+1),M);a, aLD, norm(a-aLD)a =0.35120.20720.38080.31630.0522-0.1639-0.2903-0.2898-0.12220.19600.34920.30240.1713-0.8258aLD =0.35120.20720.38080.31630.0522-0.1639-0.2903-0.28

39、98-0.12220.19600.3492精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝0.30240.1713-0.8258ans =1.0047e-142.4 編寫一個(gè)用以實(shí)現(xiàn)反射系數(shù)轉(zhuǎn)換為LPC 系數(shù)的函數(shù)“rf2lpc.m ”,其Matlab代碼如下:function a = rf2lpc(kappa)M = length(kappa);a = zeros(M,1);for (j=1:M)a(j) = kappa(j);a(1:j-1) = a(1:j-1) - kappa(j)*a(j-1:-1:1);end2.5編寫一個(gè)用以實(shí)現(xiàn)LPC 系數(shù)轉(zhuǎn)換為反射系數(shù)的函數(shù)“l(fā)pc2rf.m”

40、,其 Matlab代碼如下:function kappa = lpc2rf(a)M = length(a);kappa = zeros(M,1);for (j=M:-1:1)kappa(j) = a(j);a(1:j-1) = (a(1:j-1) + a(j)*a(j-1:-1:1)/(1 - kappa(j)2);end2.6 使用函數(shù)“rf2lpc.m ”和“ lpc2rf.m ”,檢驗(yàn)反射系數(shù)和LPC 系數(shù)相互轉(zhuǎn)換結(jié)果。norm(kappa-lpc2rf(aLD)norm(aLD-rf2lpc(kappa)ans =1.4760e-14ans =03、語音信號(hào)的逆濾波3.1利用2.3 中求出的一幀語音數(shù)據(jù)的LPC 系數(shù),構(gòu)造逆濾波器,并畫出該幀語音信號(hào)的殘差波形。精品文檔資料收集于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系網(wǎng)站刪除謝謝ehat=filter(1;-1,1,x(n);plot(x(n) ehat)3.2 編寫一個(gè)用以實(shí)現(xiàn)語音信號(hào)LPC 分析的函數(shù)“l(fā)pcauto ”,其Matlab代碼如下:function ar,xi,e,m = lpcauto(x,M,win,Olap)Nx = length(x);N = length(win);if (N = 1)N = win;win = ones(N,1);endF = fix(Nx-Olap)/(N-Olap);ar = ze

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論