《基于Matlab的LPC聲碼器算法仿真與性能評估》14000字_第1頁
《基于Matlab的LPC聲碼器算法仿真與性能評估》14000字_第2頁
《基于Matlab的LPC聲碼器算法仿真與性能評估》14000字_第3頁
《基于Matlab的LPC聲碼器算法仿真與性能評估》14000字_第4頁
《基于Matlab的LPC聲碼器算法仿真與性能評估》14000字_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

I-IIII基于Matlab的LPC聲碼器算法仿真與性能評估摘要在通信系統(tǒng)中,對于線性預(yù)測編碼中參數(shù)進(jìn)行分析,基于語音信號特點(diǎn)對編碼及譯碼器進(jìn)行設(shè)計(jì),同時利用實(shí)際音頻信號進(jìn)行性能驗(yàn)證分析。研究好線性預(yù)測編碼技術(shù)的最小的應(yīng)用場景,在現(xiàn)實(shí)生活中的應(yīng)用方式,預(yù)測編碼將輸入信號轉(zhuǎn)變?yōu)榉奖銈鬏數(shù)臄?shù)字信號,通常,線性預(yù)測編碼參數(shù)進(jìn)行分析,基于語音信號特點(diǎn)對預(yù)測編碼及聲碼器進(jìn)行設(shè)計(jì)并對這些參數(shù)進(jìn)行編碼,而混合編碼則結(jié)合了二者的優(yōu)勢,本文所設(shè)計(jì)的預(yù)測編碼聲碼器采用的編碼方式就是預(yù)測編碼。本論文針對線性預(yù)測編碼(LPC)聲碼器進(jìn)行激勵信源過于簡單,提出一系列的優(yōu)化方法,包括這方面的工作:采用混合信號激勵代換簡單的二元激勵,優(yōu)化了激勵語音信號;簡單了基音周期提取的編碼算法,下降了算法的時間難度和通信系統(tǒng)時延,增高了語音信號的實(shí)用性;此自帶聲音強(qiáng)度的優(yōu)化采用新,LPC算法中初始碼本選用隨機(jī)算法容易造成的,并用本論文提出的二級聯(lián)矢量算法此子帶聲音強(qiáng)度進(jìn)行二級矢量優(yōu)化,增加了聲音強(qiáng)的量化。本文針對利用Matlap編碼軟件提出的算法進(jìn)行仿真實(shí)驗(yàn),參數(shù)提取線性預(yù)測算法來預(yù)測出相應(yīng)的結(jié)果、掌握LPC的基本原理,關(guān)鍵參數(shù)和基本原則,作出一系列的優(yōu)化改進(jìn)設(shè)計(jì)。關(guān)鍵詞:語音信號,混合激勵編碼,兩級矢量量化,Matlap仿真目錄摘要 -緒論引言語音信號聲碼器可以對語音進(jìn)行編碼和解碼,語音信號解碼器于19世紀(jì)二十年代誕生于美國的貝爾實(shí)驗(yàn)室。從那年開始語音信號聲碼器進(jìn)入了迅速發(fā)展期間,很多的科研人員對語音編碼信號及語音信號合并開展科研,對此獲得了相當(dāng)不錯的收獲(李澤宇,張曉峰,2022)。語音編碼信號和語音信號合并成是提升語音聲碼器優(yōu)良的重要因素,低速率語音編碼信號的科研更吸引了人們的注視(王俊鵬,劉一凡,2023)。19世紀(jì)70年代初,簡單的線性聲碼器在編碼效率方面能夠達(dá)到0.9?3.4kb/s之間的范圍,但是其具有依靠于清濁音判決的二次元激勵信號模型的特性,因此合并語音的清晰度較差,有時候帶震動聲和轟隆聲(陳星河,趙雨桐,2021)。因此,預(yù)測聲碼器算法大部分都是線性預(yù)測聲碼器的概念上更改而來,本論文以混合激勵語言信號為激勵信源對,使合成語音信號效果得到了提高,從這些對話中看出在自然度和可懂度方面都有所改,聲碼器在眾多研究人員的大力推動下正向往著語音信號質(zhì)量好,速度更低、抵抗干擾強(qiáng)度越來越強(qiáng)、延時更遲、預(yù)測要求更高的方向發(fā)展(劉佳怡,黃志豪,2021)。此激勵信源的重要參數(shù)子帶聲音強(qiáng)度,本論文對其進(jìn)行了二級矢量優(yōu)化,增高了優(yōu)化精度,獲得激勵信源的得到更好準(zhǔn)確。對子帶聲音信號強(qiáng)化的細(xì)量化此得到激勵信號更強(qiáng)準(zhǔn)地熟識了現(xiàn)實(shí)的語音信號,其得到解碼后的語音信號波形更強(qiáng)附近原來的語音,這對激勵信源參數(shù)量化中的一個進(jìn)步(張雅靜,周赫連,2022)。語言編解碼概述語音編碼概述語音消息信號被用在數(shù)字化、傳輸和數(shù)據(jù)存儲化的過程中,使用能表達(dá)數(shù)字語音消息信號的比特?cái)?shù)盡可能少的編碼方法,依據(jù)此理論框架進(jìn)行全面分析可獲知結(jié)果被廣泛稱為數(shù)字語音信號編碼。壓縮應(yīng)用語音通道信號的增加傳輸數(shù)據(jù)帶寬、增加語音信道的數(shù)據(jù)傳輸速率,在現(xiàn)代語音數(shù)據(jù)通信應(yīng)用技術(shù)的不斷發(fā)展中一直被技術(shù)研究工作人員廣泛推崇(林浩然,吳志明,2020)。最新的能準(zhǔn)確達(dá)到這種編碼標(biāo)準(zhǔn)的重要編碼方法之一就是采用語音視頻編碼,據(jù)相關(guān)統(tǒng)計(jì)資料分析,從而將時域或頻域兩種編碼方式應(yīng)用,這在一定程度上展現(xiàn)了即使很少用大容量的無線傳輸視頻信道也很難能夠承受如此大的視頻數(shù)碼分辨率,所以語音編碼對語音通信來說意義是重大的(唐子凡,何悅彤,2019)。對于這一部分的創(chuàng)作借鑒了章和寧教授的相關(guān)主題的研究,主要體現(xiàn)在思路和手法方面,在思路上遵循了其強(qiáng)調(diào)的系統(tǒng)性與邏輯性的原則。語音視頻編碼的傳輸速率可以用i和o表示,單位是比特/秒(b/s)。那么語音信號速率為(趙俊杰,王欣怡,2023):I=log果從另一個的數(shù)學(xué)角度分析來看,如果將一個發(fā)音電話是以最低語音信號傳送速度來接受報文,但是每一個英文字母的語音信號編碼器在比特比位數(shù)大約為7位,也就是7bit,假如一個通信電話語音信號的最低發(fā)送速率大約為每分鐘126個發(fā)音英文單詞。假設(shè)一個單字的平均發(fā)音長度大約為7個元音字母,那么其語音速率為(徐子琪,陳立鋒,2020)I=7b×60126100b/s綜上可知,語音信號編碼的限度速率大概是70-90b/so這只能傳輸語音信息的內(nèi)容而能人在說話時的音量,從這些記錄中體現(xiàn)音調(diào)等最好的信息,但這信息在語音編碼的時候就被掉下去了(李東旭,郭昕怡,2020)。這種雙重視角不僅促進(jìn)了對研究對象內(nèi)部運(yùn)作的理解,也為解決實(shí)際問題提出了更具針對性的方法。語音編碼的分類以根據(jù)語音視頻編解碼的基本特征對其編碼進(jìn)行系統(tǒng)分類,大體上我們可以將其分為主要如下三類(孫藝博,陳可欣,2020):波形語音編碼、參數(shù)語音編碼和各種混合語音編碼。如果根據(jù)不同的視頻應(yīng)用環(huán)境場景我還可以將數(shù)字語音視頻編碼系統(tǒng)分為數(shù)字音樂視頻編碼和數(shù)字語音視頻編碼。本文按照特征分類的編解碼進(jìn)行介紹:(1)波形信息編碼是一種時間域語音信號調(diào)換成數(shù)字語音信號的編碼技術(shù),此種編碼技術(shù)有很強(qiáng)的合適能力以及較高的語音信號質(zhì)量,而語音縮小的結(jié)果不好,經(jīng)常要求30kb/s以上的誤碼率(劉昱辰,鄭馨月,2023)。(2)數(shù)字信號參數(shù)編碼根據(jù)語音信號的特征參數(shù)運(yùn)行編碼,可以得到重大的縮小比率,而語音信號質(zhì)量不怎么好,但是解碼的計(jì)算難度比較高(王文博,蔡佳霖,2022)。(3)混合波形編碼技術(shù)是一種指同時可以結(jié)合兩種及以上的波形編碼方式對兩種語音參數(shù)信號編碼進(jìn)行混合編碼,這在一定程度上反映出來這種編輯方式使人可以同時分別擁有語音波形信號編碼和語音參數(shù)信號編碼各自的一些優(yōu)點(diǎn),會獲得更好的編碼效果(楊柏林,范婷婷,2023)。本文中的數(shù)據(jù)處理技巧對比早期的方法而言,更加簡潔高效。采用了更為簡化的預(yù)處理程序,這一程序去除了不必須的轉(zhuǎn)換步驟,優(yōu)化了數(shù)據(jù)清理和歸一化過程,從而極大提高了處理效率。2.3語音參數(shù)編碼技術(shù)本節(jié)主要介紹三種常用的參數(shù)編碼技術(shù)(1).線性預(yù)測編碼(LPC)線性預(yù)測編碼是指低速度參數(shù)編碼信號中最主要的編碼方式,在編碼進(jìn)行中,不清晰語音判斷只采用和清晰語音兩個語音作為語音信號的判決標(biāo)準(zhǔn)。使用于判斷的現(xiàn)實(shí)語音信號視為一種激勵性的語言信號使用來激勵全場的極點(diǎn)系統(tǒng),最后一步對語音信號進(jìn)行合成操作(郭紫萱,周俊熙,2022)。在這種布局下通過利用的線性算法預(yù)測視頻編碼信號,取得的視頻語音信號傳輸速度低、可靠度挺好。綜上可知所以,lpc-10在1975年被美國正式用作2.5kb/s低速率數(shù)字信號語音視頻通信系統(tǒng)的標(biāo)準(zhǔn)(趙思琦,劉凱旋,2019)。LPC-10編碼器框圖如圖2-1所示。圖2-1LPC-10編碼器框圖(2).碼激勵線性預(yù)測編碼(CELP)在這種布局里針對目前線性矢量預(yù)測語音編碼的碼本模型比較簡單,經(jīng)過語音編碼處理得到的碼本語音編碼質(zhì)量一般不太好等一些問題,一種可利用碼本信息作為語音激勵源,應(yīng)用于線性矢量預(yù)測量化編碼技術(shù)的新型線性矢量預(yù)測語音編碼,該技術(shù)在1984年被諸如manfredrschroeder和mabishnusatal等所提出。從這些程序可以發(fā)現(xiàn)碼源和激勵技術(shù)線性編碼預(yù)測量化編碼技術(shù)應(yīng)用于數(shù)字矢量碼的量化編碼技術(shù)(陳昊宇,吳麗娜,2019)。碼制和激勵采用線性速度預(yù)測文字搜索的編碼運(yùn)算過程復(fù)雜度較大;2)算法采用的均方差及誤差計(jì)算準(zhǔn)則不足較適合廣泛應(yīng)用于低編碼速率及極低編碼速率下的語音文字編碼。因此,如果為了讓語音速率精度達(dá)到更低,碼制和激勵的非線性語音預(yù)測很難能夠得到一個高質(zhì)量的語音[5](楊澤宇,林心怡,2019)。研究中遇到的難題和局限性為后續(xù)工作指引了改進(jìn)的方向,激發(fā)研究人員不斷優(yōu)化和完善研究設(shè)計(jì),以期實(shí)現(xiàn)更深入的理解和更廣泛的應(yīng)用價值。(3).多帶激勵編碼MBE在頻域中,將以一個基音域的頻率作為間隔的一個語音轉(zhuǎn)換成若干的一個子頻帶,每個子頻帶分別進(jìn)行不清晰兩個音域的判決,從這些措施中看出最后我們使用白低音噪聲,要利用直接檢查表的編碼方法對信號編碼之后的一個語音數(shù)字信號數(shù)據(jù)幀中的參數(shù)數(shù)據(jù)進(jìn)行直接檢查和實(shí)現(xiàn)糾錯(孫嘉祺,張浩辰,2023)。在經(jīng)過多次糾錯后就已經(jīng)可以直接得到包含基音發(fā)聲周期、不清晰聲發(fā)音周期指、增加以及反射擊系數(shù)的這四個重要參數(shù)的平均值,解碼后出來的結(jié)果延遲一時間后再運(yùn)行平滑輸出,在這等場景中這樣做的一個好處也就是譯碼可以在上一幀、當(dāng)前幀和下一幀三幀內(nèi)同時進(jìn)行平滑,但一幀之內(nèi)語音可能還會存在一次不止一個輸入基音塊的周期,所以我們需要在語音接收這個數(shù)值時首先進(jìn)行從第一幀周期到整個基音塊的參數(shù)轉(zhuǎn)換和插值(丁怡然,蔡澤民,2022)。

線性預(yù)測編碼原理線性預(yù)測編碼原理語音信號的線性預(yù)測分析線性語音預(yù)測近年來,線性語音預(yù)測被物理學(xué)者們廣泛進(jìn)行重點(diǎn)深入研究,并且?guī)缀跬瑫r出現(xiàn)在現(xiàn)代語音音頻信號分析處理的各個重要研究技術(shù)領(lǐng)域(韓思源,張文琪,2022)。線性語音預(yù)測參數(shù)分析方法提供了一組能將語音數(shù)字信號碼率模型化的參數(shù),幾乎完全能夠精確地得出表達(dá)一組語音數(shù)字信號的碼率頻譜變化幅度約為h,這種線性預(yù)測參數(shù)編碼不是對一般正常情況下它的重新預(yù)測編碼,在這種設(shè)定里而且它們還能為您提供一個非常好的單一聲道信號模型和音頻模型參數(shù)估計(jì)計(jì)算方法,所以能夠使其的功能被非常好的實(shí)際應(yīng)用推廣到數(shù)字語音音頻信號圖像處理技術(shù)中的各個領(lǐng)域中[4](王欣怡,李睿智,2021)。這一結(jié)論為相關(guān)領(lǐng)域提供了可靠的參考,并為進(jìn)一步的研究構(gòu)建了堅(jiān)實(shí)的基礎(chǔ)。遇到這種情況時線性誤差預(yù)測數(shù)據(jù)分析的基本設(shè)計(jì)思想也就是:用一個前組樣本數(shù)據(jù)的值與P樣本中點(diǎn)值的差來計(jì)算預(yù)測本組或者上下組某一組的樣點(diǎn)的差值(魏弘宇,鄧彥霖,2022) (STYLEREF1\s3.SEQ(\*ARABIC\s11)預(yù)測誤差e(n)如式(3.2)所示: (STYLEREF1\s3.SEQ(\*ARABIC\s12)從這些過程中看出最基本的低中高速率音頻語音參數(shù)編碼方法也就是利用線性參數(shù)預(yù)測語音編碼,而且目前應(yīng)用最成功的低中高速率語音參數(shù)編碼語音音頻編碼器也非它我所屬。線性噪音預(yù)測信號聲碼器的主要基本原理主要是(周子安,馬若彤,2021):按照這種理論框架進(jìn)行探究結(jié)論為本機(jī)采用高頻線性噪聲預(yù)測信號分析器的原理在全方位極點(diǎn)式的聲音通道信號模型中,將聲道模型信號參數(shù)與聲道。線性聲波預(yù)測音頻聲碼器軟件框圖結(jié)構(gòu)如軟件圖3-1所示(李俊凱,王佳琪,2021)。通過跨學(xué)科的合作與交流,本文成功地將多個領(lǐng)域的理論與方法相結(jié)合,為解決復(fù)雜問題提供了全新的視角和解決方案。圖3-1線性預(yù)測編碼聲碼器框圖LPC-10編碼器圖3-2是采用lpc-10聲碼器音頻編碼的主要原理流程框圖。圖3-2是采用lpc-10聲碼器音頻編碼的主要原理流程框圖對LPC-10聲碼器音頻編碼原來的開始的語音信號輸入后,第一步穿過一個低通模擬濾波器之后,就用9kHz采樣速度運(yùn)行V/UV調(diào)換來獲得語音信號的數(shù)據(jù)化語音編碼。分兩步同時對數(shù)據(jù)化語音進(jìn)行處理,從這些分析中證明對激勵編碼信息運(yùn)行處理(吳思源,韓依然,2022)。借助實(shí)證分析、案例分析及綜合研究方法,本文不僅證實(shí)了理論構(gòu)想的可靠性,還揭示了實(shí)踐中的關(guān)鍵因素及其作用機(jī)理。先對語音進(jìn)行分差處理,即一幀(21.5ms)語音含有190個樣點(diǎn),而且對每一幀語音信號獲取其重要參數(shù)后再利用編碼傳送。編碼以后就可以取得該元音幀的不清晰語音變化周期基音周期標(biāo)志。其中每個基音變化周期用平均值和幅度差值表示函數(shù)(AMDF)方法計(jì)算得到。對每一聲道音頻參數(shù)數(shù)據(jù)提取的各方面的功能進(jìn)行優(yōu)化處理(楊子杰,王睿文,2020)。低通濾波線性預(yù)測編碼詳細(xì)操做內(nèi)容是首先對數(shù)據(jù)語音信號運(yùn)行加重處理。因此受到音頻視頻信號大多數(shù)的能量都需要聚集在低通頻率范圍之內(nèi),且里面中的功率變化頻率譜線會隨著語音信號頻率而不斷增長。語音高頻率端的功率譜衰弱程度就會達(dá)到一個沒法想象的結(jié)果。從這些章節(jié)中看出所以我們需要先對各種語音音頻信號干擾運(yùn)行警告,預(yù)測加重復(fù)的規(guī)劃,其高頻功率以提升,通過這些細(xì)節(jié)表明提升語音聲信號道參數(shù)獲取的準(zhǔn)確度(劉浩然,朱家欣,2020)。預(yù)測的加重語音濾波器的信號傳送速度函數(shù)為(3-3)參數(shù)提取及編碼(1).線性預(yù)測系數(shù)的計(jì)算與編碼線性預(yù)測編碼器中使用的是9階線性預(yù)測編碼低通濾波器,計(jì)算線性預(yù)測系數(shù){s}采用的方法是線性預(yù)測逆濾波器。在設(shè)計(jì)優(yōu)化的過程中,本文特別關(guān)注了經(jīng)濟(jì)合理性與方案的可復(fù)制性,相較于原始規(guī)劃,在多個方面進(jìn)行了細(xì)致的改良與提升。線性預(yù)測濾波器的傳遞函數(shù)如下式(許雅萱,李子瑜,2022):(STYLEREF1\s3.SEQ(\*ARABIC\s14)因?yàn)槠浞蔷€性時間預(yù)測誤差系數(shù)對時間誤差較為敏感,量化時必然引入誤差,所以不能將線性預(yù)測系數(shù)直接進(jìn)行量化(陳梓萱,王俊熙,2022)。這無疑地揭示了本質(zhì)但是每個反射系數(shù)的絕對量化時間精度必須能夠達(dá)到9?11,才能直接形成一個高穩(wěn)定性的反射濾波器,所以將用來預(yù)測反射系數(shù)的sa,轉(zhuǎn)換成反射系數(shù)k,(對該系數(shù)對精度誤差不敏感),這是勢在必行的,量化時間也是題易的要保證系數(shù)的絕對穩(wěn)定性和條件(它的絕對值必須小于1)(李浩然,張子和,2022)。(2).基音周期的提取與編碼自然互相關(guān)時間函數(shù)的算法,自然互相關(guān)時間函數(shù)的算法其實(shí)是一種時域的信號處理計(jì)算方法,它主要是用兩個不同信號之間的時域相關(guān)性和函數(shù)關(guān)系來直接度量它們之間可能存在的信號相似性的(王晨曦,劉梓涵,2023)。這些研究設(shè)想與探索領(lǐng)域不僅立足于對當(dāng)前狀況的深刻洞察,還結(jié)合了領(lǐng)域內(nèi)的最新發(fā)展與未來預(yù)測,旨在探索未知地帶、解決現(xiàn)實(shí)問題并推動學(xué)術(shù)進(jìn)步。某種程度看出自然互相關(guān)函數(shù)演算法的基本原理也就是相對周期性離散語音音頻信號的自然互相關(guān)函數(shù)時延會在相對時延長度等于零的函數(shù)一個周期性的處理時產(chǎn)生并給出一個極大極小值,所以我們可以通過利用計(jì)算離散語音音頻信號的自然互相計(jì)算函數(shù)的最大極小值時延來實(shí)現(xiàn)計(jì)算離散語音音頻信號的自然基音函數(shù)周期性pl相對離散語音信號(無限長)的自然互相計(jì)算函數(shù)定義為(陳浩宇,王思敏,2023):(3-5)這在某種程度上印證了延時調(diào)頻使用的其他數(shù)字音頻延遲調(diào)頻調(diào)制語言信號,式3-5中v和v的v數(shù)字語音調(diào)制信號的延時調(diào)頻取樣時的定值最高頻率寬度范圍一般應(yīng)該是20?150,相應(yīng)的其他數(shù)字音頻基音調(diào)制信號的高頻率延時取樣定值寬度范圍一般應(yīng)該是60?500Hz。結(jié)果的吻合性說明理論模型中考慮的影響因素及其相互作用是合理的,對理解研究現(xiàn)象的本質(zhì)至關(guān)重要。離散高密相關(guān)射頻信號處理函數(shù)x是x'[n]的自同態(tài)離散相關(guān)的高密度信號函數(shù)x的定義形式為(張哲宇,趙穎慧,2022):(3-6)一個有的函數(shù)的分析函數(shù)來說,自定義相關(guān)性的函數(shù)就是對應(yīng)地肯定的函數(shù)周期性,且在對函數(shù)語音上的周期峰值對應(yīng)的一個整數(shù)點(diǎn)上面也具的周期高峰值(孫宇翔,劉嘉怡,2022)。根據(jù)最大的運(yùn)動峰值在零點(diǎn)的水平橫坐標(biāo)值來計(jì)算它與峰值v=0點(diǎn)之間的平均距離,因?yàn)楣絹砭_估算它的基因音的運(yùn)動軌跡(王思源,張若楠,2022)??紤]到理論與實(shí)踐間的固有差異,本文進(jìn)行了深入的分析與必要的調(diào)整。為了促使理論模型更好地適應(yīng)實(shí)際操作情境,我們不僅嚴(yán)謹(jǐn)?shù)赝茖?dǎo)和驗(yàn)證了理論框架,還廣泛涉足實(shí)踐領(lǐng)域,通過多元化的研究方法等渠道,搜集了大量的第一手資料。(3).線性編碼參數(shù)的比特分配與發(fā)送其采用語音信號聲碼器的語音傳傳送編碼流,同步語音信號編碼信號中進(jìn)行編碼的傳送參數(shù)大概占55bit,這些編碼參數(shù)主要包括(李芝和,王雨萱,2019):11個反射擊系數(shù)k⑴?K(10)、增加系數(shù)、語音調(diào)換周期、不清晰語音判決、同一步語音信號,因此采用語音信號聲碼器每秒可以傳送45.6幀,最后總的傳送速度是2,5Kb/S.線性預(yù)解碼原理解碼方法LPC算法的解碼結(jié)果主要工作是譯碼收到的參數(shù)進(jìn)行解碼,根據(jù)解碼得出的參數(shù)及增加有些先進(jìn)合并出的語音信號具有特好的優(yōu)勢(趙文博,張瑞琪,2020)。其詳細(xì)的解碼原理如圖3-3所示。語音合成隨著現(xiàn)代語音識別技術(shù)科學(xué)研究的不斷深入發(fā)展,現(xiàn)代通信技術(shù)的迅速發(fā)展和現(xiàn)代日常生活中應(yīng)用語音信號技術(shù)及其重要性所占比重越來越大。語音音頻合成通信技術(shù)又是現(xiàn)代語音通信技術(shù)中一個非常重要的合成技術(shù),它能夠滿足群眾的實(shí)際需求,能夠涉及到社會各個領(lǐng)域(劉志宏,李昊天,2022)。這一發(fā)現(xiàn)不僅增強(qiáng)了本文對該領(lǐng)域知識體系的信心,還為跨學(xué)科合作提供了共識基礎(chǔ)。因此,這在一定范圍內(nèi)顯示了現(xiàn)代數(shù)字語音預(yù)測信號信息處理中最重要核心的語音技術(shù)之一被公開地認(rèn)為也就是利用線性語音預(yù)測信號分析器和語音信號合成器的技術(shù)。線性語音預(yù)測信號分析應(yīng)用語音信號合成該技術(shù)幾乎可以涉及應(yīng)用到所有語音音頻信號分析處理過程中的各個領(lǐng)域比如分析、合成、編碼、識別等各個方面,到今天名稱為止,其技術(shù)仍是目前語音音頻信號分析處理中最重要的幾種語音信號分析合成技術(shù)之一(陳雨彤,周曉琳,2022)。這些相似性不僅體現(xiàn)在分析設(shè)計(jì)的方法論上,如數(shù)據(jù)收集與分析手段的采用,還深刻反映在核心發(fā)現(xiàn)與推論之中。這在某種程度上指出線性函數(shù)預(yù)測編碼中的合成技術(shù)采用的是參數(shù)合成與波形拼接相結(jié)合的技術(shù)對語音信號進(jìn)行合成,在線性預(yù)測解碼器收端的合器采用的濾波器為直接型遞歸濾波器H(z)的函數(shù)表達(dá)式如式3-7所示。在這種氛圍中語音信號就通過式的直接型遞歸濾波器來合成(鄧雅婷,朱晨曦,2021)。如圖3-2所示合成的語音信號還需要經(jīng)過幅度校正、去加重和A/D變換。所有的工作做完后將得到的激勵信號經(jīng)過一個3600Hz的低通濾波器輸出模擬語音信號。(3-7)激勵語音信號和濾波器系數(shù)為,則重建語音為:(3-8)式3-8的語音模型被我們稱為重建語音原始重建前的模型,s(n)也被稱為語音重建后的語音,若e和x(n)分別等于x和e(n),則我們可以證明說語音重建后的語音和原始重建語音s(n)模型完全相同(徐昊宇,趙瑞琳,2022)。成本控制方面,通過精簡無效步驟、采用成本效益更高的方案,有效減少了總體成本,提升了方案的性價比。

對線性預(yù)測編解碼算法的改進(jìn)本章主要介紹的是對線性預(yù)測編解碼算法的改進(jìn)。對線性預(yù)測編解碼算法的優(yōu)化改進(jìn)方法分別為:(1)對激勵源的改進(jìn);(2)對基音周期提取算法的優(yōu)化;(3)對編解碼算法的改進(jìn)(魏子怡,王雪瑩,2021)。對激勵源的優(yōu)化改進(jìn)簡單的二元線性噪音預(yù)測噪聲出現(xiàn)的這種情況是因?yàn)楝F(xiàn)實(shí)生活中的語音通常是清音和濁音都存在的語音(過渡段和噪聲很強(qiáng)的語音段尤其明顯)。語音質(zhì)量會受到清濁音判決情況好壞的影響,在這類條件當(dāng)中如何準(zhǔn)確的進(jìn)行清/濁音判決對研究者來說顯得尤為重要,本文采用混合激勵代替簡單的二元激勵對傳統(tǒng)的線性預(yù)測編解碼算法中的激勵源進(jìn)行了一定的優(yōu)化改進(jìn)(陳怡然,張語菲,2022)。本文還通過與其他相關(guān)研究的對比,驗(yàn)證了研究結(jié)論的普適性和創(chuàng)新性。通過與已有文獻(xiàn)的結(jié)論進(jìn)行對比分析,本文發(fā)現(xiàn)研究結(jié)果不僅支持了部分已有觀點(diǎn),還提出了新的見解,為相關(guān)領(lǐng)域的理論發(fā)展提供了新的視角和證據(jù)。對參數(shù)提取算法的改進(jìn)本文用rabiner提出的方法來簡化線性預(yù)測編碼算法中的基音提取方法,降低了線性預(yù)測編碼算法的復(fù)雜度;處于這種狀況下在參數(shù)提取方面除了提取傳統(tǒng)的線性預(yù)測編碼模型中需要的參數(shù)基音周期、清/濁音判決、RMS等外,還采用分帶混合激勵技術(shù)提取語音信號的子帶聲音強(qiáng)度濁音隸屬度(楊昕妍,劉國輝,2020)。分帶混合激勵是混合激勵模型中最重要的特征之一。求出信號y(n)和y'(n)的相關(guān)值R(k):(4-1);從這些證據(jù)可以看出得到互相的有關(guān)值后,認(rèn)為該發(fā)聲幀基音為濁音幀,基音位置周期定義為,即使R(k)為當(dāng)取最大相關(guān)值時的基音位置大于k的最大值。語音信號的子帶聲音強(qiáng)度的提取過程如下圖4-1所示。圖4-1子帶聲音強(qiáng)度提取圖從這些細(xì)節(jié)中可以看出分別通過5個6階的子頻帶和普通信號濾波器,將每個輸入射頻信號進(jìn)行分割轉(zhuǎn),歸一化自發(fā)音相關(guān)周期函數(shù)值并進(jìn)行周期計(jì)算,得到清濁分?jǐn)?shù)音和基音相關(guān)周期函數(shù)p2和自發(fā)音相關(guān)周期函數(shù)的比值,清/濁分?jǐn)?shù)音的周期判決計(jì)算結(jié)果由r(p2)的函數(shù)值進(jìn)行決定(鄒晨宇,馬雪琳,2022);在分析策略上,本文融合了定量與定性分析,以全面、客觀地解讀數(shù)據(jù),并運(yùn)用統(tǒng)計(jì)軟件對數(shù)據(jù)進(jìn)行處理同時進(jìn)行了敏感性分析,以評估研究結(jié)果對關(guān)鍵預(yù)設(shè)變動的穩(wěn)定性。后面的四個基音子帶,這在一定程度上反映出來分別通過使用子音母帶基聲信號和子音母帶基音信號。圖4-2某中語音分解為5子帶圖在這樣的背景下對于每一個濁的語音或者一個抖動比較濁的語音幀來說,分別進(jìn)行計(jì)算可得出各個子點(diǎn)頻帶上的語音激勵信號的抖動聲音脈沖強(qiáng)度,得出的計(jì)算結(jié)果將直接決定各子點(diǎn)在帶子幀里面抖動脈沖源和抖動噪聲源之間形成脈沖激勵語音信號時的聲音加權(quán)值,進(jìn)而計(jì)算得到整個語音頻帶的噪聲激勵語音信號(李俊凱,王佳琪,2021)。以往的研究多集中于目標(biāo)的主流特征和直接關(guān)系,本文則專注于挖掘那些常被忽略的邊緣特性和間接聯(lián)系。參數(shù)量化算法的改進(jìn)從這些模式中顯現(xiàn)在參數(shù)量化過程中對算法進(jìn)行改進(jìn)化,結(jié)合二級碼本級聯(lián)訓(xùn)練模型算法在大大減少碼本文字?jǐn)?shù)據(jù)搜索的運(yùn)行時間和減少存儲數(shù)據(jù)空間消耗方面的巨大優(yōu)勢,根據(jù)相關(guān)文獻(xiàn)[28]中論文提出的模糊碼本聚集分類與互聯(lián)lbg碼本級聯(lián)的碼avq轉(zhuǎn)換算法,本文主要提出了一個模糊碼本聚集分類碼本級別互聯(lián)lbg二級中的碼本級聯(lián)訓(xùn)練模型算法,吸取了模糊碼本聚集分類和二級中的碼本級聯(lián)訓(xùn)練模型算法各自的一些優(yōu)點(diǎn)。在克服空胞腔等問題的基礎(chǔ)上,還能降低碼字搜索的時間和存儲空間(何雨婷,劉梓萱,2022)。并且用新的算法對子帶聲音強(qiáng)度進(jìn)行二級矢量量化,某種程度看出來提高激勵信號參數(shù)的準(zhǔn)確度。矢量量化算法矢量圖的量化數(shù)據(jù)是上世紀(jì)70年代后期逐漸發(fā)展壯大起來的,它已經(jīng)是一種非常重要的矢量數(shù)據(jù)術(shù)。將多個標(biāo)準(zhǔn)矢量信息數(shù)據(jù)進(jìn)行轉(zhuǎn)化后成為一個新的矢量壓縮數(shù)據(jù),在一個矢量壓縮空間之內(nèi)進(jìn)行數(shù)據(jù)整理和矢量化,達(dá)到矢量壓縮據(jù)的整理目的的從而同時不會給您帶來過多的標(biāo)量信息數(shù)據(jù)丟失(龔志鵬,張怡然,2022)。在研究策略上,本文展示了獨(dú)特的方法論視角,創(chuàng)造性地融合了多種學(xué)科的研究方法。在理論層面,通過整合不同理論體系的內(nèi)容,構(gòu)建了一個更為綜合的理論框架。矢量量化算法也被廣泛的應(yīng)用于語音信號處理領(lǐng)域,如語音識別、語音編碼和語音合成都能用上矢量量化算法。這在一定程度上確認(rèn)了在語音信號處理中,矢量量化算法的兩大核心問題是:1)如何設(shè)計(jì)和訓(xùn)練出高效的碼本,2)如何降低碼字的搜索速度。碼本設(shè)計(jì)的好壞直接決定了量化的效果,而碼字搜索速度則決定了量化系統(tǒng)在實(shí)時性方面的表現(xiàn)。二級LBG碼本訓(xùn)練算法(1).模糊聚類算法模糊模型聚類分析算法模糊是對虛擬數(shù)據(jù)模型進(jìn)行聚類分析和模糊建模的一種重要的分類算法,從這些對話中看出它對虛擬樣本庫中所屬于分類的數(shù)據(jù)建立了一種不完全確定的模糊描述,所以我們可以相對客觀地準(zhǔn)確反應(yīng)現(xiàn)實(shí)虛擬世界生活中的各種事物。目前,模糊信息聚類分析算法在很多專業(yè)領(lǐng)域都已經(jīng)發(fā)展有著成熟的技術(shù)應(yīng)用,如大數(shù)據(jù)分析、圖像信息分割、模式識別等。在這一基礎(chǔ)上,結(jié)合研究主題,精心制定了科學(xué)合理的研究方案,包含數(shù)據(jù)收集方式、樣本選取標(biāo)準(zhǔn)以及分析體系。對于三維矢量場的量化來說表示為:X={x=1,2,...,}。同時,假設(shè)我們預(yù)期的每個聚類變量數(shù)目為a到c個,并且假設(shè){m;|i=1,2,.,c}聚類表示每個不同類別的類以聚類作為中心。從這些跡象表明模糊樣本聚類方法引入了一個模糊隸屬度為其函數(shù)為x〃,設(shè)兩個隊(duì)(xt)分別表示第i和i個模糊樣本對于第個t和j樣本類別的模糊隸屬度,并且它滿足式4-1所述的條件(林浩然,薛思琪,2023):(4-1)這在一定程度上展現(xiàn)了也即是說任何一個類別樣本中的矢量對于所有不同類別的樣本隸屬度之和為1聚類的函數(shù)損失集合函數(shù)群的定義公式如下:(4-2)基于模糊聚類的初始碼本選取算法就是通過迭代地求解上面兩式,最終得到c個聚類中心,而所求得的這c個聚類中心就是初始碼本的c個碼字。在數(shù)據(jù)收集時,本文采用多種數(shù)據(jù)來源渠道,實(shí)現(xiàn)數(shù)據(jù)的相互補(bǔ)充與驗(yàn)證,同時依據(jù)標(biāo)準(zhǔn)化的操作流程,減少數(shù)據(jù)采集中的主觀錯誤。3.二級LBG碼本算法如下所示二級LBG碼本訓(xùn)練算法的原理。其中,兩級碼本都是直接通過LBG算法訓(xùn)練得到的。對于訓(xùn)練樣本集X中的每一個輸入矢量,都能在一級碼本中找到一個最近鄰(根據(jù)歐式距離)的矢量匕⑴(i=1,2.?.m),通過這些細(xì)節(jié)表明那么這兩個矢量之間的誤差A(yù)(X,匕⑴)將作為二級LBG訓(xùn)練器的初始訓(xùn)練樣本集,二級LBG訓(xùn)練器會像一級訓(xùn)練器一樣對誤差矢量進(jìn)行訓(xùn)練,最終得到二級碼本(李晨光,張雨彤,2022)。圖4-3二級LBG碼本訓(xùn)練算法在初始訓(xùn)練樣本初始碼源版本的類型選取準(zhǔn)確是至關(guān)重要的,它往往會直接性地影響你得到初始碼本運(yùn)行訓(xùn)練測試結(jié)果的準(zhǔn)確好壞(許雅萱,李子瑜,2022)。本文還著重強(qiáng)調(diào)了混合方法的應(yīng)用,即將量化研究與質(zhì)性分析相結(jié)合,以獲取更為全面的研究洞察。依據(jù)此理論框架進(jìn)行全面分析可獲知結(jié)果傳統(tǒng)的模糊lbg算法由于初始碼本隨機(jī)訓(xùn)練選取算法存在諸多的技術(shù)局限性,而且基于更優(yōu)的數(shù)據(jù)誤差和更快的數(shù)據(jù)搜索和對計(jì)算機(jī)質(zhì)量的特點(diǎn)考慮,本文主要提出了一種模糊聚類選取算法與二級聯(lián)的lbg聚類算法互相級聯(lián)的初始碼本隨機(jī)訓(xùn)練選取算法。該算法有效地克服了隨機(jī)法帶來的局限性,從這些記錄中體現(xiàn)并且較一級矢量量化器系統(tǒng)降低了搜索計(jì)算量和碼字存儲量(陳梓萱,王俊熙,2022)。圖4-4模糊聚類級聯(lián)二級LBG碼本訓(xùn)練算法框圖圖4-4展示了本節(jié)所提算法一一模糊聚類級聯(lián)二級LBG碼本訓(xùn)練算法的框圖。在該算法中,LBG算法的初始碼本是訓(xùn)練樣本集經(jīng)過模糊聚類處理得到的,在本算法中模糊聚類算法扮演著初始碼本選擇器的角色,代替了傳統(tǒng)的隨機(jī)法(陳星河,趙雨桐,2021)。將模糊聚類和LBG算法級聯(lián),作為一個碼本訓(xùn)練器,這在一定程度上反映出來那么本算法中使用兩個碼本訓(xùn)練器。第一個碼本訓(xùn)練器的輸入是最初的訓(xùn)練樣本集X,第二個碼本訓(xùn)練器的輸入是誤差矢量集A(X,⑴),誤差矢量指的是訓(xùn)練樣本集中的一個矢量與其在一級碼本中依照最鄰近準(zhǔn)則找到的替代矢量之間的誤差,它也是一個矢量,在這種布局下通過對這兩個矢量的每維求差值得到。所以,誤差矢量集A(X,Y⑴和訓(xùn)練樣本集X有著一樣的維度和大小(劉佳怡,黃志豪,2021)。這不僅有助于剔除隨機(jī)誤差,還能提高研究成果的信賴度和普遍適用性。另外,技術(shù)手段的發(fā)展水平也對結(jié)論的核實(shí)過程產(chǎn)生重要影響,隨著科技的不斷發(fā)展,新的研究工具和技術(shù)手段不斷涌現(xiàn),為科學(xué)研究提供了更多新的選擇和可能性。第二個碼本訓(xùn)練器會將誤差矢量集當(dāng)做訓(xùn)練樣本集,進(jìn)行與第一個碼本訓(xùn)練器相同的訓(xùn)練步驟,最終得到二級碼本,假設(shè)某個二級數(shù)字矢量的數(shù)量化編碼系統(tǒng)中第一級數(shù)字碼本中兩個碼字的單位個數(shù)分別為n或m,第二級數(shù)字碼本中兩個碼字的單位個數(shù)分別為m或n,那么這m+n個碼字能夠表示同的矢量。相反地,對于普通矢量量化系統(tǒng)則必需存儲有碼字才能達(dá)到類似的效果。通常m和n都大于等于(2)所以在相同的量化效果下采用二級矢量量化系統(tǒng)減少了碼字的個數(shù)。由于碼字的個數(shù)減少了,在這種布局里所以碼字的平均搜索次數(shù)也會相應(yīng)的減少,而且一級碼本和二級碼本可以并行地搜索,所以平均碼字搜索次數(shù)只有max(m,n)次,相比普通矢量量化系統(tǒng)大大地降低了搜索時間,提高了系統(tǒng)的實(shí)時性(張雅靜,周赫連,2022)。這種設(shè)計(jì)不僅強(qiáng)化了模型的應(yīng)用價值,也為后續(xù)研究人員提供了一個開放的平臺,支持他們在現(xiàn)有基礎(chǔ)上進(jìn)行創(chuàng)新和發(fā)展。子帶聲音強(qiáng)度的量化將4.3.2節(jié)中提出的二級LBG碼本訓(xùn)練算法對子帶聲音強(qiáng)度進(jìn)行碼本的設(shè)計(jì),再對其進(jìn)行二級矢量量化,提高其量化精度(5bit,16級量化)。編碼端,對輸入提取4維的通帶聲音強(qiáng)度矢量Vp;用歐氏距離最小準(zhǔn)則在Vpmb中找到距離最小的碼字,將其地址碼(5bit)傳輸?shù)浇獯a端。解碼端,從碼流中取出碼流段,還原為10進(jìn)制地址碼,在碼本vpmb中取出對應(yīng)的碼字;對整數(shù)濾波器調(diào)制,用于產(chǎn)生合成濾波器的激勵信號(林浩然,吳志明,2020)。在手法上本文采納了章教授所提倡的定量與定性相結(jié)合的研究方法為研究提供了堅(jiān)實(shí)的數(shù)據(jù)支持和理論依據(jù)。本章用了matlab兩種編程解碼語言對這些改進(jìn)的原有線性算法預(yù)測及匯編解碼后的算法效果進(jìn)行一次仿真模擬實(shí)驗(yàn),從這些程序可以發(fā)現(xiàn)經(jīng)過這些算法優(yōu)化后的改進(jìn)線性預(yù)測編碼的設(shè)計(jì)。算法及仿真實(shí)驗(yàn)實(shí)驗(yàn)環(huán)境及其他說明表5-1實(shí)驗(yàn)環(huán)境描述表硬件環(huán)境計(jì)算機(jī)類型筆記本電腦CPUInteli510400FM-ATX內(nèi)存容量4GB軟件環(huán)境操作系統(tǒng)Windows10-32bitMatlab版本Matlab2020b本論文以三段標(biāo)準(zhǔn)語音作為輸入信號分別進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)語音都是在安靜的室內(nèi)環(huán)境下,用PC機(jī)自帶的麥克風(fēng)在個人筆記本電腦上錄制的采樣頻率為8kHz,PCM編碼的名分別為"樣本1"、"樣本2"和"樣本3"的語音段,并用分值幀程序把語音分成若干幀:窗長為160個樣點(diǎn),窗一移為80個樣點(diǎn)。通過仔細(xì)研究相關(guān)理論文獻(xiàn)并對已有研究進(jìn)行全面分析,本文的預(yù)期建立在一個合理且有據(jù)可循的基礎(chǔ)上,最終結(jié)果與預(yù)期一致,進(jìn)一步驗(yàn)證了這些研究工作的有效性。從這些措施中看出本論文中的算法的實(shí)現(xiàn)是用MATLAB編程語言編寫的程序,主要有語音信號數(shù)據(jù)的提取、編碼端程序、解碼端程序等程序(唐子凡,何悅彤,2019)。算法仿真實(shí)驗(yàn)及評估聲碼器性能評估方法通過線性預(yù)測編碼以后合并語音信號音量,可以反映出語音信號編解碼算法的功能及優(yōu)缺點(diǎn),所以研究者們應(yīng)用合并語音信號質(zhì)量評估新的線性預(yù)測編碼器的功能。這些方面可以在語音信號處理的研究領(lǐng)域內(nèi)取得很好的驗(yàn)證,本文中實(shí)驗(yàn)結(jié)果的評價根據(jù)最后合并語音的質(zhì)音量來判斷線性預(yù)測編解碼算法的有量化(趙俊杰,王欣怡,2023)。通過針對不同來源和類型的數(shù)據(jù)進(jìn)行測試,證明了該方法的穩(wěn)固性和可靠性。這一結(jié)果與理論預(yù)測基本一致,表明在設(shè)定的條件下,實(shí)際情況與理論模型之間高度一致。目前為止國際上最通用的主觀判斷評價測試方法主要是主觀判斷聽音平均評價意見綜合得性測試四個方面來進(jìn)行[6]。5.2.2仿真實(shí)驗(yàn)(1).基音周期算法仿真本文自由互相關(guān)削波函數(shù)的乘法計(jì)算很簡單,削波后的基音信號的周期取樣數(shù)值只有-1、0、1三種實(shí)際情況,所以不再是需要對它作任何乘法周期運(yùn)算而只要是需要簡單的信號組合法和邏輯運(yùn)算即可,在這等場景中因此需要仿真者在實(shí)驗(yàn)中用中心削波相關(guān)函數(shù)的算法對自由互相關(guān)削波函數(shù)的乘法周期提取信號基音中的周期信號進(jìn)行極大簡化,計(jì)算時的次數(shù)明顯有所減少,既大大提高了乘法運(yùn)算時的速度,遇到這種情況時又大大提高了信號基音周期提取的計(jì)算精度,并且仿真實(shí)現(xiàn)操作起來非常簡便(徐子琪,陳立鋒,2020)。通過嚴(yán)謹(jǐn)?shù)膶?shí)證研究,這部分工作進(jìn)一步確認(rèn)了相關(guān)理論的合理性,并提出了若干新穎的觀點(diǎn)和見解,為現(xiàn)有理論體系提供了有力的支持和補(bǔ)充。(2)二級矢量量化仿真本論文算法中包含了很多的子程序,執(zhí)行相應(yīng)的程序后,可得到下面的一些數(shù)據(jù)。對每一幀進(jìn)行語音訓(xùn)練提取到的特征參數(shù)矢量構(gòu)成每一幀的語音特征參數(shù)矢量,所有幀的語音特征參數(shù)矢量可以構(gòu)成語音訓(xùn)練樣本集。在這種設(shè)定里對訓(xùn)練樣本集進(jìn)行一級和二級的矢量量化,實(shí)驗(yàn)數(shù)據(jù)(如表5-2所示)(李東旭,郭昕怡,2020)。量化器級別碼本大小訓(xùn)練時間/ms平均誤差一級2551462.5310.03675171856.1320.0286二級251+2552476.6720.0292511+5133265.8630.0241相對于文獻(xiàn)[28]中的算法,本文采用模糊聚類級聯(lián)二級LGB碼本訓(xùn)練算法需要更長的訓(xùn)練時間,但是量化的誤差有了相當(dāng)大的提升。,碼字的查找速度也能大幅度提升(從理論上來說可以得到接近50%的速度提升),從這些過程中看出可以使量化器得到更好的實(shí)時性。結(jié)果的吻合性說明理論模型中考慮的影響因素及其相互作用是合理的,對理解研究現(xiàn)象的本質(zhì)至關(guān)重要。子帶聲音強(qiáng)度矢量量化仿真如下兩個數(shù)據(jù)可以看出自帶語音強(qiáng)化的功能及強(qiáng)化過程;表5-3子帶語音強(qiáng)度化表表5-4子帶聲音強(qiáng)度量化誤差表如下表5-3子帶語音強(qiáng)度化表Vp1Vp2Vp3Vp4Vp50.86560.28030.26140.26680.2814Vp1Vp2Vp3Vp4Vp50.00310.00560.00660.00270.00750.00410.00450.00540.00150.00360.00560.00240.00710.00800.00870.00770.00780.00410.00230.00140.00660.00240.00500.00550.00460.00340.00120.00650.00770.00780.00250.00620.00530.00440.00510.00770.00510.00120.00740.00310.00880.00530.00360.00250.00630.00550.00420.00570.00360.00470.00460.00240.00380.00370.00820.00420.00450.00450.00570.00630.00330.00340.00140.00360.00460.00820.00320.00480.00520.00350.00840.00250.00540.00430.00410.00340.00650.00330.00530.00570.75990.79370.76730.75160.73200.33830.62590.66780.69810.69760.63430.64490.64730.65920.65010.66750.66450.66830.67390.66140.68930.68440.69010.69120.67680.44140.51410.48500.49650.51160.24390.63110.68820.71180.71220.71340.70960.71140.70870.69050.29380.45030.41040.42290.44390.72780.73580.73070.72650.71360.80930.85770.83540.81900.78640.56480.58800.57590.58360.58480.77810.53820.52270.52750.52100.86450.45260.43350.43420.43170.35640.60250.62170.64740.6598Vp1Vp2Vp3Vp4Vp50.00310.00560.00660.00270.00750.00410.00450.00540.00150.00360.00560.00240.00710.00800.00870.00770.00780.00410.00230.00140.00660.00240.00500.00550.00460.00340.00120.00650.00770.00780.00250.00620.00530.00440.00510.00770.00510.00120.00740.00310.00880.00530.00360.00250.00630.00550.00420.00570.00360.00470.00460.00240.00380.00370.00820.00420.00450.00450.00570.00630.00330.00340.00140.00360.00460.00820.00320.00480.00520.00350.00840.00250.00540.00430.00410.00340.00650.00330.00530.0057表5-4子帶聲音強(qiáng)度量化誤差表按照這種理論框架進(jìn)行探究結(jié)論為從表5-3表示的子帶語音信號強(qiáng)化和與表5-4所示的誤碼率進(jìn)行預(yù)測加重,取得最后的激勵信號如下所示;激勵噪聲部分5-1激勵信號圖(1)改進(jìn)后的聲碼器解碼語音質(zhì)量仿真數(shù)據(jù)算法的各種優(yōu)化改用Matlab仿真語言信號進(jìn)行,分別相同在不相同信噪比情況下和不相關(guān)的樣本相似的信號進(jìn)行對比,從這些分析中證明運(yùn)行出來的仿真后得得到的編碼前后對比波形圖分如下(孫藝博,陳可欣,2020)。實(shí)驗(yàn)仿真一:不相同的(樣本2、樣本3)在同一信噪比,原始語音、含噪語音,合成語音和解碼語音出來的的仿真結(jié)果如圖5-2?圖5-5所示:原始語言含噪音合成語音解碼語音原始語言含噪音語音樣點(diǎn)數(shù)合成合成含噪音語音未整形解碼原理圖中的原始出來的語音、含噪音語音和解碼出來的語音的局部放大圖從這些章節(jié)中看出從上面圖片對比出來的我們可以提出結(jié)果:信噪比不變的情況下,樣本二和樣本二在相同的信噪比(11dB)下,通過本論文提出的編碼算法后,就得獲得可以懂的能力、自然度偏高的語音信號,而且原始波形圖與解碼原理波形圖一致(劉昱辰,鄭馨月,2023)。且,通過這些細(xì)節(jié)表明這只要說明此算法在信噪信號比為11dB時的功能好,不可以說明其在不相同的信噪信號比比下具有很好的規(guī)律性。所以,又做了實(shí)驗(yàn)仿真二??紤]到理論與實(shí)踐間的固有差異,本文進(jìn)行了深入的分析與必要的調(diào)整。為了促使理論模型更好地適應(yīng)實(shí)際操作情境,我們不僅嚴(yán)謹(jǐn)?shù)赝茖?dǎo)和驗(yàn)證了理論框架,還廣泛涉足實(shí)踐領(lǐng)域,通過多元化的研究方法等渠道,搜集了大量的第一手資料。原始數(shù)據(jù)預(yù)測器殘差能量E(i)Durbin算法求線性預(yù)測系數(shù)通過Matlab軟件來做出相應(yīng)的線性預(yù)測編碼(LPC)仿真的,原始數(shù)據(jù)表示在輸入一段語音信號,然后預(yù)測編碼中一段一段的輸入進(jìn)行編碼(王文博,蔡佳霖,2022),中間傳輸過程中一些遇到的問題及時處理及應(yīng)用在仿真圖中,這無疑地揭示了本質(zhì)看K(i)輸入信號過程就是在語音輸入后在終端運(yùn)行的結(jié)果,預(yù)測期殘差能量E(i)就在結(jié)果快出來是運(yùn)行的結(jié)果仿真圖,在此過程中遇到的問題就在運(yùn)行過程,Durbin算法求線性預(yù)測系數(shù)表示在線性預(yù)測編碼的結(jié)果波形圖。這一發(fā)現(xiàn)不僅增強(qiáng)了本文對該領(lǐng)域知識體系的信心,還為跨學(xué)科合作提供了共識基礎(chǔ)。從這些出來的結(jié)果中顯示出預(yù)測編碼在運(yùn)行過程就是在于比較復(fù)雜的過程,所以輸入信號和傳語音信號的過程就在于進(jìn)行預(yù)測編碼的輸出結(jié)果運(yùn)行的討論結(jié)果,從此出來的結(jié)果進(jìn)行編碼,某種程度看出后輸出一個好的語音信號仿真圖進(jìn)行0~5的首次線性預(yù)測系數(shù),5~10過程就是在于算法的二次進(jìn)行過程(楊柏林,范婷婷,2023),10~15過程就在于終端的預(yù)測信號編碼的下一步進(jìn)行過程,15~30就在于運(yùn)行結(jié)果的最后快出來結(jié)果的終端輸出進(jìn)行方式,線性預(yù)測系數(shù)的最后結(jié)果方法(郭紫萱,周俊熙,2022)。原始語音含噪音語音合成語音解碼語音這在某種程度上印證了從圖5-6與圖5-14可以看出,信噪比從2~2.1過程中是語音信號在進(jìn)行編碼過程中首次出現(xiàn)的編碼操作,2.1~2.2過程語音編碼色下一步預(yù)測進(jìn)行輸入過程,2.2~2.3過程的語音信號編碼中出現(xiàn)的中端情況及下一步操作進(jìn)行預(yù)測(趙思琦,劉凱旋,2019),2.3~2.4中已經(jīng)幾乎沒感應(yīng)到輸入信號的操作情況進(jìn)行編碼后沒出現(xiàn)噪聲了,在這樣的情況下取得預(yù)測編碼信號沒什么操作及沒有什么用處平穩(wěn)狀態(tài),2.4~2.5過程剛結(jié)束進(jìn)行的平穩(wěn)原始信號預(yù)測編碼的進(jìn)入操作狀態(tài),2.5~2.6過程遇到的結(jié)果來進(jìn)行合成語音的輸入狀態(tài),進(jìn)一步進(jìn)行合成語音波形圖與原始語音波形進(jìn)行對比能量不相同外,總而一致,且解碼語音音量挺好,語音特別清晰,2.6~3過程語音編碼的運(yùn)行后出來的結(jié)果再次過程中遇到的問題進(jìn)行編碼,這在一定程度上確認(rèn)了最后出來的結(jié)果進(jìn)行預(yù)測波形編碼,在語音信號的最后結(jié)束的過程進(jìn)行輸出取得清晰的解碼及譯碼過語音,沒法能說明論文的算法的不好的一面(陳昊宇,吳麗娜,2019)。原始語音含噪音語音合成語音合成含噪音語音未整形解碼語音從這些仿真圖來看原始語音信號大部都被遇到噪聲的干擾,且在噪聲比較大的情況下,通過新出來的算法譯碼就取得到音量挺好的信號,且其波形與原始語音信號也大體一致。從上面的的結(jié)果來看凈得到的語音信號結(jié)果都清晰的。將出來的結(jié)果來看輸入語音信號的編碼基本算出來結(jié)果意外,還得到清晰較好的算法結(jié)果,最后,出來的結(jié)果進(jìn)行預(yù)測編碼,這在一定范圍內(nèi)顯示了完善語音信號的設(shè)計(jì)出來以后,不同的方法獲得的解碼語音信號與線性預(yù)測編碼合成語音進(jìn)行比較(楊澤宇,林心怡,2019),上面所示的波形圖片進(jìn)行操作下一步仿真的出來,對含噪聲語音及預(yù)測編碼信號的合并得到原來的清晰地聲音,再沒出現(xiàn)的就接下來的應(yīng)用不夠清晰,這在某種程度上表征后面得到的波形圖得到的合并語音清晰度高,可懂度比較高,就得到線性預(yù)測編碼語音信號的的標(biāo)準(zhǔn)波形??偨Y(jié)通過本論文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論