語音編碼器的實現(xiàn)

上傳人：7*** IP屬地：湖北上傳時間：2022-02-14 格式：DOC 頁數(shù)：5 大小：118.50KB 積分：15 舉報 版權申訴

全文預覽已結束

 下載本文檔

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、 TD-SCDMA中 AMR 語音編碼器的實現(xiàn) 摘自重慶郵電學院學報 2004年第1期重慶郵電學院通信信息工程學院夏娟申敏摘要語音編碼方案的選取對移動通信系統(tǒng)的通話質量、信道容量等有重要影響。本文討論了TD-SCDMA系統(tǒng)中AMR語音編碼的自適應機制，同時分析了AMR中代數(shù)碼本線性預測(ACELP)算法及實現(xiàn)過程。該方案可以在一塊TMS320C5510上實現(xiàn)。關鍵詞語音編碼自適應 ACELP引言在語音編碼領域中，隨著傳輸、處理、存儲等各種信息量的巨增，信息的壓縮處理已成為迫切的要求，基于新的網(wǎng)絡和新的要求，無論是從節(jié)省傳輸頻帶資源，還是保持線路通信的高效率等方面來看，研究采用各種可變

2、速率語音編碼技術的系統(tǒng)都有重要意義。目前為了適應此需要提出了AMR（Adaptive Multi-rate）的概念，即自適應話音編碼器?；趲挼目紤]可分為AMR-NB（AMR Narrowband）和AMR-WB （AMR Wideband）。對于AMR-NB，語音通道帶寬限制為3.7M Hz,8000 Hz的采樣頻率，而AMR-WB為7M Hz的帶寬，采樣頻率16000，但考慮語音的短時相關性，每幀長度均為20ms。這兩種編碼器根據(jù)帶寬的要求雖然選用了不同的速率，但有異曲同工之處,以下著重介紹在TD-SCDMA中AMR-NB的實現(xiàn)。此編碼器運用了代數(shù)碼本線性預測（ACELP）混合編碼方式

3、，也就是數(shù)字語音信號中既包括若干語音特征參數(shù)又包括部分波形編碼信息，再運用這些特征信息重新合成語音信號的過程?？刂七@些參數(shù)的提取數(shù)目，根據(jù)速率要求對信息進行取舍而得到了以下8種速率，混合組成如表一所示的自適應語音編碼器。如模式AMR_12.20就提取出244比特的參數(shù)信息，而模式AMR_4.70卻只提取了95比特信息。根據(jù)這些比特所含的信息量可以將其分為3類比特class 0,1和2。在信道編碼時class 0和1都將會使用循環(huán)冗余校驗碼進行差錯檢驗，對于class 2則根據(jù)上一幀進行恢復。表一 : AMR 編碼器的編碼速率 Table .1 The AMR codecs rate編碼模型編

4、碼器的比特速率編碼模型編碼器的比特速率AMR_12.2012,20kbit/s(GSM_EFR)AMR_5.90 5,90 kbit/sAMR_10.2010,20 kbit/sAMR_5.15 5,15 kbit/sAMR_7.957,95 kbit/sAMR_4.75 4,75 kbit/sAMR_7.407,40kbit/s (IS-641)AMR_SID 1,80 kbit/s (無語音信息傳輸)AMR_6.706,70kbit/s (PDC-EFR)語音編碼或語音壓縮編碼研究的基本問題，就是在給定編碼速率的條件下，如何能得到盡量好的重建語音質量。主觀評定方法符合人類聽話時對語音質量的

5、感覺得到了廣泛應用。常用的方法有平均得分意見（Mean Opinion Score, 簡稱MOS）判定法，下表說明了AMR話音編碼器各模式的話音質量。表二： AMR話音編碼器各模式的MOS值Table.2 the MOS of the AMR codecs 編碼方式AMR122AMR102AMR795AMR74AMR67AMR59AMR515AMR475MOS4014063913833773723503501AMR模式選擇的自適應機制自適應的基本概念是以更加智能的方式解決信源和信道編碼的速率分配問題，使得無線資源的配置和利用更加靈活和高效。實際的語音編碼速率取決于信道的條件，它是信道質量的函

6、數(shù)。而這部分的工作是解碼器根據(jù)噪聲等測量參數(shù)協(xié)助基站來完成，選擇模式，決定速率快慢。原則上在信道很差的時候采用速率比較低的編碼器，這樣就能分配給信道編碼更多的比特數(shù)來實現(xiàn)糾錯，實現(xiàn)更可靠的差錯控制，從而有效地抑制錯誤發(fā)生，提高話音質量。在TD-SCDMA系統(tǒng)實現(xiàn)方面為了便于量化比較而采用了C/I（載干比）這一概念，取其滑動平均值，再將此值與一預先定義好的門限值進行比較，來決定速率的選擇。由于不同的特性，全速率信道和半速率信道就應有不同的定義值。在全速率信道，當C/I13時，MR122的MOS值可以達到4以上，是可以提供很好的性能，9C/I<13時，MR122、MR102、MR795都是可

7、以選擇的，速率越低，誤幀率越低，當6C/I<9時，最好選擇MR74、MR67、MR59，而當C/I<6時就應盡量選擇越低的速率，隨著信道質量的下降，誤幀率都會增加，但相對選擇的速率低，就能提供相對較好的話音質量。對于半速率信道與上述類似，不再累述。下面進一步說明自適應速率選擇的實現(xiàn)過程。圖一是完整的說明圖。自適應要求有兩類信息需要傳輸：在下行信道上，需要基站發(fā)送給移動臺一模式選擇測量命令，而在上行信道上，移動臺將信道測量信息傳送給基站。這種模式要求傳送信息準確、可靠、及時,才能有效達到自適應的目的?；久繋l(fā)送一測量命令，得到返回信息，通過比較選擇，選擇一模式用于下一幀。這樣就可以

8、實現(xiàn)速率間的轉換，達到自適應的目的，在速率間的切換會有一定功率損耗，并且不同速率間的損耗是不同的，這是在實現(xiàn)過程中應該考慮的。 MOBILE BASE信源/信道編碼上行鏈路信源/信道解碼上行鏈路分析上行模型選擇下行模型選擇信源/信道編碼下行鏈路分析信源/信道解碼下行鏈路話音話音編碼比測定值下行測量下行話音測量上行話音模式下行話音上行話音模式話音測定值編碼比特話音圖一自適應過程實現(xiàn)框圖 Fig.1 T the adaptive schematic diagram2AMR 編碼器算法此編碼器是基于代數(shù)碼本線性預測（ACELP）這種混合編碼算法5 、6?；驹硎窃?/p>

9、語音按幀輸入，根據(jù)使合成語音與原始語音的加權均方誤差最小的準則，從隨機碼本和固定碼本中挑選合適的碼矢以代替殘差信號，并將碼矢地址和增益及各濾波器的參數(shù)量化編碼后傳送到接收端；接收端恢復各濾波器時，采用與發(fā)送端相同的碼本，按照碼矢地址找到該碼矢乘上增益，激勵合成濾波器，得到合成語音。編碼器提取ACELP模型參數(shù)，解碼器再根據(jù)這些參數(shù)構成的激勵信號合成、重建語音信號。在編碼部分需要抽取下列典型參數(shù)：線性預測濾波器系數(shù)（LP），自適應碼本（ACB）和固定碼本（FCB）索引以及2種碼本的增益。原理如圖二所示。下面將分別從編碼和解碼的角度概述AMR編解碼方案。圖二 AMR編碼原理 Fig.2 The a

10、lgorithm of the AMR codec （1）線性預測預測計算。LPC濾波器表征語音信號發(fā)生模型中的聲道模型，圖中 P=10為聲道傳輸函數(shù)，隨語音幀的變化不斷改變（具有短時穩(wěn)定性）。因此，在每個語音幀中，需要提取LPC系數(shù)。按其預測值與實際值最小化均方誤差原則，可得下式：上述正則方程1采用Durbin算法進行線性預測便可得到參數(shù)?？紤]到線譜頻率（LSF）誤差的相對獨立性及有序有界性質，與線性預測參數(shù)（LP）是一一對應的，采用Chebyshev 多項式估計方法是可以相互轉換的，因此在考慮傳輸時，用LSF參數(shù)代替LP參數(shù)，將其進行矢量量化，在解碼部分再對LP進行恢復。在12.2Kbp

11、s模式下采用分裂矩陣（SMQ）的方式進行矢量量化，在其它模式下采用分裂矢量（SVQ）的方式進行矢量量化。由于在12.2Kbps中，每一幀需要進行2次線性預測編碼（LPC）分析，所以會得到2組LSF系數(shù)。AMR在TD-SCDMA系統(tǒng)的具體實現(xiàn)過程中將這兩組系數(shù)進行聯(lián)合量化。也就是將矩陣（）分為5個2×2的子陣，分別進行矢量量化，維數(shù)為4，碼本容量分別為128（子陣1），64（子陣5），256（子陣2，3，4），失真測度選擇計算量最小也有主觀評價意義的歐式距離，在碼本搜索過程中采用了全搜索算法。同樣，對于其它的編碼速率，有相同的思路和操作步驟，最大的差別就是對LSF矢量的子陣劃分，它們

12、的劃分方法是采用維數(shù)為3，3和4的3個子陣（子矢量）。（2）碼本搜索5。TD-SCDMA系統(tǒng)中，AMR自適應碼本搜索和代數(shù)碼本搜索是語音合成的關鍵，它們都是在子幀的基礎上完成的，其中每個子幀長為5ms，對應4個樣點。自適應碼本表征語音信號發(fā)生模型中的周期性結構，自適應碼本搜索通過一個長時預測濾波器（LTP），去除信號中存在的長時相關，使殘差信號頻譜更加平坦,以便于形成白噪聲激勵信號，同時提取基音延遲和對應的基音增益。再經(jīng)過基音開環(huán)和閉環(huán)分析得到分數(shù)基音延遲決定后，自適應碼本矢量v(n)通過在最佳的整數(shù)延遲kopt和相位（分數(shù)延遲）t處內插就得到代數(shù)碼本表示語音信號發(fā)生模型中的隨機信號，根據(jù)感覺

13、加權均方誤差最小的原則，最終獲得。代數(shù)碼本結構是基于交織單脈沖序列（ISPP），其脈沖幅度和位置的取值都要受到一定的限制以滿足一定的代數(shù)結構和比特分配要求，對于不同速率，脈沖位置和個數(shù)都選擇不同。而且在系統(tǒng)中，碼本設計上改進了以前的高斯隨機碼本結構，構造了中心削波的重疊碼本。經(jīng)稀疏后，碼本中就會產生了90%的零值。這樣是可以簡化收索過程的。通過最大化下式可得到所需碼本。表示索引為的代數(shù)碼本矢量，為目標信號和沖激響應之間的相關。在得到以上參數(shù)后，AMR中系統(tǒng)總共設計了3種量化器。AMR_12.2代數(shù)碼本增益的量化是采用6比特標量量化器， AMR_4.75是將自適應碼本增益和代數(shù)碼本增益進行聯(lián)合

14、量化，而對于其他速率則是按原始語音與合成語音的加權誤差最小找出目標矢量.由于考慮多速率的公用，所以碼本容量較大，這與其他編碼器是不同的。（3）AMR解碼原理。解碼器分為三大部分：譯碼部分，語音合成和后濾波。在解碼器輸入端，從接收的比特流中獲得LSP矢量、自適應碼本和代數(shù)碼本參數(shù)（索引和增益）等。LSP線譜對參數(shù)還需要轉化為線性預測濾波器系數(shù)，再根據(jù)LP系數(shù)內插得到各子幀的合成濾波器系數(shù)。激勵矢量由自適應碼本和代數(shù)碼本經(jīng)各自的增益加權后獲得，將激勵矢量輸入合成濾波器得到重建的語音信號。最后，重建的語音信號還需要經(jīng)過后濾波處理。ACELP編碼器編碼的語音可看成是包含了高斯噪聲的原始語音,使用后濾波

15、可以減少合成語音中包含的噪聲信號，從而有效地提高合成語音的語音質量。后處理包括兩部分功能：自適應后濾波和信號放大。自適應增益控制用于補償合成語音和經(jīng)過后濾波的合成語音之間的失真。將信號通過以下濾波器：為共振峰濾波器，為傾斜補償濾波器，就可得到修正的后濾波合成語音。結束語AMR的提出能提供高質量的語音，增強抗信道誤差的能力，通過低編碼速率靈活配置提高了系統(tǒng)容量，編碼速率根據(jù)無線環(huán)境和本地容量需求動態(tài)選擇不同模式。本文圍繞AMR語音編碼算法進行分析和研究。該算法已在TI公司的TMS320 C5510 DSP上采用定點C語音和匯編語言的混合編程實現(xiàn)，并用于TD-SCDMA系統(tǒng)中，運算量能降低到20M

16、IPS左右，通過在TD-SCDMA系統(tǒng)的硬件平臺上自環(huán)測試，可得到良好的通話語音質量，結果是很理想的。參考文獻1 楊行峻，遲惠生. 語音信號數(shù)字處理. 電子工業(yè)出版社， 19952 Tadashi Amada, Kimio Miseki and Masami Akamine ,“CELP Speech Coding Based on an Adaptive Pulse Position Codebook”,IEEE Proc.ICASSP99,pp.13-16,19993 Erdal Paksoy, Juan Carlos De Martin, Alan McCree and Christi

17、an G.Gerlach, “ An Adaptive Multi-Rate Speech Coder For Digital Cellular Telephony”, IEEE Proc.ICASSP99,pp.193-196,19994 M. Schroeder and B. Atal. “Code excited linear prediction:High quality speech at low bit rates”. Proc. of ICASSP, 1985.5 3GPP，TS 26.090:”AMR Speech Codec; Speech transcoding”6 3GP

18、P，TS 26.094:”AMR Speech Coder; Performance Characterization” TD-SCDMA BASED ADAPTIVE MULTI-RATE CODEC XIAJUAN SHENMIN(Department of Communication Engineering , Chongqing Institute of Posts and Telecommunications)Abstract This paper describes a adaptive multi-rate codec for TD-SCDMA, and it also introduces how to realize the adaption.Due to the codec consistes of eight codecs, that

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

語音編碼器的實現(xiàn)

文檔簡介

溫馨提示

最新文檔

評論

語音編碼器的實現(xiàn)

文檔簡介

溫馨提示

最新文檔

評論

相關文檔