一、 方案設計與論證.doc_第1頁
一、 方案設計與論證.doc_第2頁
一、 方案設計與論證.doc_第3頁
一、 方案設計與論證.doc_第4頁
一、 方案設計與論證.doc_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數 據 傳 輸摘 要本系統(tǒng)對語音信號采用時域處理方法:數據采集直存直取、欠抽樣采樣、自相似增量調制法等三種方法,分別完成了對語音信號32.7秒、65.5秒、147.4秒的存儲與回放;前置自動增益控制(AGC)將語音信號控制在A/D轉換器可處理的范圍內以保證話音采樣不失真;帶通濾波器合理的通帶范圍有效地濾除了帶外噪聲,減小了混疊失真;通過后級補償電路對輸出的語音信號進行了校正,回放語音清晰;并具有自動錄音、手動錄音、錄/放音時間顯示以及掉電后保護語音信號等功能。一、 方案設計與論證本題目是設計制作一個數字化語音存儲與回放系統(tǒng)。要求前置放大器的增益為46dB,增益可調;帶通濾波器,帶寬為300Hz3.4kHz;ADC采樣頻率fs=8kHz,字長=8位;語音存儲時間10秒;DAC變換頻率fc=8kHz,字長=8位;且要求回放語音質量好(話音清晰、失真小、雜音少)。方案考慮如下。(一) 語音編碼方案論證 語音是一維時間信號,由于是表示語言聲音的信號,所以不是恒定的,信號的性質隨時間變化很大。為了充分利用有限的存儲空間,并不失真地傳送語音信號必須對采集后的語音信號進行進一步壓縮,即語音壓縮。所謂語音壓縮,是為了聲音信號更大信息量的傳送與記憶而壓縮數據,并有效地回放聲音的過程。語音壓縮可由將語音信號采集,并利用適當的量子化形式的壓縮符號化或預測符號化等進行?,F代常用的語音信號表示方法如用生成模的參數表示聲音時,參數的數據率為5K比特/秒左右,與波形符號化相比,參數表現的數據率顯著變低,若使用聲音生成模,則以利用聲音信號分析而得的模的參數為基礎,可進行聲音的再合成。在聽覺上得到的與原聲音沒有多少不同的合成聲音。參數的數據率為信號波形數據率的以下, 所以可進行高效的聲音數據壓縮。單從聲音的存儲與壓縮率來考慮,生成模參數表示法明顯優(yōu)于信號波形表示法。但要將之應用于單片機,顯然信號波形表示法相對簡單易實現,具有很強的可行性。故方案的設計均從聲音信號以波形存儲來考慮。基于這種思路的算法,除了傳統(tǒng)的一些脈沖編碼調制外,目前已使用的有VQ技術及一些變換編碼和神經網絡技術,但是算法復雜,目前的單片機速度低,難以實現。結合實際情況,提出了以下幾種可實現的方案。1、 短時平均跨零計數法該方案通過確定信號跨零數,語音信號編碼為數字信號。該方案主要應用于語音識別中,具有較小的回放失真,音質較好。但對于現用單片機,處理數據能力低,故該方法不易實現。2、 實時幅值采樣法采樣過程如下圖所示:(1) 直存直取法該方案將話音信號的抽樣值直接存取,以保證在回放時能真實的重現抽樣值。由于這種方法重現的是采樣的真實值,所以只存在一般量化噪聲,與A/D轉換精度有關。故此方法回放質量最好,但占用存儲空間也最大,編碼速率為62.5kBit/s,每采集1秒鐘的話音信號需占用7.8125K字節(jié)。由于我們擴展了256K字節(jié)的RAM,故采用這種方法作為不壓縮的存儲,音質好,錄音可達32.768秒。該方法示意圖如圖1:圖1注:該方法中的量化臺階為10H,圖中70H、80H、70H、60H、50H、40H、50H、 70H、 90H、C0H、D0H、D0H為所要存儲的值,解碼后所輸出的值為:70H、 80H、70H、60H、50H、40H、50H、70H 90H、C0H、D0H、D0H(2) 欠抽樣采樣法雖然語音信號頻譜在高頻處迅速下降,但語音信號并非固有的頻帶受限。對于濁音來說,超過4kHz頻率的頻譜比其峰值要低40dB以上。另一方面,對于清音,即使超過8kHz,頻譜也沒有顯著下降。因此為了精確的表示所有語聲,常常需要大于20kHz的抽樣率。然而,在大多數應用中不需要這樣高的抽樣率。通常我們只要有3.5kHz以下的頻譜足以清晰地傳輸話音信號,即8kHz的采樣速率足矣,通常的“電話語音”就是用4kHz的奈奎斯特頻率實現的。因此可以8K的采樣速率對話音信號采樣,而存儲時采用奇存法,即只存奇數點而拋棄偶數點,回放時在兩相鄰奇數點之間的偶數點只需用兩數的平均值代替即可。這樣既保留語音信號的主要部分,使回放的音質較為理想,又提高了存儲器的利用率,理論計算錄音時間可達65.536秒,數據壓縮率為1:2。但是,由于這種方法的采樣速率實際上只有4kHz,故在回放時會產生一定的失真。該方法示意圖如圖2所示圖2注:圖中70H、70H、50H、50H、90H、D0H、為所要存儲的值,解碼后所輸出的值為:70H、70H、70H、60H、50H、50H、50H、70H 90H、B0H、D0H(3) 自相似增量調制法 從典型的語音信號可以看到,語音信號的特征是隨時間而變化的,在大多數語音處理方案中,基本的假定為語音信號特性隨時間的變化是緩慢的。這個假定導出各種“短時”處理方法,在這里語音信號被分隔為一些短段再加以處理。這些短段就好像是來自一個具有固定特性的持續(xù)音片斷一樣。這些短段一般都按要求重復(常是周期性的)。這些有時稱為分析幀的短段彼此經常有一些疊接,對每一幀的處理結果或是一個數或是一組數。所以,經過處理以后產生一個新的依賴于時間的序列而用于描述語音信號。這種短時處理技術,可以表示成數學形式對語音信號(或者是經線性濾波后濾出所要求的頻段)做變換T,該變換可以是線性的,也可以是非線性的,它可以依賴于某個可調參數或一組參數。然后把所得到的序列乘以窗序列,這個窗序列位于與抽樣標志n相一致的時間上,最后對乘積的所有非零值求和。通常窗序列寬度是有限的,當然不總是這樣。所以Qn值就是序列Tx(m)的部分加權平均值的序列。短時分析原理的一般表示如圖3所示。 圖3利用語音信號的短時平穩(wěn)性及波形自相似的特點,本系統(tǒng)提出自相似增量調制法,該方法是以8K的采樣速率,在采樣過程中,以每九個相鄰采樣點為一組,每組中對第一個采樣值保存其真實值,而其余的采樣值采用增量調制的方法生成一個字節(jié)保存,這樣,每一組共占用2個字節(jié)。數據壓縮率為1:4.5。該方法既有M調制的優(yōu)點,又同時兼有PCM編碼誤差較小的優(yōu)點,編碼誤差不向后擴散。編碼示意圖如圖4:圖4注:圖中所示增量為=10H,所存數據為70H,87H(10000111B),C0H,.其中,70H和87H組成上述的一組,70H為一組中的第一點,是真實的采樣值,87H是增量調制后的編碼,它的每一位都表示了曲線的變化趨勢,增量調制用一位碼表示相鄰抽樣值的相對大小,而相鄰抽樣值的相對變化同樣能反映模擬信號的變化規(guī)律。只要時間間隔t和臺階都很小,則m(t)和m(t)將會相應的接近。解碼后所輸出的值為:70H、80H、70H、60H、50H、40H、50H、60H、70H、C0H、D0H.由于使用了M調制使系統(tǒng)產生了過載量化噪聲,過載量化噪聲(有時簡稱過載噪聲)發(fā)生在模擬信號斜率陡變時,由于臺階是固定的,而且每秒內臺階數也是確定的,因此,階梯電壓波形就跟不上信號的變化,形成了很大失真的階梯電壓波形,這樣的失真稱為過載現象,也稱為過載噪聲。(二) A/D、D/A及存儲器芯片的選擇 1A/D轉換芯片的選擇根據題目要求采樣頻率fs=8 kHz,字長=8位,可選擇轉換時間不超過125 S的8位A/D轉換芯片。當前常用的A/D轉換的實現方法有多種:積分式、逐次逼近式、并行比較式和二進制斜坡式(又稱計數式)、量化反饋式等。鑒于轉換速度的要求,最適合本題使用的是逐次逼近式轉換器,它具有轉換速度較快、轉換精度較高的特點,一次轉換時間在數微秒至百微秒范圍內。其中ADC0809是目前使用較為廣泛的通用8位A/D轉換芯片。它的轉換時間小于120 S,模擬輸入為0 5 V,基本上可以滿足題目的要求,但由于要實現自動錄音,需要數微秒級的轉換時間才能達到良好的效果。因而我們采用了12位逐次逼近式A/D轉換芯片AD1674。它的轉換時間小于10 S,可編程為8位A/D轉換工作方式,而且其可輸入5V的模擬信號,故無需在前級增加電平抬高電路,可減少因通過一級電路后引起的信號失真以及系統(tǒng)噪聲。2D/A轉換芯片的選擇D/A轉換器的作用是將存儲的數字語音信號轉換為模擬語音信號,由于一般的D/A轉換器都能達到1S的轉換速率,足夠滿足題目的要求,故我們在此選用了通用D/A轉換器DAC0832。AD1674、DAC0832與單片機的連接如圖5所示圖5 3數據存儲器的選擇當采樣頻率fs =8kHz,字長為8位時,按照1:1的存儲率,一秒鐘就能采樣8000個點,為了能夠存儲多于10秒鐘的語音,則存儲器至少需要有78.125K8的容量。在此我們選用了兩片IS61C1024將存儲容量擴展為256K8,這樣就能以1:1的存儲率存儲32.768秒語音信號。電路圖如圖6所示圖6(三) 放大器的設計作為語音放大器的前端放大器,有以下幾點要求:1. 低噪聲,高增益。2. 有較大的動態(tài)范圍。3. 失真度小。 前端放大器:系統(tǒng)要求放大器增益為64dB,由于駐極體生成的語音信號 較大,在此我們選用動圈型拾音器。為了保證錄音質量,語音信號應保證滿量程模數轉換,所要錄制的聲音大小可能相差很大,因此AGC電路至關重要,所以我們將放大器做成低噪聲、自動增益控制(AGC)兼手調增益型放大器。 在此選用低噪聲高壓擺率的運放NE5532作為放大器,對信號進行多級放大:緩沖放大、放大、調整放大,其中放大環(huán)節(jié)包括AGC和手動增益調節(jié),且兩種方式可自由切換。后端放大器:為了保證耳機和外放都能正常工作,語音信號的輸出應有一定的輸出功率,在此選用兩級放大,第一級為信號放大,第二級為功率放大,由于功率放大器有較大的噪聲,在使用耳機工作時需輸出的功率較小,可只對語音信號進行信號放大,因此我們選用兩種工作方式:信號放大、功率放大,這樣既保證了使用外放的使用,又不增加耳機工作的系統(tǒng)噪聲。在該系統(tǒng)中,有兩處用到放大器,增益分別為46dB和40dB,且增益均可調,既可用專用放大器實現,也可用分離元件實現,綜合考慮實際應用與性價比,我們采用分立元件實現。注意到發(fā)揮部分要求減少系統(tǒng)噪聲電平,增加自動音量控制,所以我們將放大器做成低噪聲、自動增益控制(AGC)兼手調增益型放大器。(四)濾波器的設計為了濾除音頻信號中不必要的雜波,必須在數據采集前端放置濾波器,以盡可能濾除噪聲干擾與混疊失真。這里將通頻帶設為300Hz3400Hz,選用分立元件構成的有源濾帶通Butterworth濾波器,其性能優(yōu)于集成濾波器。 整個系統(tǒng)框圖如圖7所示。 圖7二、 理論分析與計算(1) 放大器設計這里由NE5532構成的增益放大器,增益可達64dB, 可手動調節(jié)與自動調節(jié),手動調節(jié)時KEY與端點2連接,通過調節(jié)電位器R9改變2N7000柵極電壓來調整增益,增益的達64dB且連續(xù)可調,當KEY與端點1連接時,增益可自動調節(jié),輸入信號小可到幾毫伏,線性動態(tài)范圍為40dB,輸出OUT一直穩(wěn)定在10Vp-p,電路如圖8所示: 圖8該增益放大電路由三級運放組成:第一級為緩沖放大,對語音信號進行緩沖,增益為:第二級包括AGC和手動增益調節(jié)電路,增益為:RDS 為2N7000的導通電阻,由2N7000柵極的電壓決定,三極管9012構成的檢波電路對第二級放大器構成了負反饋,使輸出電壓穩(wěn)定。 第三級為調節(jié)放大,調節(jié)輸出信號Vp-p=10V,即保證A/D滿量程轉換,增益為:采樣輸出放大器:經帶通濾波器輸出的聲音回放信號,其幅度為0,足以用耳機來收聽,故不用接任何放大器。而考慮到實際中經常會用到喇叭外放,故在本系統(tǒng)中增加外放功能,前端放大器采用通用型音頻功率放大器來完成。電路如圖9圖9該電路為增益50200連續(xù)可調,最大不失真輸出功率為325mW。輸出端接C2,R2串聯電路,以校正喇叭的頻率特性,防止高頻自激。腳接220F去耦電容,以消除低頻自激。為便于該功放在高增益情況下工作,這里將不使用的輸入端腳對地短路。(2)有源帶通濾波器設計 聲音信號經動圈拾音器轉化成電壓信號,通過前級放大,在對其進行數據采集之前,有必要經過帶通濾波器濾除帶外雜波。選定該濾波器的通帶范圍從300Hz到3.4kHz。其作用:(1)保證3003400Hz的語音信號不失真的通過濾波器;(2)濾除帶外的低頻信號,以減少帶外工頻等分量的干擾,大大 減小噪聲影響,該下限頻率可下沿到270Hz左右;(3)便于濾除帶外的高次諧波,以減小因8K采樣率而引起的混 疊失真,根據實際情況,該上限頻率可在2700Hz左右;帶 通濾波器按品質因數Q的大小分為窄帶濾波器(Q10)和 寬帶濾波器(Q10)兩種,本題中,上限頻率fh=3400Hz, 下限頻率 fl=300Hz,通帶濾波器中心頻率: 品質因數Q: 顯然,Q/T區(qū)域有較多的高頻泄漏,表現在時域圖上如圖14的(b)所示,波形有階梯不夠平滑。因此需要在D/A變換后,加模擬低通濾波器,濾除不必要的高頻分量,對波形起平滑作用,該模擬濾波器也稱平滑濾波器。經過上述處理的話音信號,具體實現后與原聲對比可知:處理后的信號失真較小。從另一個方面考慮上述處理過程,零階保持器在將采樣信號恢復成模擬信號的同時,由于低通的作用,對信號加了一個小的相移, 由于人耳對相位的失真是不敏感的,故不考慮相位的滯后;除此以外,還對高頻少部分信號進行了不應有的衰減,增大了信號的失真,若能將這部分衰減進行補償,則可使話音信號的失真進一步減小。鑒于此,我們對零階保持器傳輸函數H(j)中因Sa函數而引起的衰減進行補償,即校正,具體方法如下:首先對頻域中的函數進行分析,在頻域304030HZ范圍內的曲線如圖16所示: 圖16由圖可見,它近似于阻帶內增益變化極為緩慢的阻帶內近恒定增益的高通濾波器;進一步分析可知,該曲線在頻率很高處有大幅度的下降,故可用帶通濾波起來擬和該曲線,由于受單片機數據運算處理能力(0.5MPS)的限制,數字濾波不易實現,故這里采用硬件濾波,濾波電路如圖17所示: 圖17該濾波網絡采用簡單的無源濾波網絡即可實現,圖中C1、R1構成初始放大倍數近乎恒定的網絡,觀察到在頻率 較高處有大幅度的衰減,故該網絡還應滿足在頻率較高處的衰減 特性,考慮到對于聲音信號,過多的高頻分量只能增加噪聲,所以后接R2、C2構成低通濾波器,截止頻率合理的設在3.4k100HZ。仿真結果如圖18、19所示:圖18 圖19 由仿真結果可知,該網絡在頻域由30Hz起,增益緩慢增大,從3.4kHz處幅頻響應大幅度降底,曲線擬和較好,補償了Sa函數。三、 軟件設計流程系統(tǒng)軟件總體流圖見圖20、21所示。圖20圖21四、 其它功能的實現:1、 良好的人機界面: 系統(tǒng)工作狀態(tài)由數碼管顯示,系統(tǒng)狀態(tài)的轉換有鍵盤控制包括三種處理方式的切換:直存直取法、欠抽樣采樣法、自相似增量調制法;錄音開始時間的選擇:即時式、自檢測式。2、 錄放音時間可由數碼管顯示。3、 存儲的語音信號掉電不丟失,掉電后RAM由電池供電,掉電保護電路如圖22:圖224、 系統(tǒng)錄音的自檢測功能:錄音的開始時間有兩種方式:即時錄音方式即可在按鍵后開始錄音,自檢測方式是在按鍵后并不開始錄音,而是在當有聲音發(fā)出時才開始錄音。當鍵按下后,A/D

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論