




已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
3.1數(shù)字音頻的基本概念3.2音頻接口卡3.3數(shù)字音頻的壓縮編碼3.4音頻編碼標準3.5數(shù)字音頻處理軟件簡介3.6數(shù)字音頻的獲取與文件格式轉(zhuǎn)換3.7語音識別技術(shù),第三章多媒體音頻技術(shù),學習目標,1.了解聲音信號的特點、存儲格式及質(zhì)量的度量方法2.了解音頻卡的功能、構(gòu)成、原理及其應用3.理解音頻信號處理的方法4.了解音頻信號壓縮方法及音頻編碼標準5.掌握應用常用的音頻處理軟件對聲音信號進行處理的過程6.了解語音識別技術(shù)及其應用,3.1數(shù)字音頻的基本概念,聲音,聲音是因物體的振動而產(chǎn)生的一種物理現(xiàn)象。振動使物體周圍的空氣繞動而形成聲波,聲波以空氣為媒介傳入人的耳朵,于是人們就聽到了聲音。,數(shù)字音頻的基本概念,音頻音頻(Audio)是用聲音的頻率界定的,指頻率在20Hz20kHz范圍內(nèi)的聲波。音頻所覆蓋的聲音頻率是人的耳朵所能聽到的聲音。,3.1.2模擬音頻和模擬音頻記錄技術(shù),就記錄技術(shù)而言,為了模擬聲音的波形形狀從而將聲波振動轉(zhuǎn)變成唱片的波狀溝紋或磁帶的磁向排列的技術(shù)都可以稱為模擬音頻記錄技術(shù)。,模擬音頻即前面提到的模擬聲音,是指隨時間連續(xù)變動的音頻聲音波的模擬記錄形式,通常采用電磁信號對聲音波形進行模擬記錄。,數(shù)字音頻,數(shù)字音頻并非一種新的聲音,它不過是模擬音頻聲音進入計算機后的一種記錄和存儲形式。計算機在處理聲音時,除了輸出仍用波形形式外,記錄、存儲和傳送都不能使用波形形式,即聲音在進入計算機時,必須進行數(shù)字化,使時間上連續(xù)變化的波形聲音變成一串0、1構(gòu)成的數(shù)據(jù)序列。,模擬音頻與數(shù)字音頻特點比較,模擬音頻是連續(xù)的波動信號,數(shù)字音頻是離散的數(shù)字信號。模擬音頻不便進行編輯修改,數(shù)字音頻編輯、特效處理容易。模擬音頻用磁帶或唱片做記錄媒體,容易磨損、發(fā)霉和變形,不利長久保存;數(shù)字音頻主要用光盤存儲,不易磨損,適宜長久保存。模擬音頻進入計算機必須數(shù)字化為數(shù)字音頻,而數(shù)字音頻最終要轉(zhuǎn)換為模擬音頻才能輸出。,3.1.3音頻信號的數(shù)字化,音頻信號的數(shù)字化就是對時間上連續(xù)波動的聲音信號進行采樣和量化,對量化的結(jié)果選用某種音頻編碼算法進行編碼,所得結(jié)果就是音頻信號的數(shù)字形式,即數(shù)字音頻。,3.1.4語音合成,1.發(fā)音器官參數(shù)語音合成,2.聲道模型參數(shù)語音合成,3.波形編輯語音合成,3.1.5音樂合成,音樂合成是聲音合成的另一分支,與語音合成的對象不同,音樂合成的對象是樂音,而不是人類的語音,音樂合成的原理和方法,音樂合成方法一是調(diào)頻合成法,又稱FM合成法;一是波形表(Wavetable)合成法,又稱波表合成法。,FM合成法,FM合成法正是從樂音的頻譜特性分布中得到啟示,通過使用調(diào)頻(FM)技術(shù),利用不同調(diào)制波頻率和調(diào)制指數(shù),對載波進行調(diào)制,得到了具有不同頻譜分布的波形。,波表合成技術(shù),波表合成技術(shù)是先把音樂演奏家在各種不同樂器上演奏的不同音符、以適當?shù)牟蓸勇?、量化位?shù)錄制下來,形成樂音的波形數(shù)據(jù)。然后將各種波形數(shù)據(jù)存儲在ROM中。發(fā)音時,通過查找到所選預期的波形數(shù)據(jù),然后經(jīng)過調(diào)制、濾波、再合成等處理形成立體聲后發(fā)聲。,MIDI,MIDI(MusicalInstrumentDigitalInterface)是樂器數(shù)字接口英文首寫字母的縮寫,實際上,它是一套有關(guān)數(shù)字合成音樂的國際標準。,3.1.6聲音文件格式,4.midi格式,3.mp3格式,2.voc格式,1.wav格式,3.2.1聲卡的功能,文語轉(zhuǎn)換和語音識別,MIDI音樂錄制和合成,編輯與合成聲音文件,錄制與播放聲音文件,3.2.2聲卡的結(jié)構(gòu),聲卡的技術(shù)指標,音頻壓縮,DSP數(shù)字信號處理器,MIDI合成方式,采樣頻率和量化位數(shù),聲卡與外部設(shè)備的連接,3.3數(shù)字音頻的壓縮編碼,將量化后的數(shù)字聲音信息直接存入計算機將會占用大量的存儲空間。在多媒體音頻信號處理中,一般需要對數(shù)字化后的聲音信號進行壓縮編碼,使其成為具有一定字長的二進制數(shù)字序列,以減少音頻的數(shù)據(jù)量,并以這種形式在計算機內(nèi)傳輸和存儲。,聲音的壓縮編碼,混合型編碼,參數(shù)編碼,波形編碼,PCM編碼,編碼原理:PCM編碼調(diào)制是對連續(xù)語音信號進行空間采樣、幅度值量化及用適當碼字將其編碼的總稱,即它把連續(xù)輸入的模擬信號變換為在時域和振幅上都離散的量,然后將其轉(zhuǎn)化為代碼形式傳輸或存儲。,PCM編碼框圖,均勻量化,如果采用相等的量化間隔對采樣得到的信號進行量化稱為均勻量化。,非均勻量化,非線性量化的基本想法是,對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,3.4.2MP3壓縮技術(shù),MP3的全名是MPEGAudioLayer-3,簡單地說就是一種聲音文件的壓縮格式MP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會破壞原來的音質(zhì)。,3.4MP4壓縮技術(shù),MP4并不是MPEG-4或者MPEG-1Layer4,它的出現(xiàn)是針對MP3的大眾化、無版權(quán)的一種保護格式,由美國網(wǎng)絡(luò)技術(shù)公司開發(fā),美國唱片行業(yè)聯(lián)合會倡導公布的一種新的網(wǎng)絡(luò)下載和音樂播放格式。,3.5數(shù)字音頻處理軟件,AdobeAudition2.0GoldWaveCakeWalk(音樂大師),3.5.1AdobeAudition2.0,Audition的前身是CoolEditPro,一個非常出色的數(shù)字音樂編輯器和MP3制作軟件。不少人把CoolEdit形容為音頻“繪畫”程序。你可以用聲音來“繪”制:音調(diào)、歌曲的一部分、聲音、弦樂、顫音、噪音或是調(diào)整靜音。而且它還提供有多種特效為你的作品增色:放大、降低噪音、壓縮、擴展、回聲、失真、延遲等。,AdobeAudition2.0窗口,3.5.2GoldWave,GoldWave是一種相當棒的數(shù)碼錄音及編輯軟件,除了附有許多的效果處理功能外,它還能將編輯好的文件存為WAV、AU、SND、RAW和AFC等格式,而且它可以不經(jīng)由聲卡直接抽取SCSI形式的CDROM中的音樂來錄制編輯。,GoldWave窗口,3.5.3CakeWalk(音樂大師),音序器軟件作為MIDI軟件的核心和基礎(chǔ),在電腦音樂中起著了舉足輕重的作用。它控制著MIDI信息的輸入輸出,指揮著與它連接的各種外設(shè)的正常工作.,CakeWalk窗口,語音識別技術(shù),語音識別技術(shù)在信息社會有著廣闊的應用前景,除了上述的重要應用領(lǐng)域外,它還可以應用于殘疾人幫助,電話信息查詢,文本校對,火車站、飛機場、醫(yī)院等公共場所的語音幫助和識別系統(tǒng)。,3.7.1語音識別系統(tǒng),語音識別以語音為研究對象,是語音信號處理的一個重要研究方向,是模式識別的一個分支,其目的就是要讓機器具有人的聽覺功能,在人機語音通訊中“聽懂”人類口述的語言。根據(jù)不同的需求,語音識別的識別內(nèi)容可分為狹義的語音識別(SpeechRecognition)和說話人語音識別(SpeakerRecognition)。,語音識別系統(tǒng)基本原理框圖,處理的方法,識別判決,參數(shù)模板存儲,特征參數(shù)提取,連續(xù)語音流的預處理,3.7.2語音識別系統(tǒng)的應用,語音識別技術(shù)在信息處理領(lǐng)域的應用教育與商務應用消費電子產(chǎn)品應用,語音識別系統(tǒng)需要解決的問題,進行動力學建模,尋找更好的語音模型,增加系統(tǒng)的適應性,增加系統(tǒng)的穩(wěn)定性,本章小結(jié),本章主要介紹了與音頻信號有關(guān)的基本概念、硬件設(shè)備及其應用軟件,包括音頻信號的分類及其特點、音頻信號數(shù)字化過程、音頻卡簡介、音頻信號的壓縮與編碼標準、數(shù)字音頻的獲取、語音識別技術(shù)等內(nèi)容。音頻是指頻率在2020kHz范圍內(nèi)的可聽聲音,多媒體中的聲音主要包括數(shù)字音頻和MIDI音樂兩種類型。聲音信號的基本處理包括采樣、量化、編碼壓縮、編輯、存儲、傳輸、解碼、播放等環(huán)節(jié)。,音頻接口卡是實現(xiàn)音頻信號數(shù)字化和音頻輸出(語音合成)的硬件設(shè)備,實現(xiàn)音頻信號的A/D、D/A轉(zhuǎn)換。同時也能和MIDI設(shè)備通信,實現(xiàn)MIDI的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 山西省渾源縣第五中學校2025年化學高一下期末達標檢測模擬試題含解析
- 公務往返簽證管理辦法
- 北京收容管理辦法修訂
- 創(chuàng)新重點稅源管理辦法
- 公益訴訟損害管理辦法
- 回收芯片高頻管理辦法
- 團隊目標考核管理辦法
- 醫(yī)療廢物出境管理辦法
- 作業(yè)工具管理辦法臺賬
- 林業(yè)園林建設(shè)管理辦法
- 2024年露營帳篷項目可行性研究報告
- 《公務員錄用體檢操作手冊(試行)》
- 2024粵東西粵北地區(qū)教師全員輪訓培訓心得總結(jié)
- 2024-2025學年華東師大版數(shù)學七年級上冊計算題專項訓練
- 福建省機關(guān)工作人員年度考核登記表
- JBT 7808-2010 無損檢測儀器 工業(yè)X射線探傷機主參數(shù)系列
- DB44-T 2474-2024 自然教育標識設(shè)置指引
- 研學基地合作協(xié)議
- 駕駛員行為規(guī)范管理制度
- (高清版)JTG D81-2017 公路交通安全設(shè)施設(shè)計規(guī)范
- 《鍋爐水介質(zhì)檢驗導則標準-征求意見稿》
評論
0/150
提交評論