【《基于語音特征參數(shù)提取的聲紋識別系統(tǒng)研究》10000字論文】_第1頁
【《基于語音特征參數(shù)提取的聲紋識別系統(tǒng)研究》10000字論文】_第2頁
【《基于語音特征參數(shù)提取的聲紋識別系統(tǒng)研究》10000字論文】_第3頁
【《基于語音特征參數(shù)提取的聲紋識別系統(tǒng)研究》10000字論文】_第4頁
【《基于語音特征參數(shù)提取的聲紋識別系統(tǒng)研究》10000字論文】_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于語音特征參數(shù)提取的聲紋識別系統(tǒng)研究并且密碼本身容易被使用者遺忘等現(xiàn)實(shí)問題,給人們的日常生活帶來了很多麻本文論述了聲紋識別技術(shù)、語音預(yù)處理、特征參數(shù)提取方法分原理以及GMM模型的原理和訓(xùn)練算法,設(shè)計(jì)了一個較為完善的具有身份鑒別功能的單人型,提取梅爾頻率倒譜系數(shù)(MFCC)作為說話人語音特征參數(shù),對模型進(jìn)行訓(xùn)目錄 21.2國內(nèi)外研究現(xiàn)狀 3 5 52.1聲紋識別介紹 52.2生理學(xué)依據(jù) 6 72.4系統(tǒng)總體方案設(shè)計(jì) 83.軟件設(shè)計(jì) 83.1語音集建立 83.2采樣和量化 93.3語音預(yù)處理 93.3.1預(yù)加重 93.3.2分幀與加窗 3.3.3端點(diǎn)檢測 3.4說話人特征參數(shù)提取 3.4.1特征參數(shù)的選取 3.4.1MFCC特征參數(shù)的提取 3.5GMM聲紋模型 3.5.1GMM聲紋模型理論依據(jù) 3.5.2數(shù)學(xué)理論 3.5.2模型訓(xùn)練 3.6身份鑒別 4.功能實(shí)現(xiàn) 4.1軟件環(huán)境 4.2讀入測試語音集 4.4特征參數(shù)提取測試……………錯誤!未定義書4.5高斯模型訓(xùn)練測試…… 21 1.1課題背景和意義目前主流的身份確認(rèn)系統(tǒng)仍舊使用預(yù)先設(shè)定的個人信著挑戰(zhàn)(李明和,張?zhí)煊樱?022)。而利用人類生物學(xué)特性進(jìn)行身份鑒別就可以省去預(yù)先設(shè)定個人信息或記憶密碼的步驟,讓人們的日常生活更加高效便捷(王子凡,劉晨曦,2023)。人類生物學(xué)特性包含很多方面,最常見的也是最常使用的就是指紋。除此之外還有視網(wǎng)膜、聲音、人臉等。與其他是人類生物學(xué)特性相比,它非常容易產(chǎn)生和獲得,是人類最自然的特征之一,從這些統(tǒng)計(jì)中看出同時由于遺傳信息決定的每個人的生理特征不同,每個人的聲音也各不相同,從而可以作為身份鑒別的依利用聲音為依據(jù)進(jìn)行身份鑒別不需要特意去進(jìn)行密碼的記憶,從而讓人們的日常生活變得更加輕松。而且利用聲紋進(jìn)行身份的識別對硬件的精度也并不高,成本低,相比較于其他的人類生物學(xué)特征,聲音也更容易被用戶所接受(孫睿哲,周梓萱,2024)。因此本課題基于聲紋識別的身份鑒定設(shè)計(jì)具有深刻的現(xiàn)實(shí)意義,同時也具有廣闊的發(fā)展空間。聲紋(Voiceprint)是語音特征的總稱,它根據(jù)那些穩(wěn)定、獨(dú)特和可測量的特征來描述和識別說話者的聲音和語音模型。這在一定程度上預(yù)示了語音特征是指從說話人的聲音中提取的參數(shù),用以描述該說話人的聲音的個性(楊宏志,高思遠(yuǎn),2024)。近年來,以指紋、聲紋、人臉和虹膜等生理特征識別為目標(biāo)的生物識別技術(shù)得到迅速發(fā)展,并在許多領(lǐng)域得到應(yīng)用,特別是在人類識別方面。它還被廣泛應(yīng)用于刑事偵查、犯罪追蹤、國防監(jiān)控、證券交易、銀行交易、語音解鎖等語音識別,也可以稱作說話人識別,它本質(zhì)上可以說是一個分類問題,從身份確認(rèn)的形式上來說,可以把它分為兩類,一類是對說話人的確認(rèn),即某一段話是否是某個人所說的“是”或“否”的問題,另一類是對說話人的識別,即在多進(jìn)行識別需要解決的核心問題是提取采集的語音中的表征說話人身份的語音特征,利用該特征進(jìn)行訓(xùn)練。在此類場景里然后處理等待識別的語音信號,將其與模型集中的數(shù)據(jù)進(jìn)行比較,并計(jì)算出一個分?jǐn)?shù)從而對說話者的身份進(jìn)行確語音系統(tǒng)的組成部分可以簡單的概括為三個部分:提取語音特征、模型構(gòu)建、相似度判斷,即如下圖所示流程圖。語音識別系統(tǒng)流程圖回顧聲紋識別技術(shù)的發(fā)展經(jīng)過,可以分為四個階段。第一個階段為上世紀(jì)四十至七十年代。這個階段代表人物為勞倫斯科斯塔。第二個階段為上世紀(jì)四十年代至七十年代。在這個時期,聲紋識別技術(shù)上升到一個新的階段,這個階段的研究大多將重點(diǎn)放在語音信號的特征參數(shù)上,探究如何提取特征參數(shù),從這些反饋可以推斷如何選擇合適的特征參數(shù)是這一時期的步建立了起來,也出現(xiàn)了一大批聲紋特征,如線性預(yù)測倒譜系數(shù)(LPC)、梅爾頻率倒譜系數(shù)(MFCC)。這個時期研究的聲紋特征在如今提取說話人特征,進(jìn)第三階段為上世紀(jì)七十年代至九十年代。這一時期有關(guān)聲紋識別模型的研究飛速發(fā)展,出現(xiàn)了許多模式匹配模型,從這些經(jīng)歷中明白如矢量量化技術(shù)(VQ)、動態(tài)時間規(guī)整(DTW)、隱馬爾科夫模型(HMM)等模式匹配模型。第四階段為九十年代至今。經(jīng)歷了之前幾個階段的發(fā)展,此時聲紋識別技術(shù)已經(jīng)變得比較成熟,逐漸發(fā)展到實(shí)際應(yīng)用方面,研究的重心轉(zhuǎn)向如何提高聲紋識別系統(tǒng)的可靠性和實(shí)用性問題。為解決這個問題,在這般的設(shè)定里在這個階段一方面需要尋找更能代表說話人特征的參數(shù),另一方面也產(chǎn)生了新的模式匹配理論(趙雨婷,李俊宇,2024)。在語音處理技術(shù)方面,相較于國外,我國技術(shù)發(fā)展較晚,水平也比較落后,但在中科院的主持和領(lǐng)導(dǎo)下以及863計(jì)劃的執(zhí)行下得到了快速發(fā)展,基本與國外先進(jìn)水平持平。但研究方向比較單一,大多偏向于語音識別方向(王俊豪,周子凡,2023)。近些年的說話人識別的研究方向更加多元化,在此情此景中但總體來說可以歸納為兩個方向:一個方向?yàn)榛谔囟ㄈ后w的嵌入式方向語音識別,此方向側(cè)重于“與文本無關(guān)”另一個方向則更為高級,注重于說話人所說內(nèi)容(張浩文,劉子和,2024)。目前在國內(nèi),聲紋識別技術(shù)已經(jīng)廣泛應(yīng)用到軍事、國防、政府、金融等多個領(lǐng)域。因此本課題基于GMM聲紋識別的身份鑒別設(shè)計(jì),不僅具有重要的現(xiàn)實(shí)意義,也具有一定的研究價值。本文的課題安排為:第一章為緒論,系統(tǒng)的介紹了本課題的背景意義及發(fā)展現(xiàn)狀。第二章為基礎(chǔ)理論和設(shè)計(jì)方案,系統(tǒng)論證了聲紋識別的依據(jù)和過程以及實(shí)現(xiàn)聲紋識別身份鑒定的關(guān)鍵問題,并給出整體設(shè)計(jì)方案。第三章為軟件設(shè)計(jì),第四章為功能實(shí)現(xiàn),測試設(shè)計(jì)的程序。聲紋(Voiceprint)本質(zhì)上是一種聲波頻譜,具有特定性和相對穩(wěn)定性,包含著能夠表征說話人個性信息的語音特征參數(shù),每個人的聲紋都是獨(dú)一無二的,同時隨著年齡的增長也能保持相對的穩(wěn)定性,不會發(fā)生很大的變化,因此可以用它作為區(qū)分不同人的依據(jù),來進(jìn)行身份鑒別(李澤宇,陳博文,2024)。Recognition),即利用人的生理學(xué)特征一一聲音,對說話人進(jìn)行區(qū)分,從而實(shí)現(xiàn)身份鑒別的目的。聲紋識別經(jīng)常與語音識別搞混(趙宇和,張怡然,2024)。這兩種技術(shù)的區(qū)別帶你在于它們的著眼點(diǎn)不同,從這些實(shí)踐中得出語音識別的側(cè)重點(diǎn)放在了語音的內(nèi)容上,關(guān)心點(diǎn)在說了什么內(nèi)容什么話上;而聲紋識別的側(cè)重點(diǎn)放在了其中包含的能夠表征說話人身份的特征參數(shù)上,并不關(guān)心究竟說了什么話,而根據(jù)聲紋識別的結(jié)果是否需要用戶錄制內(nèi)容特定的語音文本,聲紋識別可以被劃分為兩類(王嘉懿,劉雨欣,2024):文本相關(guān)或文本無關(guān)。本研究有效地將理論與實(shí)際相交融,為所研究議題提供了扎實(shí)的答案,并為后續(xù)研究開拓了新的研究方向和思路啟發(fā)。通過實(shí)證分析、案例考察及綜合研究方法,本文不僅驗(yàn)證了理論構(gòu)想的正確性,還揭示了實(shí)踐中的核心要素及其作用路徑。這一交融不僅提升了本文對問題本質(zhì)的認(rèn)知深度,也為相關(guān)領(lǐng)域的學(xué)者提供了可參照的研究范式和框架。后續(xù)研究可以在此基礎(chǔ)上進(jìn)一步探索問題的深層次原因、拓展應(yīng)用范疇或提出更為精細(xì)化的解決方案,共同推動該領(lǐng)域知識的豐富與深化。如果限定了用戶的語音內(nèi)容,用戶的語音只能為一段由設(shè)定者提前設(shè)定好的文本,于此特定條件之下結(jié)論自然浮出水面則將這種識別方法稱之為文本相關(guān)說話人識別,這種識別方法排除了語音內(nèi)容這個輸入變量,而將變量僅僅限定為說話人,從而提高了整體的識別率。本設(shè)計(jì)采取的就是這種聲紋識別方法。而若不對用戶的語音內(nèi)容進(jìn)行限制,則輸入的變量就并不單一,而是多變量輸入(趙詩琪,李晨陽,2024)。多變量的輸入提高了對系統(tǒng)的要求,需要更為復(fù)雜的模型,但相比較于文本相關(guān)的識別方法,從這些統(tǒng)計(jì)中看出文本無關(guān)的識別方法明顯泛用度更高,用戶也有更高的自由度。人類語音的產(chǎn)生過程是一個非常復(fù)雜的過程,簡單來說人類語音的人體中負(fù)責(zé)管理語音的中樞和發(fā)聲器官承擔(dān)著使人類發(fā)聲的作用作用,過程則可以簡單的概括為如下過程:在呼氣和吸氣的過程中肺部會產(chǎn)生氣流,氣流經(jīng)過聲門聲道時會引起聲帶的震動,從而產(chǎn)生語音(張怡萱,陳卓然,2024)。在整個過程中,肺部相當(dāng)于發(fā)聲的信號源,喉部則承擔(dān)了調(diào)制器的作用,聲道和聲道在聲音的形成過程中起著決定性的作用。同樣是聲音,根據(jù)是否引起聲帶的共振也被分成兩類,如果氣流引起了聲帶的震動而發(fā)聲,這類聲音被稱為濁音(voice),而如果氣流僅僅只是通過聲帶,而沒有引起聲帶的震動而發(fā)出聲音,這在一定程度上預(yù)示了這類聲音則被歸類于清音(unvoive)。而決定聲音中的個人特性,從而區(qū)分不同的說話人的依據(jù)從生理學(xué)上來說,與聲帶的特性有關(guān)系,并且濁音具有一定的周期性(孫梓涵,周宇航,2024)。所以濁音是語音是語音識別技術(shù)中主要使用的部分。清音本身因?yàn)椴⒉唤?jīng)過聲帶振動產(chǎn)生,因此并不具有周期性,從頻譜上看更接近于噪聲,在這種環(huán)境下特點(diǎn)也與隨機(jī)噪聲非常接近,在語音識別技術(shù)中屬于干擾部分(王思遠(yuǎn),李肺語音產(chǎn)生的機(jī)理圖識別階段,流程如下圖所示。NwylwmNwylwm訓(xùn)練階段識別階段M放在聲紋模型庫中,供識別階段使用(陳瑞鵬,劉文浩,2024)。小或者得分最高的為識別結(jié)果(高文博,趙辰宇,2024)。觀察該流程圖,我們可以發(fā)現(xiàn),如果我們想要利用聲紋實(shí)現(xiàn)身份鑒別的目的,則有兩個關(guān)鍵性的問題需要解決:(1)語音信號的特征提取本文將在后續(xù)章節(jié)中解決這個問題。本設(shè)計(jì)的程序總體分成四個部分,第一部分是對語音進(jìn)行預(yù)處理,第二部分是提取特征參數(shù),第三部分是模型的訓(xùn)練,第四部分為識別階段。流程如圖所示。語音預(yù)處理身份鑒別本設(shè)計(jì)為文本相關(guān)說話人語音識別,受客觀條件限制自建語音集,采集的語音信號為一段固定的數(shù)字,從這些反饋可以推斷語音采集工具選擇了安卓手機(jī)內(nèi)置的錄音APP。一共采集了10人的說話人語音信號,性別比為1:1。將采集的語音信號作為訓(xùn)練語音集使用(張奕辰,王涵柏,2024)。先廣泛搜集并詳細(xì)審閱了國內(nèi)外相關(guān)領(lǐng)域的經(jīng)典與最新文獻(xiàn)。這不僅全面梳理了研究問題的歷史背景、理論框架及當(dāng)前研究趨勢,還為本文的研究定位提供了清晰的參照。通過這一步驟,本文識別出了前人研究的不足之處與待完善的領(lǐng)域,從而明確了本研究的創(chuàng)新點(diǎn)與獨(dú)特價值。同時,廣泛的文獻(xiàn)審閱還加深了對相關(guān)理論的認(rèn)知,為后續(xù)理論模型的構(gòu)建、假設(shè)的形成及實(shí)證分析的進(jìn)行打下了堅(jiān)實(shí)基礎(chǔ)。采集目標(biāo)說話人的不同語速的語音作為測試語音集使用。從信號類型上來看,語音信號屬于一種模擬信號,而計(jì)算機(jī)只能處理數(shù)字信號。因此在對語音信號進(jìn)行預(yù)加重、加窗、分幀、端點(diǎn)檢測等一系列預(yù)處理之前,需要先對其數(shù)字化,即采樣和量化(張文靜,林雨婷,2024)。采樣的目的是將模擬信號轉(zhuǎn)化為離散信號,量化則是將其轉(zhuǎn)化為數(shù)字信號。根據(jù)奈奎斯特采樣原理,即若頻帶寬度有限的,要從抽樣信號中無失真地恢復(fù)原信號,抽樣頻率應(yīng)大于2倍信號最高頻率,由于語音信號的頻帶約為由于本設(shè)計(jì)使用的語音信號都是基于手機(jī)麥克風(fēng)和錄音APP錄制的,錄音后得到的文件,因此在實(shí)際上采樣和量化的工作已經(jīng)完成了(楊志豪,周子和,2024)。語音預(yù)處理流程步驟如圖所示。從這些經(jīng)歷中明白下面將對這些步驟進(jìn)行詳細(xì)講解。3.3.1預(yù)加重語音信號的高頻區(qū)含有大量的表征說話人個體特征的信息,這也正是進(jìn)行說話人身份鑒別所需要的關(guān)鍵信息。但由于人類特殊的發(fā)聲生理結(jié)構(gòu)導(dǎo)致頻率在800Hz以上的語音信號會隨著頻率的升高而加快衰減。因此必須對語音信號進(jìn)行高頻增強(qiáng),即進(jìn)行預(yù)加重處理(張和宇,王欣怡,2024)。預(yù)加重的目的是提高高頻部分,使信號的頻譜變得平坦,并保持在從低頻到高頻的整個頻段,能夠以相同的信噪比尋求頻譜。在這樣的設(shè)定下預(yù)加重是為了補(bǔ)償語音信號中被發(fā)音系統(tǒng)抑制的高頻部分,通過消除聲帶和嘴唇在發(fā)生時的影響,也是為了突出高頻的共振峰(趙博遠(yuǎn),高子琪,2024)。本設(shè)計(jì)采用軟件實(shí)現(xiàn)方式完成預(yù)加重,通過軟件設(shè)計(jì)一個高通濾波器,將語音信號通過該高通濾波器,從而實(shí)現(xiàn)預(yù)加重的目的。在此情此景中高通濾波器的傳輸函數(shù)如下所示(李子豪,陳宇航,2024):一般來說加重系數(shù)μ的取值為0.9~1.0,在本程序設(shè)計(jì)中μ取0.95。3.3.2分幀與加窗范圍通常為10~30ms,示初始的原始數(shù)字信號,用w(n)表示加窗時使用的窗函數(shù),則NormalizedFrequenc漢明窗:Samples漢明窗及其頻譜漢寧窗(陳梓萱,黃浩然,2024):漢寧窗及其頻譜本設(shè)計(jì)中對語音信號的分幀處理利用voicebox工幀長設(shè)置為258。本設(shè)計(jì)中頻率設(shè)置為16000Hz,在此類場景里幀長設(shè)置為256,通過音量進(jìn)3.4.1特征參數(shù)的選取外界噪聲信號的干擾性等問題,聲紋識別系統(tǒng)的特征參數(shù)的提取方法也多種多(1)線性預(yù)測系數(shù)及其派生系數(shù)。從這些反饋可以推斷包含:線性預(yù)測系數(shù)(LPC)、線性預(yù)測倒譜系數(shù)(LPCC)及其組(2)由語音頻譜直接導(dǎo)出的參數(shù)。從這些經(jīng)歷中明白如共振峰、梅爾頻率倒譜系數(shù)(MFCC)、感知線性預(yù)測系數(shù)(PLP)(3)混合參數(shù)?;旌蠀?shù)由上述不同的特征參數(shù)組成的特征矢量。的聲紋識別特征包括線性預(yù)測系數(shù)(LPC),線性預(yù)測倒譜系數(shù)(LPCC),梅線性預(yù)測系數(shù)(LPC)將需要分析的語音信號設(shè)定為一線性預(yù)測倒譜系數(shù)(LPCC)則是在線性預(yù)測系數(shù)(LPC)的基礎(chǔ)上,在這統(tǒng)的識別性能,基于梅爾頻率倒譜系數(shù)(MFCC)的優(yōu)勢,在這樣的設(shè)定下本設(shè)梅爾頻率倒譜系數(shù)(MFCC)是一種基于Mel頻率域的倒譜系數(shù),可以與實(shí)首先要通過FFT得到該幀信號的功率譜S(n),轉(zhuǎn)換為Mel頻率下的功率譜。角帶通濾波器,數(shù)量設(shè)定為20。本文亦對結(jié)論進(jìn)行了復(fù)核,首要確保研究發(fā)現(xiàn)voicebox工具箱中提供了計(jì)算mfcc參數(shù)的函數(shù),在此情此景中利用函數(shù)這一命令默認(rèn)地以256點(diǎn)為幀長計(jì)算12階MFCC參數(shù),如果s比較長,將3.5GMM聲紋模型GMM模型又被稱為高斯混合模型。這是一種概率統(tǒng)計(jì)模型。GMM模型之所以能夠應(yīng)用在聲紋識別技術(shù)中,基于GMM模型的聲紋識別的基本原理是構(gòu)建基于高斯混合模型(GMM)實(shí)際上是通過疊加不同的高斯分布3.5.2模型訓(xùn)練算法GMM模型(高斯混合模型)的訓(xùn)練采用期望最大化算法(EM)。其算法EM算法框圖這在一定程度上預(yù)示了為了更清楚地表述EM算法,引入輔助函數(shù)Q(yt=i;λ’為已有的模型參數(shù);λ為待估計(jì)的新參數(shù)。通過轉(zhuǎn)換,Q函數(shù)可以寫(1)E-Step:求訓(xùn)練樣本落在假定的隱狀態(tài)y=i的概率P(i|:偏導(dǎo)數(shù)為0時的參數(shù)值,這樣就可以獲得GMM混合權(quán)重、均值和協(xié)方差在迭代如何選取GMM模型的混合數(shù)M是一個復(fù)雜的問題。在聲紋識別系統(tǒng)中,若M的值過大,系統(tǒng)建立了許多模型參數(shù),這樣從訓(xùn)練的樣本中就有可能找不況下,M的取值要根據(jù)訓(xùn)練語音的長度來確定,一般取M=16或M=32。本程序設(shè)計(jì)中取12。本文在方法論上也實(shí)現(xiàn)了革新,作者獨(dú)具慧眼地綜合了多種既有混合權(quán)重、均值和協(xié)方差的重估化GMM,初始化選擇的GMM混合數(shù)是12,當(dāng)初始化之后就進(jìn)行說話人GMM訓(xùn)練,本設(shè)計(jì)使用的是EM算法來估計(jì)GMM參數(shù),用一個初始模型參數(shù)λ去估計(jì)一個新的模型參數(shù)λ,使得式XX成立,新的模型參數(shù)會成為下一次估計(jì)的初3.5.3身份鑒別算法通過上述模型可以找到具有最大后驗(yàn)概率的模型所對應(yīng)的目標(biāo)說話人,即根據(jù)以上的分析,基于GMM的聲紋識別說話人辨認(rèn)系統(tǒng)的結(jié)構(gòu)框圖如圖所AS2.進(jìn)入特征參數(shù)提取部分,系統(tǒng)提取梅爾頻率倒譜系數(shù)(MFCC)作為說話人特征參數(shù),輸出訓(xùn)練語音庫中語音的12階,26階,39階MFCC圖像(趙雅思,瑞后系統(tǒng)會將該語音文件的特征參數(shù)MFCC與模型利用身份前文所述身份鑒別風(fēng)和錄音APP采集,在此情此景中同時借助語音信號處理工具箱Voicebox中的一部分專用函數(shù)和工具完成相關(guān)設(shè)計(jì)。Voicebox不是matlabR2016a中自帶的工運(yùn)行程序,讀入語音數(shù)據(jù)并對其進(jìn)行特征提fx讀取語音文件并進(jìn)行特征提取...0"3"的39階MFCC使用特征參數(shù)訓(xùn)練GMM模型,命令行窗□顯示GMM模型參數(shù)并輸出參數(shù)圖,以訓(xùn)練語音庫中說話人“3”為例,如下圖所示:所有高斯混合模型結(jié)束后,系統(tǒng)提示訓(xùn)練結(jié)束,讓用戶選擇需要識別的說話人語音,這里選擇的語音對應(yīng)訓(xùn)練語音集中的說話人3?!痢痢秏程序?qū)Υ郎y語音與模型庫匹配,命令行窗口提示用戶等待10s,輸出結(jié)果“說話人是3”,程序結(jié)束,達(dá)成預(yù)期目的。識別中...待測模型匹配中,請等待10秒!f說話人是3。>>本次的課題主要針對利用聲音這一人的生物特性實(shí)現(xiàn)身份鑒別的問題,選擇MFCC作為說話人特征參數(shù)和區(qū)分說話人的依據(jù),從這些實(shí)踐中得出高斯混合模型(GMM)作為識別模型,利用個人采集的語音數(shù)據(jù)對模型進(jìn)行訓(xùn)練,從而進(jìn)行身份鑒別。通過以上工作,本系統(tǒng)初步實(shí)現(xiàn)了基于GMM聲紋識別的身份鑒別。隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展和人們需求的不斷升高,本設(shè)計(jì)若想真正走進(jìn)人們的日常生活中實(shí)際應(yīng)用,仍然需要進(jìn)一步的改進(jìn)和研究:(1)外接麥克風(fēng)并采集其數(shù)據(jù),讓用戶可以直接通過麥克風(fēng)說話,完成語音鑒別而較少錄音以及上傳文件的繁瑣過程。安全防范技術(shù)與應(yīng)用,2020(05):17-20.[2]李明和,張?zhí)煊?聲紋識別助力“全面感知”智慧城市建設(shè)[J].中國安全防范技[4]趙子琪,陳浩然.基于聲紋的大熊貓個體識別系統(tǒng)分析與研究[D].電子科技大[5]Kerst

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論