




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
模式識(shí)別非參數(shù)判別分類方法3.5.3
特征映射法、解決非線性判別分類問題*支持向量機(jī)采用的方法與前面提到的方法很不相同,支持向量機(jī)提出的方法是利用特征映射方法,使非線性分類的問題可以利用線性分類的計(jì)算框架來實(shí)現(xiàn)。*原理示意圖廣義線性判別函數(shù)
例如:假設(shè)對(duì)一個(gè)二維空間的分類問題,想用一個(gè)二次函數(shù)作為判別函數(shù),則二次曲線函數(shù)的一般式可以寫成:
作為映射后的特征向量,而相應(yīng)的廣義權(quán)向量如果我們希望采用廣義線性方程的方法,則可以定義則一個(gè)線性方程就可以寫成,其中,這樣一來,線性分類方法就可以直接采用。支持向量機(jī)利用特征映射的思想其中,是以下式子求極大值的解
計(jì)算上式的極大值只用到訓(xùn)練樣本數(shù)據(jù)間的點(diǎn)積<xi.xj>,而使用的分類器判別函數(shù)中權(quán)向量的作用也是通過權(quán)向量與樣本的點(diǎn)積體現(xiàn)出來的,而從(3-104)式子中可以看出,權(quán)向量是訓(xùn)練樣本中的支持向量的線性組合,因此WTX值的計(jì)算可以寫成(3-104)(3-105)(3-106)4
它表明在計(jì)算判別函數(shù)值時(shí),仍然只需要通過計(jì)算相應(yīng)數(shù)據(jù)的點(diǎn)積即可。
由此可以設(shè)想,如果我們將原特征向量用映射的方式轉(zhuǎn)換成
,則相應(yīng)的式子只需要改變成分類界面方程其中
為相應(yīng)的常數(shù)項(xiàng)(3-107)(3-108)特征映射,核函數(shù)分類界面方程
因此選擇合適的函數(shù)K(.,.)就成為設(shè)計(jì)中的重要問題
由于特征進(jìn)行了映射,從x變成了f(x),因此問題是在另一個(gè)映射后的空間討論的。設(shè)原空間維數(shù)為d,即,而新空間為m維,即
,則一般m維要比d維大得多。權(quán)向量的維數(shù)也是m維,它是在映射后空間中的支持向量的線性求和。但是支持向量機(jī)的提出者進(jìn)一步發(fā)現(xiàn),并不一定要求出這個(gè)權(quán)向量,因?yàn)榉诸惻袆e函數(shù)中只關(guān)心權(quán)向量與樣本向量之間的點(diǎn)積。因此,又引出了所謂核函數(shù)(3-109)(3-110)支持向量機(jī)計(jì)算示意圖核函數(shù)
與內(nèi)積函數(shù)值等價(jià)的函數(shù)K(.,.)稱為核函數(shù)。理論上的研究對(duì)核函數(shù)的充分必要條件進(jìn)行了研究,并已得出一些主要結(jié)論(如Mercer條件)。
常用的核函數(shù)還局限于以下三種函數(shù)形式。多項(xiàng)式類型的函數(shù)核函數(shù)型式的函數(shù)S行函數(shù),如(3-111)(3-112)(3-113)本章小結(jié)一、參數(shù)判別分類方法與非參數(shù)判別分類方法的區(qū)別
參數(shù)判別方法:它的提前是對(duì)特征空間中的各類樣本的分布清楚,因此一旦要測(cè)試分類樣本的特征向量值X已知,就可以確定X對(duì)各類的后驗(yàn)概率,也就是可按相應(yīng)的準(zhǔn)則計(jì)算與分類,所以判別函數(shù)等的確定取決于樣本統(tǒng)計(jì)分布的有關(guān)知識(shí)。
非參數(shù)分類判別方法:著眼于直接利用訓(xùn)練樣本集,省去參數(shù)估計(jì)這一環(huán)節(jié),這樣一來,從保證最小錯(cuò)去率的原則出發(fā)計(jì)算確定判別函數(shù)的方法就不適用了。因此,非參數(shù)分類判別方法只能根據(jù)一些其它準(zhǔn)則來設(shè)計(jì)分類器。分類器的效果好壞,所選擇的判別函數(shù)型式,所使用的訓(xùn)練樣本集,以及所用的算法是對(duì)結(jié)果都會(huì)有影響。二、非參數(shù)分類判別方法的基本做法
非參數(shù)分類判別方法進(jìn)行分類器設(shè)計(jì)主要包含兩個(gè)步驟:1.確定要使用的判別函數(shù)類型或決策面方程類型,如線性分類器,分段線性分類器,非線性分類器等或近鄰法等。如果使用人工神經(jīng)網(wǎng)絡(luò),則怎樣的網(wǎng)絡(luò)結(jié)構(gòu)也隱含了所使用的函數(shù)形式。
2.在選定的函數(shù)類型網(wǎng)絡(luò)結(jié)構(gòu)等條件下,確定相應(yīng)的參數(shù),從而完成整個(gè)分類器設(shè)計(jì)。三、決策面方程的顯示表示和隱式表示四、基于相似度的分類判別方法
判別函數(shù)的隱式表示與使用基于相似程度判別的原則有關(guān)。如近鄰法是用距離遠(yuǎn)近表示相似程度,錯(cuò)誤修正法用樣本向量與增廣權(quán)向量的點(diǎn)積運(yùn)算,也可在一定程度上看作相似度,在多類問題上,往往用計(jì)算相似度較為方便。*用函數(shù)直接表示分界面方程,如線性方程式表示的邊界等。*用隱含形式,例如我們用最小距離分類器就代表了這種類
型,其實(shí)這兩種型式是等價(jià)的。如二維空間的最小距離分類器用最小距離表示為:||X-m1||=||x-m2||而其等價(jià)于連接m1與m2線的垂直平分線。*本章學(xué)習(xí)的Fisher準(zhǔn)則、支持向量機(jī)與局部訓(xùn)練法等用的是
顯示表示,而錯(cuò)誤修正法和近鄰法則可以說是隱式表示。五、Fisher準(zhǔn)則
Fisher準(zhǔn)則是傳統(tǒng)模式識(shí)別方法中的典型方法,它強(qiáng)調(diào)將線性方程中的法向量與樣本的乘積看作樣本向量在單位法向量上的投影,如能做到不同類的樣本在法向量上的投影呈現(xiàn)類內(nèi)聚集,類間分開的效果,則對(duì)減少錯(cuò)分類有利。所得最佳法向量計(jì)算式為
(
見有關(guān)課本定義)。這個(gè)結(jié)果與正態(tài)分布協(xié)方差矩陣等的貝葉斯決策結(jié)果相近,這說明如果兩類分布范圍繞各自均值的確相近,F(xiàn)isher準(zhǔn)則可使錯(cuò)誤率較小。六、感知準(zhǔn)則函數(shù)方法
這種方法提倡用錯(cuò)分類提供的信息修正錯(cuò)誤,這種思想對(duì)機(jī)器學(xué)習(xí)的發(fā)展以及人工神經(jīng)元網(wǎng)絡(luò)的發(fā)生發(fā)展產(chǎn)生深遠(yuǎn)影響。七、近鄰法
近鄰法訓(xùn)練樣本數(shù)量較多時(shí),從逐漸錯(cuò)誤率角度看,其錯(cuò)誤率比較小,是經(jīng)常使用的模式識(shí)別分類方法,比較適合在多類別情況下使用。當(dāng)每類的樣本數(shù)很多時(shí),存儲(chǔ)量與計(jì)算量要求都偏高,使用剪輯近鄰法與壓縮近鄰法,特別是壓縮近鄰法可大量減少訓(xùn)練樣本的數(shù)量。八、支持向量機(jī)
支持向量機(jī)是新近提出的影響較大的方法。在理論上有很深的背景,這里指的理論是統(tǒng)計(jì)學(xué)習(xí)理論。
它主要關(guān)注的問題是:當(dāng)訓(xùn)練樣本數(shù)量有限時(shí)。在訓(xùn)練過程中做到使訓(xùn)練樣本錯(cuò)誤率為最小,是否就意味著系統(tǒng)在實(shí)際應(yīng)用中,也能自然而然做到錯(cuò)誤率小呢?對(duì)我們來說了解這種理論顯然超出我們課程的范圍,但是可以舉一個(gè)例子說明這種問題的確存在。例如下圖表示在一個(gè)樣本集(X,Y),其中X在實(shí)數(shù)范圍內(nèi)取值,而Y則在[-1,+1]范圍取值。例:Sin(ax)擬合紅線表示正確擬合得到的結(jié)果,但是對(duì)于這樣一組數(shù)據(jù),我們完全可以用一個(gè)函數(shù)Sin(ax)來擬合它,如圖中藍(lán)線表示的函數(shù)所示,只要調(diào)整參數(shù)a總可以使所有數(shù)據(jù)都落在Sin(ax)曲線上,但是很明顯Sin(ax)并不反映這組數(shù)據(jù)的內(nèi)在規(guī)律,如果再增加一個(gè)新數(shù)據(jù),參數(shù)a很可能就要變。從直觀上講,所用的函數(shù)Sin(ax)并不合適,但是從訓(xùn)練樣本數(shù)據(jù)來看,它的擬合程度的確很高。統(tǒng)計(jì)學(xué)習(xí)理論
從我們所討論的一些方法中,分類器設(shè)計(jì)的性能,都以隊(duì)訓(xùn)練樣本集有好的性能為目標(biāo),而沒有辦法保證在實(shí)際使用時(shí)仍能保持好的性能。支持向量機(jī)在線性可分時(shí)要求隔離帶盡可能寬,正是從期望實(shí)際的錯(cuò)誤率也較低這一點(diǎn)出發(fā)。關(guān)于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 未來公司風(fēng)險(xiǎn)控制的試題及答案
- 安全行為專項(xiàng)治理活動(dòng)工作總結(jié)模版
- 軟考軟件設(shè)計(jì)師核心概念解讀試題及答案
- 2025年海洋生態(tài)修復(fù)項(xiàng)目投資風(fēng)險(xiǎn)與應(yīng)對(duì)策略報(bào)告
- 法學(xué)概論考試中的角色扮演技巧與試題與答案
- 軟件技術(shù)試題及答案必讀
- 補(bǔ)償學(xué)生協(xié)議書
- 防汛儲(chǔ)備協(xié)議書
- 行政法學(xué)分析題目及答案
- 診所幫扶協(xié)議書
- 2025屆福建省廈門市音樂學(xué)校生物七下期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 中國卒中學(xué)會(huì)急性缺血性卒中再灌注治療指南(2024)解讀
- 守護(hù)生態(tài)平衡 共享多彩世界 課件 -2025年高中生物多樣性日主題教育
- GA/T 2161-2024法庭科學(xué)非法集資類案件資金數(shù)據(jù)分析規(guī)程
- 2025-2030中國黃金珠寶首飾行業(yè)市場(chǎng)深度發(fā)展趨勢(shì)與前景展望戰(zhàn)略研究報(bào)告
- 2025屆青海省西寧市高考第一次模擬預(yù)測(cè)地理試題(原卷版+解析版)
- 俗世奇人試題及答案
- 煤炭工業(yè)建筑結(jié)構(gòu)設(shè)計(jì)標(biāo)準(zhǔn)
- 【化學(xué)試卷+答案】廣東省茂名市2025年高三年級(jí)第二次綜合測(cè)試(茂名二模)
- 急救中心患者轉(zhuǎn)運(yùn)流程標(biāo)準(zhǔn)化指南
- 《2025急性冠脈綜合征患者管理指南》解讀
評(píng)論
0/150
提交評(píng)論