圖像模式識(shí)別的方法介紹_第1頁(yè)
圖像模式識(shí)別的方法介紹_第2頁(yè)
圖像模式識(shí)別的方法介紹_第3頁(yè)
圖像模式識(shí)別的方法介紹_第4頁(yè)
圖像模式識(shí)別的方法介紹_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 2.1圖像模式識(shí)別的方法 圖像模式識(shí)別的方法很多,從圖像模式識(shí)別提取的特征對(duì)象來看,圖像識(shí)別方法可分為以下幾種:基于形狀特征的識(shí)別技術(shù)、基于色彩特征的識(shí)別技術(shù)以與基于紋理特征的識(shí)別技術(shù)。其中,基于形狀特征的識(shí)別方法,其關(guān)鍵是找到圖像中對(duì)象形狀與對(duì)此進(jìn)行描述,形成可視特征矢量,以完成不同圖像的分類,常用來表示形狀的變量有形狀的周長(zhǎng)、面積、圓形度、離心率等。基于色彩特征的識(shí)別技術(shù)主要針對(duì)彩色圖像,通過色彩直方圖具有的簡(jiǎn)單且隨圖像的大小、旋轉(zhuǎn)變換不敏感等特點(diǎn)進(jìn)行分類識(shí)別。基于紋理特征的識(shí)別方法是通過對(duì)圖像中非常具有結(jié)構(gòu)規(guī)律的特征加以分析或者則是對(duì)圖像中的色彩強(qiáng)度的分布信息進(jìn)行統(tǒng)計(jì)來完成。從模式特征

2、選擇與判別決策方法的不同可將圖像模式識(shí)別方法大致歸納為兩類:統(tǒng)計(jì)模式(決策理論)識(shí)別方法和句法(結(jié)構(gòu))模式識(shí)別方法。此外,近些年隨著對(duì)模式識(shí)別技術(shù)研究的進(jìn)一步深入,模糊模式識(shí)別方法和神經(jīng)網(wǎng)絡(luò)模式識(shí)別方法也開始得到廣泛的應(yīng)用。在此將這四種方法進(jìn)行一下說明。2.1.1句法模式識(shí)別 對(duì)于較復(fù)雜的模式,如采用統(tǒng)計(jì)模式識(shí)別的方法,所面臨的一個(gè)困難就是特征提取的問題,它所要求的特征量十分巨大,要把某一個(gè)復(fù)雜模式準(zhǔn)確分類很困難,從而很自然地就想到這樣的一種設(shè)計(jì),即努力地把一個(gè)復(fù)雜模式分化為若干較簡(jiǎn)單子模式的組合,而子模式又分為若干基元,通過對(duì)基元的識(shí)別,進(jìn)而識(shí)別子模式,最終識(shí)別該復(fù)雜模式。正如英文句子由一些

3、短語(yǔ),短語(yǔ)又由單詞,單詞又由字母構(gòu)成一樣。用一組模式基元和它們的組成來描述模式的結(jié)構(gòu)的語(yǔ)言,稱為模式描述語(yǔ)言。支配基元組成模式的規(guī)則稱為文法。當(dāng)每個(gè)基元被識(shí)別后,利用句法分析就可以作出整個(gè)的模式識(shí)別。即以這個(gè)句子是否符合某特定文法,以判別它是否屬于某一類別。這就是句法模式識(shí)別的基本思想。 句法模式識(shí)別系統(tǒng)主要由預(yù)處理、基元提取、句法分析和文法推斷等幾部分組成。由預(yù)處理分割的模式,經(jīng)基元提取形成描述模式的基元串(即字符串)。句法分析根據(jù)文法推理所推斷的文法,判決有序字符串所描述的模式類別,得到判決結(jié)果。問題在于句法分析所依據(jù)的文法。不同的模式類對(duì)應(yīng)著不同的文法,描述不同的目標(biāo)。為了得到于模式類相

4、適應(yīng)的文法,類似于統(tǒng)計(jì)模式識(shí)別的訓(xùn)練過程,必須事先采集足夠多的訓(xùn)練模式樣本,經(jīng)基元提取,把相應(yīng)的文法推斷出來。實(shí)際應(yīng)用還有一定的困難。 2.1.2統(tǒng)計(jì)模式識(shí)別統(tǒng)計(jì)模式識(shí)別是目前最成熟也是應(yīng)用最廣泛的方法,它主要利用貝葉斯決策規(guī)則解決最優(yōu)分類器問題。統(tǒng)計(jì)決策理論的基本思想就是在不同的模式類中建立一個(gè)決策邊界,利用決策函數(shù)把一個(gè)給定的模式歸入相應(yīng)的模式類中。統(tǒng)計(jì)模式識(shí)別的基本模型如圖2,該模型主要包括兩種操作模型:訓(xùn)練和分類,其中訓(xùn)練主要利用己有樣本完成對(duì)決策邊界的劃分,并采取了一定的學(xué)習(xí)機(jī)制以保證基于樣本的劃分是最優(yōu)的;而分類主要對(duì)輸入的模式利用其特征和訓(xùn)練得來的決策函數(shù)而把模式劃分到相應(yīng)模式類

5、中。統(tǒng)計(jì)模式識(shí)別方法以數(shù)學(xué)上的決策理論為基礎(chǔ)建立統(tǒng)計(jì)模式識(shí)別模型。其基本模型是:對(duì)被研究圖像進(jìn)行大量統(tǒng)計(jì)分析,找出規(guī)律性的認(rèn)識(shí),并選取出反映圖像本質(zhì)的特征進(jìn)行分類識(shí)別。統(tǒng)計(jì)模式識(shí)別系統(tǒng)可分為兩種運(yùn)行模式:訓(xùn)練和分類。訓(xùn)練模式中,預(yù)處理模塊負(fù)責(zé)將感興趣的特征從背景中分割出來、去除噪聲以與進(jìn)行其它操作;特征選取模塊主要負(fù)責(zé)找到合適的特征來表示輸入模式;分類器負(fù)責(zé)訓(xùn)練分割特征空間。在分類模式中,被訓(xùn)練好的分類器將輸入模式根據(jù)測(cè)量的特征分配到某個(gè)指定的類。統(tǒng)計(jì)模式識(shí)別組成如圖2所示。圖2 統(tǒng)計(jì)模式識(shí)別模型2.1.2.1幾種統(tǒng)計(jì)模式識(shí)別的方法統(tǒng)計(jì)模式識(shí)別根據(jù)采用方法的不同可以進(jìn)行多種形式的分類:通過貝葉

6、斯決策理論對(duì)條件密度已知的樣本進(jìn)行分類;對(duì)于類條件密度不明的情況,可根據(jù)訓(xùn)練樣本的類別是否己知將分類問題分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩大類;監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)又可根據(jù)是否通過參數(shù)決策分為參數(shù)估計(jì)和非參數(shù)估計(jì)。統(tǒng)計(jì)模式識(shí)別的另一種分類方法是根據(jù)決策界是否直接得到將其分為幾何方法和基于概率密度的方法。幾何方法經(jīng)常直接從優(yōu)化一定的代價(jià)函數(shù)構(gòu)造決策界;而基于概率密度的方法要首先估計(jì)密度函數(shù)然后構(gòu)造分類函數(shù)指定決策界。1、幾何分類法 1) 模板匹配法它是模式識(shí)別中的一個(gè)最原始、最基本的方法,它將待識(shí)模式分別與各標(biāo)準(zhǔn)模板進(jìn)行匹配,若某一模板與待識(shí)模式的絕大多數(shù)單元均相匹配,則稱該模板與待識(shí)模式“匹配得好”,

7、反之則稱“匹配得不好”,并取匹配最好的作為識(shí)別結(jié)果。 2)距離分類法 距離是一種重要的相似性度量,通常認(rèn)為空間中兩點(diǎn)距離越近,表示實(shí)際上兩樣本越相似。大約有十余種作為相似性度量的距離函數(shù),其中使用最廣泛的是歐氏距離。它是使用最為廣泛的方法,常用的有平均樣本法、平均距離法、最近鄰法和近鄰法。 3)線性判別函數(shù) 和上述的方法不同,判決函數(shù)法是以判決邊界的函數(shù)形式的假定為其特性的,而上述的方法都是以所考慮的分布的假定為其特性的。假如我們有理由相信一個(gè)線性判決邊界取成:是合適的話,那么剩下的問題就是要確定它的權(quán)系數(shù)。權(quán)系數(shù)可通過感知器算法或最小平方誤差算法來實(shí)現(xiàn)。但作為一條規(guī)則,應(yīng)用此方法必須注意兩點(diǎn)

8、;第一就是方法的可適性問題,第二就是應(yīng)用判決函數(shù)后的誤差準(zhǔn)則。 4)非線性判別函數(shù) 線性判決函數(shù)的特點(diǎn)是簡(jiǎn)單易行,實(shí)際應(yīng)用中許多問題往往是非線性的,一種處理的辦法將非線性函數(shù)轉(zhuǎn)換為線性判決函數(shù),所以又稱為廣義線性判決函數(shù)。另一種方法借助電場(chǎng)的概念,引入非線性的勢(shì)函數(shù),它經(jīng)過訓(xùn)練后即可用來解決模式的分類問題。 2 概率分類法 幾何分類法是以模式類幾何可分為前提條件的,在某些分類問題中這種條件能得到滿足,但這種條件并不經(jīng)常能得到滿足,模式的分布常常不是幾何可分的,即在同一區(qū)域中可能出現(xiàn)不同的模式,這時(shí),必須借助概率統(tǒng)計(jì)這一數(shù)學(xué)工具??梢哉f,概率分類法的基石是貝葉斯決策理論。 設(shè)有R類樣本,分別為w

9、1, w2 , , wR,若每類的先驗(yàn)概率為P(wii), i = 1,2 ,3,R,對(duì)于一隨機(jī)矢量,每類的條件概率為(又稱類概率密度)P(X/Wii),則根據(jù)Bayes公式,后驗(yàn)概率為:從后驗(yàn)概率出發(fā),有Bayes法則: 2.1.2.2樸素貝葉斯分類器樸素貝葉斯分類是一種十分簡(jiǎn)單的分類算法,叫它樸素貝葉斯分類是因?yàn)檫@種方法的思想真的很樸素,樸素貝葉斯的思想基礎(chǔ)是這樣的:對(duì)于給出的待分類項(xiàng),求解在此項(xiàng)出現(xiàn)的條件下各個(gè)類別出現(xiàn)的概率,哪個(gè)最大,就認(rèn)為此待分類項(xiàng)屬于哪個(gè)類別。通俗來說,就好比這么個(gè)道理,你在街上看到一個(gè)黑人,我問你你猜這哥們哪里來的,你十有八九猜非洲。為什么呢?因?yàn)楹谌酥蟹侵奕说谋?/p>

10、率最高,當(dāng)然人家也可能是美洲人或亞洲人,但在沒有其它可用信息下,我們會(huì)選擇條件概率最大的類別,這就是樸素貝葉斯的思想基礎(chǔ)。樸素貝葉斯分類的工作過程如下:(1)每個(gè)數(shù)據(jù)樣本用一個(gè)n維特征向量表示,分別描述對(duì)n個(gè)屬性A1,A2,An樣本的n個(gè)度量。(2)假定有m個(gè)類C1,C2,Cm。給定一個(gè)未知的數(shù)據(jù)樣本X(即沒有類標(biāo)號(hào)),分類法將預(yù)測(cè)X屬于具有最高后驗(yàn)概率(條件X下)的類。即是說,樸素貝葉斯分類將未知的樣本分配給類Ci,當(dāng)且僅當(dāng)這樣,最大化。其最大的類Ci稱為最大后驗(yàn)假定。根據(jù)貝葉斯定理,(3)由于P(X)對(duì)于所有類為常數(shù),只需要最大即可。如果類的先驗(yàn)概率未知,則通常假定這些類是等概率的,即P(

11、C1)=P(C2)=P(Cm)。并據(jù)此只對(duì)最大化。否則,最大化。注意,類的先驗(yàn)概率可以用計(jì)算其中si是類Ci中的訓(xùn)練樣本數(shù),而s是訓(xùn)練樣本總數(shù)。(4)給定具有許多屬性的數(shù)據(jù)集,計(jì)算的開銷可能非常大。為降低計(jì)算的開銷,可以做類條件獨(dú)立的樸素假定。給定樣本的類標(biāo)號(hào),假定屬性值相互條件獨(dú)立,即在屬性間,不存在依賴關(guān)系。這樣, (7.8)概率,可以由訓(xùn)練樣本估值,其中(a)如果Ak是分類屬性,則,其中sik是在屬性Ak上具有值xk的類Ci的樣本數(shù),而si是Ci中的訓(xùn)練樣本數(shù)。(b)如果Ak是連續(xù)值屬性,則通常假定該屬性服從高斯分布,因而, (7.9)其中,給定類Ci的訓(xùn)練樣本屬性Ak的值,是屬性Ak的

12、高斯密度函數(shù),而分別為平均值和標(biāo)準(zhǔn)差。(5)為對(duì)未知樣本X分類,對(duì)每個(gè)類Ci,計(jì)算。樣本X被指派到類Ci,當(dāng)且僅當(dāng)換言之,X被指派到其最大的類Ci。整個(gè)樸素貝葉斯分類分為三個(gè)階段: 第一階段準(zhǔn)備工作階段,這個(gè)階段的任務(wù)是為樸素貝葉斯分類做必要的準(zhǔn)備,主要工作是根據(jù)具體情況確定特征屬性,并對(duì)每個(gè)特征屬性進(jìn)行適當(dāng)劃分,然后由人工對(duì)一部分待分類項(xiàng)進(jìn)行分類,形成訓(xùn)練樣本集合。這一階段的輸入是所有待分類數(shù)據(jù),輸出是特征屬性和訓(xùn)練樣本。這一階段是整個(gè)樸素貝葉斯分類中唯一需要人工完成的階段,其質(zhì)量對(duì)整個(gè)過程將有重要影響,分類器的質(zhì)量很大程度上由特征屬性、特征屬性劃分與訓(xùn)練樣本質(zhì)量決定。 第二階段分類器訓(xùn)練階

13、段,這個(gè)階段的任務(wù)就是生成分類器,主要工作是計(jì)算每個(gè)類別在訓(xùn)練樣本中的出現(xiàn)頻率與每個(gè)特征屬性劃分對(duì)每個(gè)類別的條件概率估計(jì),并將結(jié)果記錄。其輸入是特征屬性和訓(xùn)練樣本,輸出是分類器。這一階段是機(jī)械性階段,根據(jù)前面討論的公式可以由程序自動(dòng)計(jì)算完成。 第三階段應(yīng)用階段。這個(gè)階段的任務(wù)是使用分類器對(duì)待分類項(xiàng)進(jìn)行分類,其輸入是分類器和待分類項(xiàng),輸出是待分類項(xiàng)與類別的映射關(guān)系。這一階段也是機(jī)械性階段,由程序完成。半樸素貝葉斯分類模型(SNBC)為了突破樸素貝葉斯分類器的獨(dú)立性假設(shè)條件的限制,除了上述“提升”等方法之外,還可以通過改變其結(jié)構(gòu)假設(shè)的方式來達(dá)到目的,為此有人提出了半樸素貝葉斯分類(SNBG Sem

14、i-Naive Bayesian classifier)的構(gòu)想。半樸素貝葉斯分類模型對(duì)樸素貝葉斯分類模型的結(jié)構(gòu)進(jìn)行了擴(kuò)展,其目的是為了突破樸素貝葉斯分類模型特征屬性間獨(dú)立性假設(shè)限制,提高分類性能。目前半樸素貝葉斯分類模型學(xué)習(xí)的關(guān)鍵是如何有效組合特片屬性。條件互信息度量半樸素貝葉斯分類學(xué)習(xí)算法可以解決目前一此學(xué)習(xí)算法中存在的效率小高與部分組合意義不大的問題。SNBC的結(jié)構(gòu)比NBC緊湊,在SNBC的模型構(gòu)建過程中,依照一定的標(biāo)準(zhǔn)將關(guān)聯(lián)程度較大的基本屬性(即NBC中的特征屬性)合并在一起構(gòu)成“組合屬性”(也稱之為“大屬性”)。邏輯上,SNBC中的組合屬性與NBC中的基本屬性沒有根本性差別,SNBC的

15、各個(gè)組合屬性之間也是相對(duì)于類別屬性相互獨(dú)立的。圖是SNBC的模型示意圖。這類模型通過將依賴性強(qiáng)的基本屬性結(jié)合在一起構(gòu)建新的模型,這樣可以部分屏蔽NBC中獨(dú)立性假設(shè)對(duì)分類的負(fù)面作用。但從名稱可以看出,SNBC依然屬于樸素貝葉斯分類的疇。這是因?yàn)槌私Y(jié)構(gòu)上的差別之外,計(jì)算推導(dǎo)過程與NBC無異。半樸素貝葉斯分類結(jié)構(gòu)示意圖2.1.2.3圖像金字塔圖像金字塔是以多分辨率來解釋圖像的一種結(jié)構(gòu)。1987年,在一種全新而有效的信號(hào)處理與分析方法,即多分辨率理論中,小波首次作為分析基礎(chǔ)出現(xiàn)了。多分辨率理論將多種學(xué)科的技術(shù)有效地統(tǒng)一在一起,如信號(hào)處理的子帶編碼、數(shù)字語(yǔ)音識(shí)別的積分鏡像過濾以與金字塔圖像處理。正如其

16、名字所表達(dá)的,多分辨率理論與多種分辨率下的信號(hào)(或圖像)表示和分析有關(guān)。其優(yōu)勢(shì)很明顯,某種分辨率下無法發(fā)現(xiàn)的特性在另一種分辨率下將很容易被發(fā)現(xiàn)。圖像金字塔是結(jié)合降采樣操作和平滑操作的一種圖像表示方式。它的一個(gè)很大的好處是,自下而上每一層的像素?cái)?shù)都不斷減少,這會(huì)大大減少計(jì)算量;而缺點(diǎn)是自下而上金字塔的量化變得越來越粗糙,而且速度很快。高斯金字塔里有兩個(gè)概念:組(Octave)和層(Level或Interval),每組里有若干層。高斯金字塔的構(gòu)造是這樣的,第一組的第一層為原圖像,然后將圖像做一次高斯平滑(高斯卷積、高斯模糊),高斯平滑里有一個(gè)參數(shù),然后將乘一個(gè)比例系數(shù)k作為新的平滑因子來平滑第一組

17、第二層得到第三層。重復(fù)若干次,得到L層他們分別對(duì)應(yīng)的平滑參數(shù)為:0,k,k2,。然后將最后一幅圖像做比例因此為2的降采樣得到第二組的第一層,然后對(duì)第二組的第一層做參數(shù)是的高斯平滑,對(duì)第二層做k的平滑得到第三層,以此類推。每組對(duì)應(yīng)的平滑因子是一樣的,這樣反復(fù)形成了O組L層,組建成高斯金字塔。2.1.3模糊模式識(shí)別 模糊模式識(shí)別的理論基礎(chǔ)是20世紀(jì)60年代誕生的模糊數(shù)學(xué),它根據(jù)人對(duì)事物識(shí)別的思維邏輯,結(jié)合人類大腦識(shí)別事物的特點(diǎn),將計(jì)算機(jī)中常用的二值邏輯轉(zhuǎn)向連續(xù)邏輯。在圖像識(shí)別領(lǐng)域應(yīng)用時(shí)該方法可以簡(jiǎn)化圖像識(shí)別系統(tǒng),并具有實(shí)用、可靠等特點(diǎn)。 模式識(shí)別是一門邊緣學(xué)科,它和許多技術(shù)學(xué)科有著密切的聯(lián)系,它本

18、身就是人工智能的重要組成部分,因此,從本質(zhì)上來說,模式識(shí)別所要討論的核心問題,就是如何使機(jī)器能模擬人腦的思維方法,來對(duì)客觀事物進(jìn)行有效的識(shí)別和分類。一方面現(xiàn)有的廣為運(yùn)用的統(tǒng)計(jì)模式識(shí)別方法與人腦進(jìn)行模式識(shí)別相比,其差別還很大,另一方面待識(shí)別的客觀事物又往往具有不同程度的模糊性。 不少學(xué)者試圖運(yùn)用模糊數(shù)學(xué)的方法來解決模式識(shí)別問題,形成一個(gè)專門的研究領(lǐng)域-模糊模式識(shí)別(Fuzzy Pattern Recognition)。比較成熟的理論和方法有最大來屬原則、基于模糊等價(jià)關(guān)系的模式分類、基于模糊相似關(guān)系的模式分類和模糊聚類,其中模糊聚類方法的研究和應(yīng)用尤為成功和廣泛。目前,模糊模式識(shí)別方法已廣泛應(yīng)用圖形識(shí)別、染色體和白血球識(shí)別、圖象目標(biāo)的形狀分析、手寫體文字識(shí)別等,但其中也遇到不少困難,其中一個(gè)典型的例子就是隸屬函數(shù)的確定往往帶有經(jīng)驗(yàn)色彩。 應(yīng)用模糊方法進(jìn)行圖像識(shí)別的關(guān)鍵是確定某一類別的隸屬函數(shù),而各類的統(tǒng)計(jì)指標(biāo)則要由樣本像元的灰度值和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論