




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、外文資料譯文外文資料譯文數(shù)字圖像處理與邊緣檢測(cè)1.數(shù)字圖像處理數(shù)字圖像處理方法的研究源于兩個(gè)主要應(yīng)用領(lǐng)域:其一是為了便于人們分析而對(duì)圖像信息進(jìn)行改進(jìn):其二是為使機(jī)器自動(dòng)理解而對(duì)圖像數(shù)據(jù)進(jìn)行存儲(chǔ)、傳輸及顯示。一幅圖像可定義為一個(gè)二維函數(shù),這里x和y是空間坐標(biāo),而在任何一對(duì)空間坐標(biāo)上的幅值f 稱(chēng)為該點(diǎn)圖像的強(qiáng)度或灰度。當(dāng)和幅值f為有限的、離散的數(shù)值時(shí),稱(chēng)該圖像為數(shù)字圖像。數(shù)字圖像處理是指借用數(shù)字計(jì)算機(jī)處理數(shù)字圖像,值得提及的是數(shù)字圖像是由有限的元素組成的,每一個(gè)元素都有一個(gè)特定的位置和幅值,這些元素稱(chēng)為圖像元素、畫(huà)面元素或像素。像素是廣泛用于表示數(shù)字圖像元素的詞匯。視覺(jué)是人類(lèi)最高級(jí)的感知器官,所以
2、,毫無(wú)疑問(wèn)圖像在人類(lèi)感知中扮演著最重要的角色。然而,人類(lèi)感知只限于電磁波譜的視覺(jué)波段,成像機(jī)器則可覆蓋幾乎全部電磁波譜,從伽馬射線到無(wú)線電波。它們可以對(duì)非人類(lèi)習(xí)慣的那些圖像源進(jìn)行加工,這些圖像源包括超聲波、電子顯微鏡及計(jì)算機(jī)產(chǎn)生的圖像。因此,數(shù)字圖像處理涉及各種各樣的應(yīng)用領(lǐng)域。圖像處理涉及的范疇或其他相關(guān)領(lǐng)域(例如,圖像分析和計(jì)算機(jī)視覺(jué))的界定在初創(chuàng)人之間并沒(méi)有一致的看法。有時(shí)用處理的輸入和輸出內(nèi)容都是圖像這一特點(diǎn)來(lái)界定圖像處理的范圍。我們認(rèn)為這一定義僅是人為界定和限制。例如,在這個(gè)定義下,甚至最普通的計(jì)算一幅圖像灰度平均值的工作都不能算做是圖像處理。另一方面,有些領(lǐng)域(如計(jì)算機(jī)視覺(jué))研究的最
3、高目標(biāo)是用計(jì)算機(jī)去模擬人類(lèi)視覺(jué),包括理解和推理并根據(jù)視覺(jué)輸入采取行動(dòng)等。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類(lèi)智能。人工智能領(lǐng)域處在其發(fā)展過(guò)程中的初期階段,它的發(fā)展比預(yù)期的要慢的多,圖像分析(也稱(chēng)為圖像理解)領(lǐng)域則處在圖像處理和計(jì)算機(jī)視覺(jué)兩個(gè)學(xué)科之間。從圖像處理到計(jì)算機(jī)視覺(jué)這個(gè)連續(xù)的統(tǒng)一體內(nèi)并沒(méi)有明確的界線。然而,在這個(gè)連續(xù)的統(tǒng)一體中可以考慮三種典型的計(jì)算處理(即低級(jí)、中級(jí)和高級(jí)處理)來(lái)區(qū)分其中的各個(gè)學(xué)科。低級(jí)處理涉及初級(jí)操作,如降低噪聲的圖像預(yù)處理,對(duì)比度增強(qiáng)和圖像尖銳化。低級(jí)處理是以輸入、輸出都是圖像為特點(diǎn)的處理。中級(jí)處理涉及分割(把圖像分為不同區(qū)域或目標(biāo)物)以及縮減對(duì)目標(biāo)物的描述
4、,以使其更適合計(jì)算機(jī)處理及對(duì)不同目標(biāo)的分類(lèi)(識(shí)別)。中級(jí)圖像處理是以輸入為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標(biāo)識(shí)等)為特點(diǎn)的。最后,高級(jí)處理涉及在圖像分析中被識(shí)別物體的總體理解,以及執(zhí)行與視覺(jué)相關(guān)的識(shí)別函數(shù)(處在連續(xù)統(tǒng)一體邊緣)等。根據(jù)上述討論,我們看到,圖像處理和圖像分析兩個(gè)領(lǐng)域合乎邏輯的重疊區(qū)域是圖像中特定區(qū)域或物體的識(shí)別這一領(lǐng)域。這樣,在研究中,我們界定數(shù)字圖像處理包括輸入和輸出均是圖像的處理,同時(shí)也包括從圖像中提取特征及識(shí)別特定物體的處理。舉一個(gè)簡(jiǎn)單的文本自動(dòng)分析方面的例子來(lái)具體說(shuō)明這一概念。在自動(dòng)分析文本時(shí)首先獲取一幅包含文本的圖像,對(duì)該圖像進(jìn)行預(yù)處理,提
5、?。ǚ指睿┳址缓笠赃m合計(jì)算機(jī)處理的形式描述這些字符,最后識(shí)別這些字符,而所有這些操作都在本文界定的數(shù)字圖像處理的范圍內(nèi)。理解一頁(yè)的內(nèi)容可能要根據(jù)理解的復(fù)雜度從圖像分析或計(jì)算機(jī)視覺(jué)領(lǐng)域考慮問(wèn)題。這樣,我們定義的數(shù)字圖像處理的概念將在有特殊社會(huì)和經(jīng)濟(jì)價(jià)值的領(lǐng)域內(nèi)通用。數(shù)字圖像處理的應(yīng)用領(lǐng)域多種多樣,所以文本在內(nèi)容組織上盡量達(dá)到該技術(shù)應(yīng)用領(lǐng)域的廣度。闡述數(shù)字圖像處理應(yīng)用范圍最簡(jiǎn)單的一種方法是根據(jù)信息源來(lái)分類(lèi)(如可見(jiàn)光、X射線,等等)。在今天的應(yīng)用中,最主要的圖像源是電磁能譜,其他主要的能源包括聲波、超聲波和電子(以用于電子顯微鏡方法的電子束形式)。建模和可視化應(yīng)用中的合成圖像由計(jì)算機(jī)產(chǎn)生。建立在
6、電磁波譜輻射基礎(chǔ)上的圖像是最熟悉的,特別是X射線和可見(jiàn)光譜圖像。電磁波可定義為以各種波長(zhǎng)傳播的正弦波,或者認(rèn)為是一種粒子流,每個(gè)粒子包含一定(一束)能量,每束能量成為一個(gè)光子。如果光譜波段根據(jù)光譜能量進(jìn)行分組,我們會(huì)得到下圖1所示的伽馬射線(最高能量)到無(wú)線電波(最低能量)的光譜。如圖所示的加底紋的條帶表達(dá)了這樣一個(gè)事實(shí),即電磁波譜的各波段間并沒(méi)有明確的界線,而是由一個(gè)波段平滑地過(guò)渡到另一個(gè)波段。圖像獲取是第一步處理。注意到獲取與給出一幅數(shù)字形式的圖像一樣簡(jiǎn)單。通常,圖像獲取包括如設(shè)置比例尺等預(yù)處理。圖像增強(qiáng)是數(shù)字圖像處理最簡(jiǎn)單和最有吸引力的領(lǐng)域?;旧?,增強(qiáng)技術(shù)后面的思路是顯現(xiàn)那些被模糊了的
7、細(xì)節(jié),或簡(jiǎn)單地突出一幅圖像中感興趣的特征。一個(gè)圖像增強(qiáng)的例子是增強(qiáng)圖像的對(duì)比度,使其看起來(lái)好一些。應(yīng)記住,增強(qiáng)是圖像處理中非常主觀的領(lǐng)域,這一點(diǎn)很重要。圖像復(fù)原也是改進(jìn)圖像外貌的一個(gè)處理領(lǐng)域。然而,不像增強(qiáng),圖像增強(qiáng)是主觀的,而圖像復(fù)原是客觀的。在某種意義上說(shuō),復(fù)原技術(shù)傾向于以圖像退化的數(shù)學(xué)或概率模型為基礎(chǔ)。另一方面,增強(qiáng)以怎樣構(gòu)成好的增強(qiáng)效果這種人的主觀偏愛(ài)為基礎(chǔ)。彩色圖像處理已經(jīng)成為一個(gè)重要領(lǐng)域,因?yàn)榛诨ヂ?lián)網(wǎng)的圖像處理應(yīng)用在不斷增長(zhǎng)。就使得在彩色模型、數(shù)字域的彩色處理方面涵蓋了大量基本概念。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎(chǔ)。小波是在各種分辨率下描述圖像的基礎(chǔ)。特別是在應(yīng)用
8、中,這些理論被用于圖像數(shù)據(jù)壓縮及金字塔描述方法。在這里,圖像被成功地細(xì)分為較小的區(qū)域。壓縮,正如其名稱(chēng)所指的意思,所涉及的技術(shù)是減少圖像的存儲(chǔ)量,或者在傳輸圖像時(shí)降低頻帶。雖然存儲(chǔ)技術(shù)在過(guò)去的十年內(nèi)有了很大改進(jìn),但對(duì)傳輸能力我們還不能這樣說(shuō),尤其在互聯(lián)網(wǎng)上更是如此,互聯(lián)網(wǎng)是以大量的圖片內(nèi)容為特征的。圖像壓縮技術(shù)對(duì)應(yīng)的圖像文件擴(kuò)展名對(duì)大多數(shù)計(jì)算機(jī)用戶是很熟悉的(也許沒(méi)注意),如JPG文件擴(kuò)展名用于JPEG(聯(lián)合圖片專(zhuān)家組)圖像壓縮標(biāo)準(zhǔn)。形態(tài)學(xué)處理設(shè)計(jì)提取圖像元素的工具,它在表現(xiàn)和描述形狀方面非常有用。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉(zhuǎn)換開(kāi)始。分割過(guò)程將一幅圖像劃分為組成部分或目標(biāo)
9、物。通常,自主分割是數(shù)字圖像處理中最為困難的任務(wù)之一。復(fù)雜的分割過(guò)程導(dǎo)致成功解決要求物體被分別識(shí)別出來(lái)的成像問(wèn)題需要大量處理工作。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會(huì)導(dǎo)致最終失敗。通常,分割越準(zhǔn)確,識(shí)別越成功。表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數(shù)據(jù),其構(gòu)成不是區(qū)域的邊緣(區(qū)分一個(gè)圖像區(qū)域和另一個(gè)區(qū)域的像素集)就是其區(qū)域本身的所有點(diǎn)。無(wú)論哪種情況,把數(shù)據(jù)轉(zhuǎn)換成適合計(jì)算機(jī)處理的形式都是必要的。首先,必須確定數(shù)據(jù)是應(yīng)該被表現(xiàn)為邊界還是整個(gè)區(qū)域。當(dāng)注意的焦點(diǎn)是外部形狀特性(如拐角和曲線)時(shí),則邊界表示是合適的。當(dāng)注意的焦點(diǎn)是內(nèi)部特性(如紋理或骨骼形狀)時(shí),則區(qū)域表
10、示是合適的。則某些應(yīng)用中,這些表示方法是互補(bǔ)的。選擇一種表現(xiàn)方式僅是解決把原始數(shù)據(jù)轉(zhuǎn)換為適合計(jì)算機(jī)后續(xù)處理的形式的一部分。為了描述數(shù)據(jù)以使感興趣的特征更明顯,還必須確定一種方法。描述也叫特征選擇,涉及提取特征,該特征是某些感興趣的定量信息或是區(qū)分一組目標(biāo)與其他目標(biāo)的基礎(chǔ)。識(shí)別是基于目標(biāo)的描述給目標(biāo)賦以符號(hào)的過(guò)程。如上文詳細(xì)討論的那樣,我們用識(shí)別個(gè)別目標(biāo)方法的開(kāi)發(fā)推出數(shù)字圖像處理的覆蓋范圍。到目前為止,還沒(méi)有談到上面圖2中關(guān)于先驗(yàn)知識(shí)及知識(shí)庫(kù)與處理模塊之間的交互這部分內(nèi)容。關(guān)于問(wèn)題域的知識(shí)以知識(shí)庫(kù)的形式被編碼裝入一個(gè)圖像處理系統(tǒng)。這一知識(shí)可能如圖像細(xì)節(jié)區(qū)域那樣簡(jiǎn)單,在這里,感興趣的信息被定位,這
11、樣,限制性的搜索就被引導(dǎo)到尋找的信息處。知識(shí)庫(kù)也可能相當(dāng)復(fù)雜,如材料檢測(cè)問(wèn)題中所有主要缺陷的相關(guān)列表或者圖像數(shù)據(jù)庫(kù)(該庫(kù)包含變化檢測(cè)應(yīng)用相關(guān)區(qū)域的高分辨率衛(wèi)星圖像)。除了引導(dǎo)每一個(gè)處理模塊的操作,知識(shí)庫(kù)還要控制模塊間的交互。這一特性上面圖2中的處理模塊和知識(shí)庫(kù)間用雙箭頭表示。相反單頭箭頭連接處理模塊。2.邊緣檢測(cè)邊緣檢測(cè)是圖像處理和計(jì)算機(jī)視覺(jué)中的術(shù)語(yǔ),尤其在特征檢測(cè)和特征抽取領(lǐng)域,是一種用來(lái)識(shí)別數(shù)字圖像亮度驟變點(diǎn)即不連續(xù)點(diǎn)的算法。盡管在任何關(guān)于分割的討論中,點(diǎn)和線檢測(cè)都是很重要的,但是邊緣檢測(cè)對(duì)于灰度級(jí)間斷的檢測(cè)是最為普遍的檢測(cè)方法。雖然某些文獻(xiàn)提過(guò)理想的邊緣檢測(cè)步驟,但自然界圖像的邊緣并不總
12、是理想的階梯邊緣。相反,它們通常受到一個(gè)或多個(gè)下面所列因素的影響:1.有限場(chǎng)景深度帶來(lái)的聚焦模糊;2.非零半徑光源產(chǎn)生的陰影帶來(lái)的半影模糊;3.光滑物體邊緣的陰影;4.物體邊緣附近的局部鏡面反射或者漫反射。一個(gè)典型的邊界可能是(例如)一塊紅色和一塊黃色之間的邊界;與之相反的是邊線,可能是在另外一種不變的背景上的少數(shù)不同顏色的點(diǎn)。在邊線的每一邊都有一個(gè)邊緣。在對(duì)數(shù)字圖像的處理中,邊緣檢測(cè)是一項(xiàng)非常重要的工作。如果將邊緣認(rèn)為是一定數(shù)量點(diǎn)亮度發(fā)生變化的地方,那么邊緣檢測(cè)大體上就是計(jì)算這個(gè)亮度變化的導(dǎo)數(shù)。為簡(jiǎn)化起見(jiàn),我們可以先在一維空間分析邊緣檢測(cè)。在這個(gè)例子中,我們的數(shù)據(jù)是一行不同點(diǎn)亮度的數(shù)據(jù)。例如
13、,在下面的1維數(shù)據(jù)中我們可以直觀地說(shuō)在第4與第5個(gè)點(diǎn)之間有一個(gè)邊界:5764152148149如果光強(qiáng)度差別比第四個(gè)和第五個(gè)點(diǎn)之間小,或者說(shuō)相鄰的像素點(diǎn)之間光強(qiáng)度差更高,就不能簡(jiǎn)單地說(shuō)相應(yīng)區(qū)域存在邊緣。而且,甚至可以認(rèn)為這個(gè)例子中存在多個(gè)邊緣。除非場(chǎng)景中的物體非常簡(jiǎn)單并且照明條件得到了很好的控制,否則確定一個(gè)用來(lái)判斷兩個(gè)相鄰點(diǎn)之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。實(shí)際上,這也是為什么邊緣檢測(cè)不是一個(gè)簡(jiǎn)單問(wèn)題的原因之一。有許多用于邊緣檢測(cè)的方法,它們大致可分為兩類(lèi):基于搜索和基于零交叉.基于搜索的邊緣檢測(cè)方法首先計(jì)算邊緣強(qiáng)度,通常用一階導(dǎo)數(shù)表示,例如梯度模;然后,用計(jì)算估計(jì)
14、邊緣的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值。基于零交叉的方法找到由圖像得到的二階導(dǎo)數(shù)的零交叉點(diǎn)來(lái)定位邊緣。通常用拉普拉斯算子或非線性微分方程的零交叉點(diǎn),我們將在后面的小節(jié)中描述.濾波做為邊緣檢測(cè)的預(yù)處理通常是必要的,通常采用高斯濾波。已發(fā)表的邊緣檢測(cè)方法應(yīng)用計(jì)算邊界強(qiáng)度的度量, 這與平滑濾波有本質(zhì)的不同. 正如許多邊緣檢測(cè)方法依賴(lài)于圖像梯度的計(jì)算, 他們用不同種類(lèi)的濾波器來(lái)估計(jì)x-方向和y-方向的梯度.一旦我們計(jì)算出導(dǎo)數(shù)之后,下一步要做的就是給出一個(gè)閾值來(lái)確定哪里是邊緣位置。閾值越低,能夠檢測(cè)出的邊線越多,結(jié)果也就越容易受到圖片噪聲的影響,并且越容易從圖像中挑出不相
15、關(guān)的特性。與此相反,一個(gè)高的閾值將會(huì)遺失細(xì)的或者短的線段。如果邊緣閾值應(yīng)用于正確的的梯度幅度圖像,生成的邊緣一般會(huì)較厚,某些形式的邊緣變薄處理是必要的。然而非最大抑制的邊緣檢測(cè),邊緣曲線的定義十分模糊,邊緣像素可能成為邊緣多邊形通過(guò)一個(gè)邊緣連接(邊緣跟蹤)的過(guò)程。在一個(gè)離散矩陣中,非最大抑制階梯能夠通過(guò)一種方法來(lái)實(shí)現(xiàn),首先預(yù)測(cè)一階導(dǎo)數(shù)方向、然后把它近似到45度的倍數(shù)、最后在預(yù)測(cè)的梯度方向比較梯度幅度。一個(gè)常用的這種方法是帶有滯后作用的閾值選擇。這個(gè)方法使用不同的閾值去尋找邊緣。首先使用一個(gè)閾值上限去尋找邊線開(kāi)始的地方。一旦找到了一個(gè)開(kāi)始點(diǎn),我們?cè)趫D像上逐點(diǎn)跟蹤邊緣路徑,當(dāng)大于門(mén)檻下限時(shí)一直紀(jì)錄
16、邊緣位置,直到數(shù)值小于下限之后才停止紀(jì)錄。這種方法假設(shè)邊緣是連續(xù)的界線,并且我們能夠跟蹤前面所看到的邊緣的模糊部分,而不會(huì)將圖像中的噪聲點(diǎn)標(biāo)記為邊緣。但是,我們?nèi)匀淮嬖谶x擇適當(dāng)?shù)拈撝祬?shù)的問(wèn)題,而且不同圖像的閾值差別也很大。其它一些邊緣檢測(cè)操作是基于亮度的二階導(dǎo)數(shù)。這實(shí)質(zhì)上是亮度梯度的變化率。在理想的連續(xù)變化情況下,在二階導(dǎo)數(shù)中檢測(cè)過(guò)零點(diǎn)將得到梯度中的局部最大值。另一方面,二階導(dǎo)數(shù)中的峰值檢測(cè)是邊線檢測(cè),只要圖像操作使用一個(gè)合適的尺度表示。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個(gè)亮度梯度,而在另一邊看到相反的梯度。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。為了找到這些邊線,我們可以在圖像亮度梯度的二階導(dǎo)數(shù)中尋找過(guò)零點(diǎn)??傊?,為了對(duì)有意義的邊緣點(diǎn)進(jìn)行分類(lèi),與這個(gè)點(diǎn)相聯(lián)系的灰度級(jí)變換必須比在這一點(diǎn)的背景上變換更為有效。由于我們用局部計(jì)算進(jìn)行處理,決定一個(gè)值是否有效
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山茶油訂購(gòu)合同協(xié)議書(shū)
- 道路共建協(xié)議書(shū)
- 邵昕離婚協(xié)議書(shū)
- 美伊退出協(xié)議書(shū)
- 酒店受傷協(xié)議書(shū)
- 酒店分成協(xié)議書(shū)
- 維護(hù)婚姻協(xié)議書(shū)
- 注冊(cè)類(lèi)人員引薦協(xié)議書(shū)
- 良田流轉(zhuǎn)協(xié)議書(shū)
- 礦石交易協(xié)議書(shū)
- 2025至2030年中國(guó)智能學(xué)習(xí)機(jī)行業(yè)投資前景及策略咨詢(xún)研究報(bào)告
- (高清版)DG∕TJ 08-7-2021 建筑工程交通設(shè)計(jì)及停車(chē)庫(kù)(場(chǎng))設(shè)置標(biāo)準(zhǔn)
- 無(wú)房無(wú)車(chē)離婚協(xié)議書(shū)
- 南師附中高三數(shù)學(xué)備忘錄及答案詳解
- 2025-2030年中國(guó)甲巰咪唑片行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 2025年安徽國(guó)控資產(chǎn)管理有限公司第二季度社會(huì)招聘5人筆試參考題庫(kù)附帶答案詳解
- 2025年安全知識(shí)競(jìng)賽題庫(kù)及答案(共200題)
- 2025中考語(yǔ)文7-9年級(jí)總復(fù)習(xí)古詩(shī)詞默寫(xiě)
- 國(guó)家職業(yè)標(biāo)準(zhǔn) 4-11-01-01 供電服務(wù)員 (2025年版)
- 當(dāng)前我國(guó)社會(huì)民生熱點(diǎn)問(wèn)題解析課件
- 城管協(xié)管筆試題及答案
評(píng)論
0/150
提交評(píng)論