

下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第 XX 卷 第 X 期201X 年 X 月自 動 化 學 報ACTA AUTOMATICA SINICAVol. XX, No. XMonth, 201X數(shù)字圖像處理在生產(chǎn)生活中的應用080121111摘 要 隨著科技水平的進步,圖像處理技術(shù)得到了長足發(fā)展, 其在人類生產(chǎn)生活中發(fā)揮著愈加重要的作用.本文簡單介紹數(shù)字圖像處理在不同領(lǐng)域中的應用實例,旨在使讀者能夠了解生產(chǎn)生活中一些實用過程的基本工作原理,并對數(shù)字圖像處理技術(shù)有更加直觀深刻的認識.圖像處理, 去除噪聲, 二值化, 圖像去霧, 物理模型格式. 數(shù)字圖像處理在生產(chǎn)生活中的應用. 自動化學報, 201X,): XX10.3724/SP.
2、J.1004.201The Applications of Image Prosing Technologyanufacture and Life08012111 WANG Zhao-Jia1Abstract With the development of science and technology, image prosing technology has been progressed raly.Thus it plays a more important rolehe manufacture and life of humans. This prroduseveral digital
3、imagepro prosing applications in dierent areas, aiming to enable readers to understand the basic operating principle of practicals and have a moreuitive and profound comprehenof the digital image prosing technology.Key words image prosing; noise removement; binarization; image defogging; physical mC
4、iion WANG Zhao-Jia. The Applications of Image Prosing Technologyanufacture and Life. Acta Automat-ica Sinica, 201X,): XX圖像處理(image prosing),指用計算機對圖像進行分析,以達到所需結(jié)果的技術(shù)。又稱影像處理。圖像處理的基本內(nèi)容一般指數(shù)字圖像處理。像編碼、圖像增強、圖像復原、圖像分割和圖像分析等。圖像處理一般指數(shù)字圖像處理。數(shù)字圖像是指用數(shù)字機、掃描儀等設備經(jīng)過采樣和數(shù)字化得到的一個大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)
5、容包括圖像壓縮,增強和復原,匹配、描述和識別3個部分。常見的處理有圖像數(shù)字化、圖收稿日期-XX錄用日期-XXManuscript received Month Date, Year; accepted Month Date, Year國家重點基礎研究發(fā)展計劃 (973 計劃) (), 國家高技術(shù)研究發(fā)展計劃 (863 計劃) (資助), 國家自然科學基金 ()圖 1 數(shù)字圖像處理系統(tǒng)Supported by National Basic Research Program of China (973圖1是一個用于數(shù)字圖像處理的計算機(屬于Program) (), National High Te
6、chnology Research andDevelopment Program of China (863 Program) ( tional Natural Science Foundation of China ( 本文責任編委mended by Assote Editor BIAN Wei), Na-加州大學分校)?;脽羝?、或圖表形式的)圖像首先要進行數(shù)字化,然后以二進制數(shù)字矩陣的形式在計算機的器中。此后,就可以對這1. 中國自動化高技術(shù)創(chuàng)新中心模式識別國家中中100190100190100190一數(shù)字化后的圖像進行處理和(或)在一個高分辨國國4. 中國自動化自動化國際自動化與計算雜志
7、編輯部率的顯示器上顯示。為了便于顯示,圖像在一自動化自動化學報編輯部100190個可快速存取的緩沖區(qū)中,使用戶可以用每秒30幀的頻率刷新顯示器,從而獲得視覺上連續(xù)顯示的效果。計算機通過網(wǎng)絡(例如以太網(wǎng))進行信息交換和1. Hi-Tech Innovation Center, Institute of Automation, Chi- Academy of Scien, Beijing 1001902. National Labo-ratory of Pattern Recognition, Institute of Automation, ChiAcademy of Scien, Beijin
8、g 1001903. Editorial Oce of In- ternational Journal of Automation and Computing, Institute of控制所有的數(shù)字化、處理和顯示操作。程序通Automation, ChiAcademy of Scien, Beijing 1001904.過終端輸入計算機,而輸出可在終端、顯示器或者/繪圖儀上獲得。Editorial Oce of Acta Automatica Sinica, Institute of Automa-tion, ChiAcademy of Scien, Beijing 100190自動化學報X
9、X 卷2圖2為典型的數(shù)字圖像處理順序。由于具有高密度、大容量、糾錯能力強、可表示文字圖像等信息、可加密等優(yōu)點,己廣泛應用于傳統(tǒng)的工業(yè)自動化生產(chǎn)線、醫(yī)療服務、系統(tǒng)、商品管理系統(tǒng)及信息查詢系統(tǒng)等各個領(lǐng)域。而且隨著的發(fā)展和網(wǎng)絡的普及,二維條碼將有更大的商機和更廣闊的發(fā)展前景。圖 2 典型的數(shù)字圖像處理順序2三維人臉識別在現(xiàn)代社會中,個人的識別1認證技術(shù)的應用無所,又稱二維條碼(2-dimenalbar不在,人臉識別因具有自然、友好、對用戶干擾少、code),是用某種特定的幾何圖形按一定規(guī)律在平面(二維方向上)分布的黑白相間的圖形數(shù)據(jù)易被用戶接受等優(yōu)勢而比、虹膜等生物特征有更廣闊的應用前景?;趫D像的
10、二維人臉識別技術(shù)日趨成熟,在一定約束條件下已取得較好的識別結(jié)果。然而,研究實驗表明,光照、姿態(tài)、化妝、表符號信息的;在代碼編制上巧妙地利用計算機邏輯基礎的”0”、”1”比特流的概念,使用若干個與二進制相對應的幾何形體來表示文字數(shù)值信息,通過圖像輸入設備或光電掃描設備自動識讀以實現(xiàn)信息自動處理:它具有條碼技術(shù)的一些共性:每種碼制有其特定的字符集;每個字符占有一定的寬度;情、等變化顯著地降低了二維人臉識別算法的性能。于是近年來,學術(shù)界開始探索如何利用人臉的三維信息提高系統(tǒng)的識別性能。由于作者所在院系正好有同學在進行相關(guān)項目的研究,因此自己也對這方面有些微了解。具有一定的校驗功能等。同時還具有對不的
11、信息自動識別功能、及處理圖形旋轉(zhuǎn)變化等特點。二維條碼能夠在橫向和縱向兩個方位同時表達信息,因此能在很小的面積內(nèi)表達大量的信息。識別的基本流程如下:一般而言,三維人臉識別是指將獲得的待識別對象的臉部三維形狀數(shù)據(jù)作為識別依據(jù),與庫中已知的臉部三維形狀數(shù)據(jù)進行匹配,然后得出待識別對象的過程。三維人臉識別是相對基于圖像(及)的人臉識別而言的,而后者所使用的數(shù)據(jù)是二維的圖像,其本質(zhì)是三維物體在二維平面上的投影,是三維信息在二中的簡約。自動的三維人臉識別系統(tǒng)的基本步驟如下:Step1 .通過三維人臉對象;設備獲得待識別圖 3識別流程Step2 .對獲得的三維數(shù)據(jù)進行自動去噪聲、切割等預處理;Step3 .
12、從三維數(shù)據(jù)中提取特征;Step4 .用分類器對提取的特征做分類判別,輸出最后的決策。查閱資料可以得知,目前,三維人臉識別的研究主要集中在算法性能方面,速度不是目前主要的研究方向。三維人臉的關(guān)鍵信息是模型的形狀信息,而曲面形狀匹配技術(shù)直觀地體現(xiàn)了曲面的相似性,因此ICP是三維人臉識別研究的重要工具,大部分有效的算法或多或少都使用了迭代對技術(shù),因而ICP可以作為本領(lǐng)域的基線算法。從二維向三維的轉(zhuǎn)變原因在于尋求更豐富的人臉信息,而特征提取可以看作是對信息的有效壓縮,兩者是相背的方向。問題的難點在于如何從三維模型中提取比二維圖像更有效的特征,現(xiàn)有的一些特征尚未證明比二維圖像簡單且更有效。克服表情影響是
13、三維人臉識1)對的彩像進行灰度化,以提高后繼的運行速度,常用的灰度化方法有以下兩種:第一種:I. Gray (i, j) =0.299 R (i, j) + 0.587 G (i, j)+ 0.114 B (i, j)第二種:II. Gray (i, j) = 30 R (i, j) + 59 G (i, j)+ 11 B (i, j)/1002)去除噪聲。采用濾波技術(shù)(如形中值濾波)去除噪音對二碼圖像的主要干擾鹽粒噪聲;對確定進行二值化處理;的位置探測圖形,對條碼進行定位,旋轉(zhuǎn)至水平后,獲得條碼數(shù)據(jù),以便下一步進行。別的重要,也是主要的研究點。目前表情處理取得了一些進展,其中使用變形技術(shù)對表
14、情建模是X 期: 數(shù)字圖像處理在生產(chǎn)生活中的應用3趨勢。然而,三維人臉識別仍然場景信息。受篇幅所限,文章不能將每種去霧方法的原理加以解釋,因此只將去霧處理的效果圖羅列如下,以給讀者一個直觀認識。如下的主要難點:1)在數(shù)據(jù)獲取方面,盡管三維數(shù)據(jù)獲取設備發(fā)展很快,但仍比二維圖像獲取.首先,大多數(shù)三維數(shù)據(jù)獲取設備只能掃描幾米之內(nèi)的物體;其次,相對數(shù)字圖像而言,三維設備掃描時間較長,要求掃描對象在秒級時間內(nèi)保持對用戶干擾大。狀態(tài),獲取過程基于三維數(shù)據(jù)的人臉識別算法在計算復雜度上要高于二維圖像,特別是對采樣分辨率很高的三維人臉數(shù)據(jù)(小于1mm),一次匹配所需的時間遠遠大于二維圖像。過高的計算開銷不但使基
15、于三維的人臉識別算法難以應用于大規(guī)模的數(shù)據(jù)庫,而且在算法的研究過程中難以對算法中的參數(shù)進行充分地測試,因此,提取有效的簡約特征顯得非常重要。三維數(shù)據(jù)雖然有顯式的形狀信息,但其受形變的影響也更加突出,如何解決表情變化引起的臉部曲面形變,仍是目前三維人臉識別重點研究的難題。圖 4 Schechner等人的算法圖 5 Fattal的算法3圖像去霧計算機視覺系統(tǒng)已經(jīng)廣泛應用于戶外場景,如城市交通、航拍、遙感成像等,并發(fā)揮著非常重要的作用。然而,現(xiàn)有的計算機視覺系統(tǒng)對環(huán)境非常敏感,在等天氣條件下,大氣中懸浮的大量微小水滴、氣溶膠的散射作用,使水平能見圖 6 Tan度顯著降低,從而導致成像傳感器的圖像嚴重
16、降質(zhì),這極大地影響和限制了戶外系統(tǒng)的功能。圖像去霧技術(shù)(等類似大氣粒子的散射現(xiàn)象均可用散射理論描述,為了描述的方便,簡稱為去霧)的主要任務是去除天氣的影響,從而增強圖像的視見度。對圖像質(zhì)量圖像去霧方法主要分為基于物理模型的方法和非物理模型的方法兩種?;谖锢砟P偷姆椒▽嵸|(zhì)上是利用大氣散射模型或其變形形式,求解場景反照率。由于該模型包圖 7 He等人的算法含3個未知參數(shù),從本質(zhì)上講,這是一個反問題,不同的方法采用不同的方式近似計算模型中的參數(shù)。依據(jù)所需要的成像系統(tǒng)或成像場景的附加信息,可將基于物理模型的方法分為4類。前兩類方法利用同一場景的多幅圖像,即不同天氣條件下獲取的多幅圖像,或者不同偏振程
17、度的多幅圖像。后兩類方法試圖從單幅圖像出發(fā)估計景深或景深相關(guān)項。受單幅圖像信息量的限制,第3類方法利用場景的先驗信息或用戶交互估計景深。然而,在實際應用中,通圖 8 Kratz等人的算法常都前3種方法所要求的特殊條件。為此,最近的研究工作熱衷于探索第4類方法,這類方法通過對圖像數(shù)據(jù)本身做各種假設,從單幅圖像中恢復自動化學報XX 卷4合要求算法具備自動、魯棒和實時性。目前,國內(nèi)外的相關(guān)研究遠沒有達到成熟階段,因此,該研究領(lǐng)域仍具有很大的發(fā)展空間。圖 9 Yu等人的算法非物理模型的方法旨在增強圖像的對比度和校正圖像的顏色。依據(jù)所要達到的目的,可將非物理模型的方法分為3類。前兩類是基于顏色恒常性的方
18、法,其中,前者為彩色增強方法,同時實現(xiàn)了對比度增強和顏色校正,而后者為白平衡方法,僅實現(xiàn)了顏色校正。第3類方法為對比度增強方法,這類方法的目的是增強圖像全局。局部對比度,而不考慮色4總結(jié)本文介紹了數(shù)字圖像處理在實際生產(chǎn)生活中的三例應用:識別、三維人臉識別和圖像去霧處理??梢园l(fā)現(xiàn),其應用已經(jīng)滲透到現(xiàn)代社會的方方面面。雖然受作者知識水平及篇幅的限制,此三種圖像處理的方法沒有作深入詳細地介紹,但是希望讀者可以通過本文對數(shù)字圖像處理有所了解,也度或顏色恒常性。希望的者能與作者進行相互和學習。致謝東南大學自動化學院數(shù)字圖像處理課程的開設及夏思宇老師的詳細講解。圖 10 HE算法Referen. 智能圖像處理技術(shù)M.,社, 2004.,: 電子工業(yè)12 孫家廣. 計算機圖形學M.:, 2002.3,,吳朝暉. 三維人臉識別研究綜述J.計算機輔助設計與圖形學學報,20
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高考歷史考前必背超級結(jié)論-14個階段特征
- 2024年中級統(tǒng)計師《統(tǒng)計工作實務》真題及答案解析
- 婦科護理常用藥
- 2025年校園安全新標準:危險品存放領(lǐng)用登記操作流程全覽
- 2025年湖南省長沙市初中一年級上學期期中語言能力考試試卷
- 2025年室內(nèi)設計師職業(yè)資格考試真題卷-室內(nèi)設計空間布局與設計效果評估試題
- 教材原理2025年計算機二級MySQL試題及答案
- 2025年護士執(zhí)業(yè)資格考試內(nèi)科護理學專項護理倫理模擬考試試卷
- 護理業(yè)務查房記錄
- 貴州省六盤水市鐘山區(qū)2024-2025學年九年級上學期期末質(zhì)量監(jiān)測英語試題(原卷版+解析版)
- 鉗工——國家職業(yè)技能標準(2020年版)
- 人教版高中數(shù)學必修一教科書課后答案(全)
- 板塊輪動及龍頭股戰(zhàn)法
- 高中物理實驗考點整合電學PPT課件
- 《愛蓮說》學案
- 中考物理必背99條知識點
- PA66增強增韌研究
- 全國大學生數(shù)學建模競賽優(yōu)秀論文選之易拉罐形狀和尺寸的最優(yōu)設計
- API-682密封系統(tǒng)-中英文對照版
- 單值移動極差圖(空白表格)
- 新生兒沐浴及撫觸ppt課件
評論
0/150
提交評論