




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 圖像處理與識別技術(shù)的發(fā)展應(yīng)用 郭元戎伴隨著互聯(lián)網(wǎng)科技的突飛猛進(jìn),圖像處理和識別領(lǐng)域的技術(shù)突破正在深刻地改變?nèi)祟惖纳?。圖像處理和識別技術(shù)當(dāng)前的研究重點包括人工智能視覺化、三維圖像重建和虛擬現(xiàn)實,主要應(yīng)用領(lǐng)域包括智能交通、家政服務(wù)、醫(yī)療保健乃至國防工業(yè)等,未來的發(fā)展趨勢則主要集中在網(wǎng)絡(luò)化、智能化和功能的高度集成。【關(guān)鍵詞】圖像處理 圖像識別 計算機(jī)視覺 智能汽車 人工智能1 前言圖像處理(image processing)技術(shù)在近些年伴隨著移動互聯(lián)網(wǎng)的快速興起實現(xiàn)了飛躍的發(fā)展,在工業(yè)生產(chǎn)、建筑交通、醫(yī)療保健、娛樂傳媒乃至尖端國防工業(yè)中都有著越
2、來越深入的滲透和越來越廣泛的應(yīng)用。圖像處理最早可以追溯到1920年人們利用鋪設(shè)在北大西洋海底的電纜從英國倫敦到美國紐約傳輸了一張經(jīng)過簡單的數(shù)字壓縮技術(shù)處理過后的照片,這一創(chuàng)舉可謂是圖像處理技術(shù)的起源。在上世紀(jì)50年代隨著電子計算機(jī)的發(fā)展,計算機(jī)呈現(xiàn)出的呈指數(shù)級上升的數(shù)據(jù)分析處理能力讓人們看到了新的突破方向,數(shù)字圖像處理(digital image processing, dip)的研究也開始成為熱點,并在上世紀(jì)60年代正式宣告了數(shù)字圖像處理這一全新學(xué)科的誕生。數(shù)字圖像處理研究的蓬勃展開也產(chǎn)生了繁榮的成果:1964年美國噴氣推進(jìn)實驗室(jpl)在宇航空間領(lǐng)域率先打開了數(shù)字圖像處理的應(yīng)用之門,對先
3、期發(fā)射的月球探測器傳回的數(shù)千張月表圖片進(jìn)行了去噪、校正和變換處理,并考量了其他環(huán)境因素的影響從而成功繪制了月表地形圖,jpl對后續(xù)月球探測器傳回的超過十萬張月表圖片進(jìn)行了進(jìn)一步的圖像處理,最終得出了月球的全景鑲嵌圖,為人類的探月工程做出了不可磨滅的巨大貢獻(xiàn);1979年英國emi公司工程師發(fā)明的全身ct診斷技術(shù)獲得當(dāng)年的諾貝爾生理學(xué)和醫(yī)學(xué)獎,這一造福千萬患者的開創(chuàng)性計算機(jī)斷層攝影方法可以說正是圖像處理技術(shù)卓有成效的典型應(yīng)用;90年代以來高速公路上的電子不停車收費系統(tǒng)(electronic toll collection, etc)在歐美得到了迅速的普及,極大地提高了交通通行效率,方便了人們的生活
4、。時至今日,圖像處理與識別技術(shù)的應(yīng)用身影已經(jīng)在衛(wèi)星遙感、醫(yī)學(xué)治療、文藝娛樂等高新技術(shù)行業(yè)或與人們?nèi)粘I罹o密相關(guān)的領(lǐng)域無處不在,伴隨著相關(guān)的技術(shù)突破逐漸改變著人們的社會生活。2 圖像處理與識別技術(shù)的研究重點2.1 人工智能可視化圖像處理廣義上是指利用計算機(jī)系統(tǒng)強(qiáng)大的數(shù)據(jù)處理分析能力,對輸入的圖像進(jìn)行識別、分析、處理乃至理解的過程,而數(shù)字圖像處理正是憑借著其存儲圖像信息能力、對圖像進(jìn)行無損壓縮能力以及保證圖像信息傳輸過程中發(fā)生失真概率較低能力的強(qiáng)大成為了當(dāng)前圖像處理領(lǐng)域的主流應(yīng)用技術(shù)。依托人工智能領(lǐng)域不斷涌現(xiàn)的研發(fā)成果,計算機(jī)智能化的圖像識別(或者成為人工智能的可視化)正在成為數(shù)字圖像處理技術(shù)中
5、的新潮流,在海量大數(shù)據(jù)分析技術(shù)和全新深度學(xué)習(xí)算法的支撐下,從圖像信息經(jīng)過初步數(shù)字化處理后從外界輸入,到計算機(jī)對于輸入圖像信息的背景分離、虛假特征消除和細(xì)化增強(qiáng)等中間預(yù)處理,再到圖像庫中的快速準(zhǔn)確搜索并與輸入圖像精確匹配這一后續(xù)分析處理的整個過程中計算機(jī)識別處理圖像的精準(zhǔn)程度都會得到相應(yīng)的增強(qiáng)。傳統(tǒng)的圖像識別及處理技術(shù)在人工神經(jīng)網(wǎng)絡(luò)、模糊識別算法和非線性圖像降維處理技術(shù)的推動下有了極大的原理革新和效率提升。不僅如此,人工智能在計算機(jī)視覺方面的研發(fā)突破還催生了一些全新的領(lǐng)域,2015年google公司的人工智能deep dream就以其獨特的機(jī)器美學(xué)創(chuàng)造了新的藝術(shù)潮流,以至于2016年google
6、甚至舉辦了別開生面的“機(jī)器藝術(shù)展”來向公眾展示計算機(jī)視覺下藝術(shù)作品奇幻的展現(xiàn)形式??梢灶A(yù)見的未來,人工智能作為當(dāng)下計算機(jī)視覺領(lǐng)域關(guān)注的焦點,其相關(guān)技術(shù)的進(jìn)一步突破將會成為推動圖像分析及處理技術(shù)廣泛深度應(yīng)用源源不竭的動力。2.2 三維重建三維重建是可視計算領(lǐng)域近些來興起的研究熱點,并且已經(jīng)在基于先進(jìn)醫(yī)學(xué)儀器斷層圖像數(shù)據(jù)的逆向工程、建筑學(xué)的混凝土技術(shù)三維建模、考古學(xué)中待發(fā)掘古墓墓道結(jié)構(gòu)數(shù)字建模、工業(yè)生產(chǎn)中利用ct圖像可視化以提高零件無損檢測能力等等領(lǐng)域都已經(jīng)有了豐碩的應(yīng)用成果??梢曈嬎惆藦娜S場景或數(shù)據(jù)正向生成二維圖像的計算機(jī)圖形學(xué)和由二維圖像反向進(jìn)行三維模型重建的計算機(jī)視覺,也正因為二者的交
7、叉融合程度極高,一般而言將兩個方向的研究內(nèi)容合稱可視計算。以醫(yī)學(xué)應(yīng)用領(lǐng)域的ct斷層圖像三維重建為例,整個將二維數(shù)字圖像反向映射成為三維模型的過程中同樣會運用到各種數(shù)字圖像處理的典型方法理論,例如在圖像的預(yù)處理部分,獲取二維數(shù)字圖像之后為了提高圖像質(zhì)量即需要對圖像進(jìn)行平滑或者銳化的預(yù)處理,其目的分別是藉由低通濾波技術(shù)剔除圖像中無關(guān)重要的小細(xì)節(jié)或者將不同目標(biāo)之間的空隙間斷進(jìn)行模糊化連接處理,以及藉由高通濾波技術(shù)對模糊的細(xì)節(jié)進(jìn)行強(qiáng)化為后續(xù)分析處理奠定良好數(shù)據(jù)基礎(chǔ);在對圖像進(jìn)行分割并提取特征之前,圖像的邊緣檢測和邊緣增強(qiáng)是常見的區(qū)域處理方法,而在進(jìn)行正式的圖像分割時則會大多利用灰度圖像二值化方法,設(shè)定
8、好相應(yīng)的灰度閾值,將所攝取的ct斷層圖像中的骨主體和關(guān)節(jié)軟組織進(jìn)行準(zhǔn)確清晰的圖像分割,從而將一幅看上去黑白斑駁且錯綜復(fù)雜的ct圖像處理為簡單的黑白二值圖像;在對數(shù)字圖像進(jìn)行平滑濾波處理時,非線性的中值濾波是目前主流的實現(xiàn)方法,中值濾波由于其獨有的摒棄乘除運算的特性以及高處理速度的優(yōu)勢,在保證有價值的信號部分的同時能盡可能地去除振動噪音,達(dá)到“削峰留谷”的效果。三維逆向重建技術(shù)目前正處在蓬勃的發(fā)展過程之中,自動化與智能化顯而易見地將成為未來這一技術(shù)發(fā)展的趨勢,同時如何將三維逆向重建技術(shù)更好地與人們的日常生活緊密結(jié)合起來(例如藉由無人機(jī)航測技術(shù)的普及和消費級旋翼無人機(jī)市場的擴(kuò)大,更加方便快捷地創(chuàng)建
9、3d地圖模型來滿足不同地域人們的導(dǎo)航需求),也是相關(guān)的工程技術(shù)人員需要密切關(guān)注的另一方向。2.3 虛擬現(xiàn)實/增強(qiáng)現(xiàn)實 虛擬現(xiàn)實(virtual reality, vr)以及增強(qiáng)現(xiàn)實(augmented reality)已經(jīng)成為當(dāng)下計算機(jī)視覺和圖形學(xué)領(lǐng)域發(fā)展速度最快也最具潛力的應(yīng)用領(lǐng)域。基于圖像處理和識別算法的虛擬現(xiàn)實、增強(qiáng)現(xiàn)實應(yīng)用不勝枚舉,實時的三維立體人臉識別、醫(yī)學(xué)虛擬手術(shù)、人機(jī)交互中人物動作的跟蹤識別等方面都需要圖像處理和識別技術(shù)的深度融合,可以想見此后這一熱門領(lǐng)域?qū)Q生更多的技術(shù)成果和更貼近日常生活的市場應(yīng)用。3 圖像處理與識別技術(shù)的應(yīng)用領(lǐng)域3.1 智能交通圖像處理和識別技術(shù)因其快速精
10、準(zhǔn)的判斷能力和較寬的掃描范圍在汽車上的應(yīng)用非常廣泛。目前在駕駛輔助、智能交通、車輛定位等方面都開始應(yīng)用圖像處理和識別技術(shù)。駕駛輔助方面,車道偏離預(yù)警系統(tǒng)能夠在駕駛員因為過度疲勞或者長時間單調(diào)行駛等原因而引發(fā)的注意力分散、疏忽大意,放棄對車輛的操作時能夠按照一定的車道偏離預(yù)警準(zhǔn)則給出及時的警示信號,其核心技術(shù)就是基于機(jī)器視覺對道路幾何特征的識別提取以及后續(xù)的圖像分析處理,來為車輛運動狀態(tài)的計算和車道偏離可能性的評估提供準(zhǔn)確依據(jù)。車道保持輔助系統(tǒng)則依托車道識別和跟蹤這一技術(shù)核心,是圖像處理與識別技術(shù)和智能車有機(jī)結(jié)合的一款典型輔助駕駛應(yīng)用,基于機(jī)器視覺的自適應(yīng)巡航acc、交通標(biāo)志識別tsr和遠(yuǎn)關(guān)燈輔
11、助hba也已經(jīng)逐漸成為了自動駕駛汽車的標(biāo)配;智能交通方面,對于整體的交通系統(tǒng),應(yīng)用攝像頭進(jìn)行圖像的收集也有很廣泛的應(yīng)用。如車道識別、車流量計算等等;車輛定位方面,自動泊車系統(tǒng)和車身定位系統(tǒng)已不鮮見。自動泊車系統(tǒng)自動泊車系統(tǒng)需要汽車識別后方的路況信息,識別停車位置,目前已經(jīng)有基于攝像頭識別來進(jìn)行車輛泊車的功能。后方攝像頭也可以進(jìn)行輔助泊車,通過攝像頭將后方信號直觀地顯示在駕駛室,這樣可以來輔助駕駛員泊車。車身定位系統(tǒng)則通過攝像頭對周圍環(huán)境進(jìn)行感知,與地圖進(jìn)行結(jié)合對汽車的定位進(jìn)行校準(zhǔn),使定位更加精確。圖像處理及識別技術(shù)作為人類利用計算機(jī)軟硬件代替視覺感官系統(tǒng)的代表性技術(shù),是智能車乃至整個人工智能感
12、知外界信息從而做出響應(yīng)的重大進(jìn)展。因此進(jìn)一步研究圖像處理及識別技術(shù),對于提升智能車乃至整個人工智能的思維能力與決策能力有著重要意義。3.2 醫(yī)學(xué)治療醫(yī)學(xué)治療領(lǐng)域的圖像處理及識別應(yīng)用處處可見,微觀層面的細(xì)胞染色體分類、基于虛擬現(xiàn)實技術(shù)的虛擬內(nèi)窺鏡、3d超聲成像、核磁共振(mri)影像分析、數(shù)字減影血管造影技術(shù)、骨質(zhì)疏松的圖像識別算法、針對患者病患部位的所拍攝的2d斷層圖像進(jìn)行逆向3d可視化建模以及功能圖像和解剖圖像的二者融合等都是典型的應(yīng)用成果。3.3 交互通訊光纖通訊和微波通訊中,如何排除各種環(huán)境噪音對于所傳輸圖像信息的干擾一直是重要的研究課題,而包括了變換域法和空間域法的多種通信圖像的去噪方
13、法都有著廣泛的應(yīng)用。3.4 公安刑偵目前的大中城市普遍覆蓋了“天網(wǎng)”系統(tǒng),在此基礎(chǔ)上所衍生的針對可疑目標(biāo)所捕捉到的圖像處理及識別任務(wù)也逐漸提出了更高的技術(shù)要求。諸如利用小波分析的算法的快速人臉識別、掌紋/足紋的圖像處理建模、對于模糊圖像的非失真還原處理、快速準(zhǔn)確的圖像標(biāo)注測量等方面都已經(jīng)有了較為成熟的應(yīng)用成果,未來隨著相關(guān)技術(shù)的突破將為豐富公安刑偵手段,提高破案效率做出更大的貢獻(xiàn)。4 結(jié)束語顯然,圖像處理及識別技術(shù)將沿循著立體化、智能化、標(biāo)準(zhǔn)化、網(wǎng)絡(luò)化和集成化的發(fā)展趨勢進(jìn)一步發(fā)展,更貼近真實的圖像采集效果、更高清的圖像顯示分辨率、更精確的圖像數(shù)據(jù)庫匹配結(jié)果、更高效的圖像處理及識別算法都將是未來
14、圖像處理及識別技術(shù)所追求的的目標(biāo)。參考文獻(xiàn)1翁和王.關(guān)于人工智能中的圖像識別技術(shù)的研究j.信息通信,2016(10):191-192.2唐錄潔.計算機(jī)智能化圖像識別技術(shù)的理論性探究j.計算機(jī)光盤軟件與應(yīng)用,2013(13):98-100.3孫亮.計算機(jī)智能化圖像識別技術(shù)的理論性突破j.數(shù)字技術(shù)與應(yīng)用,2013(06):106-107.4徐彩云.圖像識別技術(shù)研究綜述j.電腦知識與技術(shù),2013(04):2446-2447.5李康.智能化圖像識別技術(shù)的發(fā)展概況j.軍民兩用技術(shù)與產(chǎn)品,2016(08).6萬卷.圖像處理智能化的發(fā)展方向j.電子技術(shù)與軟件工程,2017(09):66-66.7陳曉紅.計算機(jī)圖像處理技術(shù)發(fā)展趨勢研究j.信息與電腦:理論版,2013(07):215-216.8陳艷.探討計算機(jī)圖像處理技術(shù)的發(fā)展趨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC GUIDE 68:2002 AR Arrangements for the recognition and acceptance of conformity assessment results
- 2025至2030中國瓷磚行業(yè)市場發(fā)展現(xiàn)狀及發(fā)展趨勢與投資前景預(yù)測報告
- 教師如何利用教育心理學(xué)提升學(xué)生動力
- 校長家委會培訓(xùn)
- 學(xué)習(xí)心理學(xué)視角下的興趣培養(yǎng)與學(xué)習(xí)動機(jī)關(guān)系探討
- 時代背景下教育品牌的傳播策略
- 教育法律環(huán)境下的學(xué)校教育創(chuàng)新實踐
- 教育科技助力醫(yī)療培訓(xùn)新模式
- 學(xué)校校企合作工作管理辦法
- 抖音商戶直播互動提升流量制度
- 2025年醫(yī)保知識考試題庫及答案:醫(yī)保信息化建設(shè)應(yīng)用法律法規(guī)試題
- 環(huán)境現(xiàn)場采樣培訓(xùn)
- XX公司年產(chǎn)10萬噸陽極銅及5萬噸銅桿項目環(huán)境影響報告書
- 陜西省專業(yè)技術(shù)人員繼續(xù)教育2025公需課《黨的二十屆三中全會精神解讀與高質(zhì)量發(fā)展》20學(xué)時題庫及答案
- 財務(wù)考試試題及答案大全
- 2024-2025學(xué)年人教版數(shù)學(xué)五年級下學(xué)期期末試卷(含答案)
- 二中分班考試試卷及答案
- 校長在退休教師座談會上發(fā)言:“教”澤綿長退休不褪色
- 2025年河北張家口市事業(yè)單位公開招聘工作人員541名筆試備考試題及答案解析
- 核心素養(yǎng)導(dǎo)向的課堂教學(xué)-余文森
- 2024年體育類第二批(高職專科批)投檔最低分及名次
評論
0/150
提交評論