《計(jì)算機(jī)視覺》 教學(xué)案例匯 1、直方圖變換- 10、目標(biāo)檢測_第1頁
《計(jì)算機(jī)視覺》 教學(xué)案例匯 1、直方圖變換- 10、目標(biāo)檢測_第2頁
《計(jì)算機(jī)視覺》 教學(xué)案例匯 1、直方圖變換- 10、目標(biāo)檢測_第3頁
《計(jì)算機(jī)視覺》 教學(xué)案例匯 1、直方圖變換- 10、目標(biāo)檢測_第4頁
《計(jì)算機(jī)視覺》 教學(xué)案例匯 1、直方圖變換- 10、目標(biāo)檢測_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

教學(xué)案例1:直方圖變換一、實(shí)驗(yàn)?zāi)康呐c任務(wù)通過本實(shí)驗(yàn),要求學(xué)生掌握直方圖計(jì)算、直方圖均衡化等變換算法,通過調(diào)整圖像的直方圖來增強(qiáng)圖像質(zhì)量。二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容:對輸入圖像計(jì)算其直方圖,進(jìn)行直方圖變換處理,輸出處理后的直方圖;實(shí)現(xiàn)一種圖像濾波,并輸出濾波后的圖像及其直方圖。實(shí)驗(yàn)要求Python實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一)任務(wù)簡介:對輸入圖像進(jìn)行直方圖變換處理,輸出處理后圖像及其直方圖。(二)數(shù)據(jù)簡介:給定任一圖像。(三)模型簡介:直方圖變換算法主要包含三個(gè)步驟:1)計(jì)算輸入圖像的灰度直方圖;2)進(jìn)行直方圖均衡化處理;3)對圖像進(jìn)行濾波處理;4)計(jì)算濾波后的圖像的直方圖;5)顯示上述結(jié)果。(四)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(五)參考代碼:見案例代碼數(shù)據(jù)。教學(xué)案例2:圖像拼接一、實(shí)驗(yàn)?zāi)康呐c任務(wù)通過本實(shí)驗(yàn),要求學(xué)生掌握基于特征點(diǎn)匹配的圖像拼接算法,通過圖像的特征點(diǎn)檢測與特征匹配來實(shí)現(xiàn)圖像拼接。二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容:對輸入兩幅有重疊區(qū)域的圖片,實(shí)現(xiàn)特征點(diǎn)檢測、特征匹配及特征變換算法,實(shí)現(xiàn)兩幅圖像的拼接。實(shí)驗(yàn)要求Python實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一)任務(wù)簡介:實(shí)現(xiàn)基于對應(yīng)特征點(diǎn)檢測的圖像拼接。(二)數(shù)據(jù)簡介:任意兩幅具有重疊區(qū)域的圖像。(三)模型簡介:圖像拼接算法主要包含三個(gè)步驟:1)選擇一種特征點(diǎn)檢測算法,在兩幅圖像上檢測特征點(diǎn);2)選擇圖像點(diǎn)特征的表示方法,通過特征比對實(shí)現(xiàn)兩幅圖像對應(yīng)特征點(diǎn)的檢測;3)選擇合適的變換,通過對應(yīng)特征點(diǎn)計(jì)算變換參數(shù),實(shí)現(xiàn)圖像拼接。(四)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(五)參考代碼:見案例代碼數(shù)據(jù)。教學(xué)案例3:線特征表示一、實(shí)驗(yàn)?zāi)康呐c任務(wù)ASM()二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容MatlabASMASM(PDM)PCA實(shí)驗(yàn)要求python三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一)任務(wù)簡介:人臉識別任務(wù)旨在利用主動形狀模型(ActiveShapeModel)技術(shù),通過分析人臉圖像的形狀特征,實(shí)現(xiàn)對人臉的自動檢測和定位。該任務(wù)主要包含模型訓(xùn)練和模型搜索兩個(gè)階段:ASMASM(二)數(shù)據(jù)集簡介:LFWLabeledFaceintheLFW132335749250x250(三)模型簡介:ASMASM1995ASM:,然后依據(jù)形狀信息建立統(tǒng)計(jì)形狀模型,,,而且它還能將形狀的可變性限制在一個(gè)較小范圍內(nèi),從而保證了目標(biāo)形狀等改變時(shí)不會因各種影響因素的改變而改變,也可以有效地防止模型的過擬合ASM(四)環(huán)境說明:算法實(shí)驗(yàn)平臺為MATLAB,編程語言為Matlab。The/還(C、C++、Java、PythonSimulink/(五)參考代碼:項(xiàng)目代碼參見:/johnwmillr/ActiveShapeModelsLFW數(shù)據(jù)集參見:/lfw/或見案例代碼數(shù)據(jù)。教學(xué)案例4:區(qū)域分割一、實(shí)驗(yàn)?zāi)康呐c任務(wù)通過本實(shí)驗(yàn),要求學(xué)生能夠了解區(qū)域分割的基本思想,通過學(xué)習(xí)一組訓(xùn)練圖像和對應(yīng)的標(biāo)簽,來建立區(qū)域分割模型,獲得分割結(jié)果圖并展示。二、實(shí)驗(yàn)內(nèi)容、要求及安排Python實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一)任務(wù)簡介:區(qū)域分割包含三個(gè)子任務(wù):語義分割、實(shí)例分割、全景分割。語義分割:每個(gè)像素對應(yīng)一個(gè)類標(biāo)簽,同一類會被定義成一個(gè)區(qū)域塊,不區(qū)分其中單個(gè)個(gè)體,但受限于定義的類數(shù)量,其中不使用的像素點(diǎn)會有指定的分類。實(shí)例分割:每個(gè)對象的掩碼和類標(biāo)簽。區(qū)分單個(gè)物體以及單個(gè)物體所屬的類型,但受限于能夠識別的物體類型數(shù)量,無法識別的都作為背景(圖上的黑色背景)。+(二)數(shù)據(jù)集簡介:CRAG(ColorectalAdenocarcinomaGland)21320H&EMILD-Net論MedicalImageAnalysis17340HRC_WHU(High-ResolutionCloudDetectionDataset):這個(gè)數(shù)據(jù)集由武漢大學(xué)的SENDIMAGE實(shí)驗(yàn)室創(chuàng)建,包含150張高分辨率云層驗(yàn)證數(shù)據(jù)圖像,這些圖像具有三個(gè)RGB0.515/SWINySEG(SingaporeWholeskyNychthemeronImageSEGmentationDatabase):這個(gè)6768)2016112VOC2012(TheObjectClassesChallenge2012)20人、動物、車輛和家用物品等。上述數(shù)據(jù)集可以從網(wǎng)上搜索下載。(三)模型簡介:(Fullyconnectednetwork,FCN)Shelhamer,LongDarrell2015,0NNN,U-NetRonneberger、FischerBrox2015U-Net(四)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(五)參考代碼:UNet代碼參見:/bubbliiiing/unet-pytorch.gitFCN 代碼參見:/WZMIAOMIAO/deep-learning-for-image-processing/tree/master/pytorch_segmentation/fcn或見案例代碼數(shù)據(jù)。教學(xué)案例5:紋理分析一、實(shí)驗(yàn)?zāi)康呐c任務(wù)PCANet二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容:PythonPCANet的紋實(shí)驗(yàn)要求:Python最終提交調(diào)試成功的源程序代碼和實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一任務(wù)簡介(二)數(shù)據(jù)集簡介:MNIST(ModifiedNationalInstituteofStandardsandTechnology)MNIST7000028x28像6000010000PCANetCIFAR-10(CanadianInstituteforAdvancedResearch10classes)106000032x325000010000PCANetImageNetImageNetTCNNDTD(DescribableDataset)47120像,共計(jì)5640FlickrTCNN109814500上述數(shù)據(jù)集可以從網(wǎng)上搜索下載。(三)模型簡介:ConvolutionalNeuralNetwork)PCANet(PrincipalComponentAnalysisNetwork)PCANetPCANetPCA濾波器來提取圖像特征,并使用直方圖來表示圖像特征。相比于傳統(tǒng)的深度學(xué)習(xí)網(wǎng)絡(luò),PCANet(四)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(五)參考代碼:T-CNN代碼參見:/shantanu-ai/MTL-TCNN3PCANet代碼參見:/lucasleesw/PCANet_python_ver或見案例代碼數(shù)據(jù)。教學(xué)案例6:相機(jī)標(biāo)定一、實(shí)驗(yàn)?zāi)康呐c任務(wù)通過本實(shí)驗(yàn),要求學(xué)生掌握相機(jī)標(biāo)定算法,求出相機(jī)的內(nèi)外參數(shù)以及畸變參數(shù),確定現(xiàn)實(shí)世界三維點(diǎn)與其在相機(jī)圖像中對應(yīng)的二維投影點(diǎn)之間的準(zhǔn)確關(guān)系。二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容實(shí)驗(yàn)要求Python實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一)任務(wù)簡介:實(shí)現(xiàn)相機(jī)標(biāo)定。(二)模型簡介:相機(jī)標(biāo)定指建立相機(jī)圖像像素位置與場景點(diǎn)位置之間的關(guān)系,根據(jù)相機(jī)成像模型,由特征點(diǎn)在圖像中坐標(biāo)與世界坐標(biāo)的對應(yīng)關(guān)系,求解相機(jī)模型的參數(shù)。相機(jī)需要標(biāo)定的模型參數(shù)包括內(nèi)部參數(shù)和外部參數(shù)。(三)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(四)參考代碼:參考鏈接:/zhiyuanyou/Calibration-ZhangZhengyou-Method或見案例代碼數(shù)據(jù)。教學(xué)案例7:三維重建一、實(shí)驗(yàn)?zāi)康呐c任務(wù)通過本實(shí)驗(yàn),要求學(xué)生根據(jù)多視圖,掌握三維重建算法,對三維物體構(gòu)建適合計(jì)算機(jī)表示和處理的數(shù)學(xué)模型。二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容:以單視圖或多視圖為輸入,先對攝像機(jī)進(jìn)行標(biāo)定,即計(jì)算出攝像機(jī)的圖像坐標(biāo)系與世界坐標(biāo)系的關(guān)系.然后利用多個(gè)二維圖像中的信息重建出三維信息。實(shí)驗(yàn)要求實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一)任務(wù)簡介:基于立體視覺的三維重建。(二)模型簡介:((),三維重建算法流程主要步驟如下:(1)圖像獲?。涸谶M(jìn)行圖像處理之前,先要用攝像機(jī)獲取三維物體的二維圖像。光照條件、相機(jī)的幾何特性等對后續(xù)的圖像處理造成很大的影響。(3)特征提取:特征主要包括特征點(diǎn)、特征線和區(qū)域。(三)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python通常用于圖像識別和語言處理等應(yīng)用程序的機(jī)器學(xué)習(xí)。(四)參考代碼:見案例代碼數(shù)據(jù)。教學(xué)案例8:光流估計(jì)一、實(shí)驗(yàn)?zāi)康呐c任務(wù)通過本實(shí)驗(yàn),要求學(xué)生掌握運(yùn)動視頻光流估計(jì)算法,熟悉稀疏光流與稠密光流的計(jì)算與評價(jià)方法。二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容FlowNetPWCNet實(shí)驗(yàn)要求Python實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一任務(wù)簡介(二)數(shù)據(jù)集簡介:FlyingChairs228723DFlickrICCV2015論文FlowNet:LearningOpticalFlowwithConvolutionalNetworksKITTI(optical(visual(objectdetection)跟蹤(tracking)KITTI1530KITTI389HD1KBenchmarkSuite1000256x08Sintel3DSintel2312個(gè)測試序列。上述數(shù)據(jù)集可以從網(wǎng)上搜索下載。(三)模型簡介:FlowNetFlowNet(truthFlowNetFlowNetSimple(FlowNet-S)和FlowNetCorrelation(FlowNet-C)。PWC-Net光流映射(四)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(五)參考代碼:FlowNet代碼參見:/philferriere/tfoptflow/blob/masterPWC-Net代碼參見:/NVlabs/PWC-Net或見案例代碼數(shù)據(jù)。教學(xué)案例9:圖像分類一、實(shí)驗(yàn)?zāi)康呐c任務(wù)使學(xué)生掌握圖像特征提取、傳統(tǒng)圖像分類、神經(jīng)網(wǎng)絡(luò)圖像分類方法,了解MNIST、CIFAR等圖像數(shù)據(jù)集的構(gòu)成。二、實(shí)驗(yàn)內(nèi)容、要求及安排實(shí)驗(yàn)內(nèi)容實(shí)驗(yàn)要求Python實(shí)驗(yàn)安排:本實(shí)驗(yàn)屬于開放性實(shí)驗(yàn),要求每個(gè)學(xué)生獨(dú)立地完成本實(shí)驗(yàn)項(xiàng)目。三、任務(wù)實(shí)現(xiàn)及相關(guān)素材(一任務(wù)簡介(二)數(shù)據(jù)集簡介:MNIST(ModifiedNationalInstituteofStandardsandTechnology)MNIST28×280~96000010000CIFAR-100(CanadianInstituteforAdvancedResearch100classes)10060032x3210020532x32RGBImageNet1400上述數(shù)據(jù)集可以從網(wǎng)上搜索下載。(三)模型簡介:VGGNet2014KarenSimonyanAndrewZissermanVGG與AlexNetAlexNetx、7x、5x5)3x3Transformer(NLP)TransformerpatchTransformerEncoder(四)環(huán)境說明:算法開發(fā)環(huán)境推薦使用anoconda+pytorch,編程語言為Python。AnacondaPython支持LinuxMac,python(五)參考代碼:VGG16代碼參見:/ashushekar/VGG16VisionTransformer代碼參見:/google-research/vision_tran

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論