人體行為識別技術(shù)_第1頁
人體行為識別技術(shù)_第2頁
人體行為識別技術(shù)_第3頁
人體行為識別技術(shù)_第4頁
人體行為識別技術(shù)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、人體行為識別技術(shù)在計(jì)算機(jī)視覺領(lǐng)域中,人體運(yùn)動行為識別是一個被廣泛關(guān)注的熱點(diǎn)問題,在智能監(jiān)控、機(jī)器人、人機(jī)交互、虛擬現(xiàn)實(shí),智能家居,智能安防,運(yùn)動員輔助訓(xùn)練等方面有巨大應(yīng)用價值。行為識別問題一般遵從如下基本過程:數(shù)據(jù)圖像預(yù)處理,運(yùn)動人體檢測、運(yùn)動特征提取、特征訓(xùn)練與分類、行為識別。著重從這幾方面逐一回顧了近年來人體行為識別的發(fā)展現(xiàn)狀和常有方法。并對當(dāng)前該研究方向上待解決的問題和未來趨勢做了分析。行為理解可以簡單地認(rèn)為是時變數(shù)據(jù)的分類問題,即將測試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配。通過對大量行為理解研究文獻(xiàn)的整理發(fā)現(xiàn):人行為理解研究一般遵從特征提取與運(yùn)動表征、行為識別、高層行為與場景

2、理解等幾個基本過程。特征提取與運(yùn)動表征是在對目標(biāo)檢測、分類和跟蹤等底層和中層處理的基礎(chǔ)上,從目標(biāo)的運(yùn)動信息中提取目標(biāo)圖像特征并用來表征目標(biāo)運(yùn)動狀態(tài);行為識別則是將輸入序列中提取的運(yùn)動特征與參考序列進(jìn)行匹配,判斷當(dāng)前的動作處于哪種行為模型;高層行為與場景理解是結(jié)合行為發(fā)生的場景信息和相關(guān)領(lǐng)域知識,識別復(fù)雜行為,實(shí)現(xiàn)對事件和場景的理解。【2】1、行為識別的應(yīng)用從應(yīng)用領(lǐng)域的分類來講,可以將人體運(yùn)動分析的應(yīng)用分成如下幾個領(lǐng)域:智能監(jiān)控這里所指的“智能”包含兩個方面的含義。一種“智能”是指系統(tǒng)能夠在一定的場景中檢測是否有人的出現(xiàn)(如通過檢測人臉的方法)防止只是簡單的通過運(yùn)動目標(biāo)檢測所造成的錯誤報(bào)警(例如

3、因?yàn)閯游锘顒踊蛘吖物L(fēng)搖動樹枝等等而造成誤報(bào))。另外一種“智能”是指系統(tǒng)能夠監(jiān)視一定場所中人的活動,并對其行為進(jìn)行分析和識別,跟蹤可疑行為(如經(jīng)常在重要地點(diǎn)徘徊等等行為)從而采取相應(yīng)的報(bào)警措施。通常把報(bào)警系統(tǒng)設(shè)置于銀行、機(jī)場、車站、碼頭、超市、辦公大樓、住宅小區(qū)等地,以實(shí)現(xiàn)對這些場所的智能監(jiān)控。虛擬現(xiàn)實(shí)跟蹤現(xiàn)實(shí)世界人的姿態(tài),從而創(chuàng)建一個虛擬的仿真場景,實(shí)現(xiàn)人與這個虛擬世界的交互。該領(lǐng)域的具體應(yīng)用涉及視頻游戲、虛擬攝影棚、計(jì)算機(jī)動畫等方面。高級用戶接口指可以通過對用戶手勢的識別來代替?zhèn)鹘y(tǒng)的鼠標(biāo)和鍵盤輸入,從而實(shí)現(xiàn)人與計(jì)算機(jī)之間的智能交互。此外,通過對手勢語言的理解,還可以進(jìn)行聾人與計(jì)算機(jī)之間的手語

4、交流。運(yùn)動分析人體運(yùn)動分析可以運(yùn)用于基于內(nèi)容的視頻檢索領(lǐng)域。例如可以檢索在運(yùn)動會上單杠比賽中運(yùn)動員的杠上動作。這樣可以節(jié)省用戶大量的查詢視頻資料的時間和精力。另外一種應(yīng)用是用于各種體育項(xiàng)目中,提取運(yùn)動員的各項(xiàng)技術(shù)參數(shù)(如關(guān)節(jié)位置、角度和角速度,等等),通過分析這些信息,可以為運(yùn)動員的訓(xùn)練提供指導(dǎo)和建議,有助于提高運(yùn)動員的訓(xùn)練水平。此外,還可以用于體育舞蹈動作的分析,以及臨床矯形術(shù)的研究等領(lǐng)域?;谀P偷囊曨l編碼通過提取一定的靜態(tài)場景中人物的形態(tài)特征參數(shù)和3D姿態(tài)參數(shù),以較低的數(shù)據(jù)量對視頻數(shù)據(jù)流加以描述,實(shí)現(xiàn)視頻數(shù)據(jù)的壓縮和低比特率傳送??梢杂糜谠谝蛱鼐W(wǎng)上展開遠(yuǎn)程視頻會議以及VOD(Video-

5、On-Demand)視頻點(diǎn)播。總之,人體運(yùn)動跟蹤的研究已涉及到計(jì)算機(jī)視覺、模式識別、視頻圖像處理等方面的理論問題和實(shí)際應(yīng)用問題,對人體這一帶有關(guān)節(jié)旋轉(zhuǎn)運(yùn)動的非剛體目標(biāo)的跟蹤與分析將會促進(jìn)這些領(lǐng)域在理論上產(chǎn)生新的處理方法,并將對諸多應(yīng)用領(lǐng)域產(chǎn)生潛在的影響。2、行為識別研究難點(diǎn)行為識別發(fā)展至今,取得了很大的進(jìn)展,在低層,中層和高層都取得了一定的突破,但是行為識別算法并不成熟,目前不存在一個算法適合所有的行為分類,3個視覺層次中都還有很多嚴(yán)峻的問題有待解決。其研究的難點(diǎn)主要體現(xiàn)在以下幾個方面:1)動作類內(nèi)類間的變化太大對于大多數(shù)的動作,即使是同一動作都有不同的表現(xiàn)形式。比如說走路,可以在不同的背景環(huán)

6、境中完成,走路的速度也可以從慢到快,走路的步長亦有長有短。其它的動作也有類似的結(jié)果,特別是一些非周期的運(yùn)動,比如過馬路時候的走路,這與平時周期性的走路步伐明顯不同。由此可見,動作的種類本身就很多,再加上每一種類又有很多個變種,所以給行為識別的研究帶來了不少麻煩。2)環(huán)境背景等影響環(huán)境問背景等因素的影響可謂是計(jì)算機(jī)視覺各個領(lǐng)域的最大難點(diǎn)。主要有視角的多樣性,同樣的動作從不同的視角來觀察會得到不同的二維圖像;人與人之間,人與背景之間的相互遮擋也使計(jì)算機(jī)對動作的分類前期特征提取帶來了困難,目前解決多視覺和遮擋問題,有學(xué)者提出了多攝像機(jī)融合通過3維重建來處理;另外其影響因素還包括動態(tài)變化和雜亂的背景,

7、環(huán)境光照的變化,圖像視頻的低分辨率等。3)時間變化的影響人體的行為離不開時間這個因素。而我們拍攝的視頻其存放格式有可能不同,其播放速度有慢有快,這就導(dǎo)致了我們提出的系統(tǒng)需對視頻的播放速率不敏感。4)數(shù)據(jù)的獲取和標(biāo)注既然把行為識別問題當(dāng)成一個分類問題,就需要大量的數(shù)據(jù)來訓(xùn)練分類模型。而這些數(shù)據(jù)是視頻數(shù)據(jù),每一個動作在視頻中出現(xiàn)的位置和時間都不確定,同時要考慮同一種動作的不同表現(xiàn)形式以及不同動作之間的區(qū)分度,即數(shù)據(jù)的多樣性和全面性。這一收集過程的工作量不小,網(wǎng)上已經(jīng)有一些公開的數(shù)據(jù)庫供大家用來實(shí)驗(yàn),這將在本文的第3部分進(jìn)行介紹。另外,手動對視頻數(shù)據(jù)標(biāo)注非常困難。當(dāng)然,有學(xué)者也提出了一些自動標(biāo)注的方

8、法,比如說利用網(wǎng)頁圖片搜索引擎,利用視頻的字幕,以及利用電影描述的文本進(jìn)行匹配。5)高層視覺的理解上面一提到,目前對行為識別的研究尚處在動作識別這一層。其處理的行為可以分為2類,一類是有限制類別的簡單規(guī)則行為,比如說走、跑、揮手、彎腰、跳等。另一類是在具體的場景中特定的行為,如檢測恐怖分子異常行為,丟包后突然離開等。在這種場景下對行為的描述有嚴(yán)格的限制,此時其描述一般采用了運(yùn)動或者軌跡。這2種行為識別的研究都還不算完善,遇到了不少問題,且離高層的行為識別要求還相差很遠(yuǎn)。因此高層視覺的理解表示和識別是一個巨大的難題。3人體行為分析研究一般的運(yùn)動人體行為分析主要包括一下幾個流程:1)數(shù)據(jù)庫建立;2

9、)運(yùn)動人體檢測;3)運(yùn)動特征提??;4)行為理解與識別。在我們的運(yùn)動人體行為分析研究中,重點(diǎn)研究運(yùn)動人體檢測和運(yùn)動特征提取。如圖1所示是運(yùn)動行為分析研究的整體框架:圖13.1運(yùn)動目標(biāo)檢測對于不依賴先驗(yàn)知識的目標(biāo)跟蹤來講,運(yùn)動檢測是實(shí)現(xiàn)跟蹤的第一步,運(yùn)動檢測即為從序列圖像中將變化區(qū)域從背景圖像中提取出來。目前,已有的運(yùn)動目標(biāo)檢測方法按照算法的基本原理可以分為三類:幀間差分法、背景減除法和光流法。三類方法各有其優(yōu)缺點(diǎn)。(1)背景減除法背景減除法是預(yù)先選取不含前景運(yùn)動目標(biāo)的背景圖像,然后將當(dāng)前圖像幀與背景圖像相減得到前景目標(biāo)。最常用且有效的是背景減除法。此類算法的缺點(diǎn)是由于通常需要緩沖若干幀來學(xué)習(xí)背景

10、,因此往往需要消耗大量的內(nèi)存,這使其使用范圍受到了限制。此外,對于大范圍的背景擾動,此類算法的檢測效果也不理想。Stauffer和Grimson提出的高斯混合模型是使用最為廣泛的背景建模方法。高斯混合模型通過多個高斯分布對背景建模,每個分布對應(yīng)一種背景像素的模態(tài),從而能夠適應(yīng)像素層面上的背景擾動問題,并能通過對背景的不斷更新,使系統(tǒng)能對背景的變化自適應(yīng)。但是,高斯混合模型對于全局光照變化、陰影非常敏感,對于緩慢的運(yùn)動目標(biāo)檢測效果也不理想。(2) 幀間差分法幀間差分法的主要思想就是利用視頻圖像序列中連續(xù)兩幀或三頓的差異來檢測發(fā)生運(yùn)動的區(qū)域。Lipton等人提出的用于實(shí)時視頻流中運(yùn)動冃標(biāo)檢測的算法

11、就是頓間差分的方法Lipton98。頓間差分法的特點(diǎn)是動態(tài)性強(qiáng),能夠適應(yīng)動態(tài)背景下的運(yùn)動目標(biāo)檢測。但是,這類算法檢測出的目標(biāo)輪廓非常不理想,在目標(biāo)內(nèi)部會留有許多空洞,在目標(biāo)運(yùn)動較快時目標(biāo)的輪廓會被擴(kuò)大,在目標(biāo)運(yùn)動較慢時甚至有可能無法得到目標(biāo)的邊界。(3)基于光流的運(yùn)動目標(biāo)檢測算法基于光流的運(yùn)動目標(biāo)檢測算法是利用光流方程計(jì)算出每個像素點(diǎn)的運(yùn)動狀態(tài)矢量,從而發(fā)現(xiàn)運(yùn)動的像素點(diǎn),并且能夠?qū)@些像素點(diǎn)進(jìn)行跟蹤。在攝像機(jī)運(yùn)動、背景變化時,光流法也能檢測出運(yùn)動目標(biāo),并且它能同時完成運(yùn)動目標(biāo)檢測和跟蹤,但是該方法的計(jì)算復(fù)雜度高,在沒有專用硬件支持的情況下很難做到實(shí)時檢測,同時,光流場的計(jì)算非常容易受到噪聲、光

12、照變化和背景擾動的影響。采用光流場計(jì)算的方法也很難將運(yùn)動目標(biāo)的輪廓完整地提取出來。3.2運(yùn)動目標(biāo)分類目標(biāo)分類是指從運(yùn)動目標(biāo)檢測到的前景運(yùn)動區(qū)域中提取感興趣目標(biāo)區(qū)域。復(fù)雜場景小檢測到的前景區(qū)域可能包含不同種類的目標(biāo),如行人、車輛、飛鳥、劉云、搖動的樹枝等,在人體運(yùn)動分析系統(tǒng)中,只對運(yùn)動人體感興趣,因此需要對運(yùn)動目標(biāo)的類型進(jìn)行分析識別,提取人體目標(biāo)。目前常用的目標(biāo)分類方法有如圖2:圖23.3運(yùn)動目標(biāo)跟蹤依據(jù)運(yùn)動目標(biāo)的表達(dá)和相似性度量, 運(yùn)動目標(biāo)跟蹤算法可以分為四類: 基于主動輪廓的跟蹤、 基于特征的跟蹤、 基于區(qū)域的跟蹤和基于模型的跟蹤。跟蹤算法的精度和魯棒性很大程度上取決于對運(yùn)動目標(biāo)的表達(dá)和相似

13、性度量的定義, 跟蹤算法的實(shí)時性取決于匹配搜索策略和濾波預(yù)測算法。1)基于主動輪廓的跟蹤Kass等人提出的主動輪廓模型, 即 Snake模型, 是在圖像域內(nèi)定義的可變形曲線, 通過對其能量函數(shù)的最小化, 動態(tài)輪廓逐步調(diào)整自身形狀與目標(biāo)輪廓相一致, 該可變形曲線又稱為Snake曲線。Snake技術(shù)可以處理任意形狀物體的任意形變,首先將分割得到的物體邊界作為跟蹤的初始模板, 然后確定表征物體真實(shí)邊界的目標(biāo)函數(shù), 并通過降低目標(biāo)函數(shù)值, 使初始輪廓逐漸向物體的真實(shí)邊界移動?;谥鲃虞喞櫟膬?yōu)點(diǎn)是不但考慮來自圖像的灰度信息, 而且考慮整體輪廓的幾何信息, 增強(qiáng)了跟蹤的可靠性。由于跟蹤過程實(shí)際上是解的

14、尋優(yōu)過程, 帶來的計(jì)算量比較大,而且由于 Snake模型的盲目性, 對于快速運(yùn)動的物體或者形變較大的情況, 跟蹤效果不夠理想2)基于特征的跟蹤基于特征匹配的跟蹤方法不考慮運(yùn)動目標(biāo)的整體特征, 只通過目標(biāo)圖像的一些顯著特征來進(jìn)行跟蹤。假定運(yùn)動目標(biāo)可以由惟一的特征集合表達(dá), 搜索到該相應(yīng)的特征集合就認(rèn)為跟蹤上了運(yùn)動目標(biāo)。除了用單一的特征來實(shí)現(xiàn)跟蹤外, 還可以采用多個特征信息融合在一起作為跟蹤特征。2)基于特征的跟蹤基于特征的跟蹤主要包括特征提取和特征匹配兩個方面。(1)特征提取,特征提取是指從景物的原始圖像中提取圖像的描繪特征,理想的圖像特征應(yīng)具備的特點(diǎn)是a)特征應(yīng)具有直觀意義,符合人們的視覺特性

15、; b)特征應(yīng)具備較好的分類能力, 能夠區(qū)分不同的圖像內(nèi)容; c)特征計(jì)算應(yīng)該相對簡單,以便于快速識別; d)特征應(yīng)具備圖像平移、 旋轉(zhuǎn)、 尺度變化等不變性。目標(biāo)跟蹤中常用的運(yùn)動目標(biāo)的特征主要包括顏色、 紋理、邊緣、 塊特征、 光流特征、 周長、 面積、 質(zhì)心、 角點(diǎn)等。提取對尺度伸縮、 形變和亮度變化不敏感的有效特征至今仍是圖像處理研究領(lǐng)域中一個比較活躍的方面。(2)特征匹配,特征提取的目的是進(jìn)行幀間目標(biāo)特征的匹配, 并以最優(yōu)匹配來跟蹤目標(biāo)。常見的基于特征匹配的跟蹤算法有:基于二值化目標(biāo)圖像匹配的跟蹤、 基于邊緣特征匹配或角點(diǎn)特征匹配的跟蹤、 基于目標(biāo)灰度特征匹配的跟蹤、 基于目標(biāo)顏色特征匹

16、配的跟蹤等?;谔卣鞯母櫵惴ǖ膬?yōu)點(diǎn)在于對運(yùn)動目標(biāo)的尺度、 形變和亮度等變化不敏感, 即使目標(biāo)的某一部分被遮擋, 只要還有一部分特征可以被看到, 就可以完成跟蹤任務(wù); 另外, 這種方法與 K al man濾波器聯(lián)合使用, 也具有很好的跟蹤效果。但是其對于圖像模糊、 噪聲等比較敏感, 圖像特征的提取效果也依賴于各種提取算子及其參數(shù)的設(shè)置, 此外, 連續(xù)幀間的特征對應(yīng)關(guān)系也較難確定, 尤其是當(dāng)每一幀圖像的特征數(shù)目不一致、存在漏檢、 特征增加或減少等情況。3)基于區(qū)域的跟蹤基于區(qū)域的跟蹤算法基本思想是: a)得到包含目標(biāo)的模板, 該模板可通過圖像分割獲得或預(yù)先人為確定, 模板通常為略大于目標(biāo)的矩形,

17、 也可為不規(guī)則形狀; b)在序列圖像中, 運(yùn)用相關(guān)算法跟蹤目標(biāo)。這種算法的優(yōu)點(diǎn)在于當(dāng)目標(biāo)未被遮擋時, 跟蹤精度非常高、 跟蹤非常穩(wěn)定。但其缺點(diǎn)首先是費(fèi)時, 當(dāng)搜索區(qū)域較大時情況尤其嚴(yán)重; 其次, 算法要求目標(biāo)變形不大, 且不能有太大遮擋, 否則相關(guān)精度下降會造成目標(biāo)的丟失。近年來, 對基于區(qū)域的跟蹤方法關(guān)注較多的是如何處理模板變化時的情況, 這種變化是由運(yùn)動目標(biāo)姿態(tài)變化引起的, 如果能正確預(yù)測目標(biāo)的姿態(tài)變化, 則可實(shí)現(xiàn)穩(wěn)定跟蹤。4)基于模型的跟蹤基于模型的跟蹤是通過一定的先驗(yàn)知識對所跟蹤目標(biāo)建立模型, 然后通過匹配跟蹤目標(biāo)進(jìn)行模型的實(shí)時更新。對于剛體目標(biāo)來說, 其運(yùn)動狀態(tài)變換主要是平移、 旋轉(zhuǎn)

18、等, 可以利用該方法實(shí)現(xiàn)目標(biāo)跟蹤。但是實(shí)際應(yīng)用中跟蹤的不僅僅是剛體, 還有一大部分是非剛體, 目標(biāo)確切的幾何模型不容易得到。這種方法不易受觀測視角的影響, 具有較強(qiáng)的魯棒性, 模型匹配跟蹤精度高, 適合于機(jī)動目標(biāo)的各種運(yùn)動變化, 抗干擾能力強(qiáng), 但由于計(jì)算分析復(fù)雜、 運(yùn)算速度慢, 模型的更新較為復(fù)雜, 實(shí)時性較差。準(zhǔn)確建立運(yùn)動模型是模型匹配能否成功的關(guān)鍵。3.4運(yùn)動目標(biāo)的特征運(yùn)動目標(biāo)的特征,是判斷一個目標(biāo)區(qū)別于另外一個目標(biāo)的重要依據(jù)。有效的運(yùn)動目標(biāo)特征集可以準(zhǔn)確地區(qū)分不同目標(biāo)。運(yùn)動目標(biāo)特征的提取是實(shí)現(xiàn)運(yùn)動目標(biāo)分類的重要步驟。運(yùn)動目標(biāo)分類方法概述 目前,基于視頻的運(yùn)動目標(biāo)分類方法已經(jīng)有很多,主要

19、有3類:基于靜態(tài)特征的分類,基于動態(tài)特征的分類和基于靜態(tài)、動態(tài)特征相結(jié)合的分類。 1)基于靜態(tài)特征的分類 基于靜態(tài)信息的分類,即利用檢測出來的運(yùn)動區(qū)域的形狀、顏色等物理特征進(jìn)行目標(biāo)分類的方法。Lipton 等利用離散度和面積信息對運(yùn)動區(qū)域進(jìn)行分類,區(qū)分人、車、及混亂擾動,并利用時間一致性約束使分類更準(zhǔn)確,把除人、車外的目標(biāo)當(dāng)成干擾物,實(shí)現(xiàn)簡單。Zang 等人利用長寬比、角點(diǎn)特征對運(yùn)動區(qū)域進(jìn)行分類,區(qū)分人、汽車。Rivlin、Bogomolov 等利用外接橢圓的長寬比以及星形骨架等形狀特征,區(qū)分人、動物、汽車。Hu 等定義了目標(biāo)輪廓上的點(diǎn)與幾何中心的距離為“中距離”,利用中距離的離散度、最大中距

20、離與最小中距離的比值作為分類特征,區(qū)分人、自行車、汽車。方帥等利用最大互信息獲得一組可靠、獨(dú)立且具辨認(rèn)力的目標(biāo)特征集,并用有向無環(huán)圖的多類支持向量機(jī)進(jìn)行分類,區(qū)分人、汽車。Otoom 等人以角點(diǎn)的個數(shù)、圓的個數(shù)、離散度為分類特征,區(qū)分機(jī)場周圍的人、人群、包裹、手推車,該文分類效果較差,主要是因?yàn)橥粋€目標(biāo)角點(diǎn)的個數(shù)與離攝像頭遠(yuǎn)近差別很大,而且圓的個數(shù)判斷人、人群依賴目標(biāo)姿勢。 2)基于動態(tài)特征的分類 基于動態(tài)特征的分類,即利用人體運(yùn)動的周期性或其他與運(yùn)動相關(guān)的特征進(jìn)行目標(biāo)分類的方法。采用靜態(tài)特征往往會造成在特征提取上對姿勢依賴的問題,而有效的動態(tài)特征可以減少對姿勢的依賴。Cutler 與 Da

21、vis 對目標(biāo)隨著時間變化的自相關(guān)特性進(jìn)行計(jì)算,再通過時頻化方法分析目標(biāo)是否存在周期性的運(yùn)動特征而將人識別出來。Yang Ran 與 Tsaac Weiss,基于周期性分類人和車輛,對目標(biāo)較小、圖像分辨率低的航空和紅外圖片有比較好的分類效果。Javed、Shah 等利用是否有人體周期性運(yùn)動特征、圓的個數(shù)等特征,分類人、人群和車輛。3) 基于靜態(tài)與動態(tài)特征相結(jié)合的分類 Bogomolov、Dror 等的系統(tǒng)是基于目標(biāo)靜態(tài)特征和動態(tài)運(yùn)動特性相結(jié)合進(jìn)行目標(biāo)分類的,采用了屬于同類目標(biāo)的靜態(tài)輪廓的相似性和身體的傾斜角、腳之間的距離等運(yùn)動特征,用支持向量機(jī)分類器進(jìn)行分類,提高了精確度和魯棒性。Aggarw

22、al 等利用緊湊度值以及運(yùn)動方向的變化量,區(qū)分人、人群、汽車、自行車,運(yùn)動方向的變化量區(qū)分度不是很好。Li 等使用速度、長寬比、離散度等特征,以 BP 神經(jīng)網(wǎng)絡(luò)作為分類器,區(qū)分交通場景中的人、自行車,較好地對復(fù)雜場景下人、自行車進(jìn)行分類。  常見的運(yùn)動目標(biāo)特征分析 一個運(yùn)動目標(biāo)特征往往無法識別三個以上的目標(biāo),或者識別的準(zhǔn)確率不夠高,一般目標(biāo)分類研究都是選擇至少兩個特征。通用特征指的是能反映所有目標(biāo)特性的特征;屬性特征,顧名思義,某個目標(biāo)的所固有的特征是特別能反映該目標(biāo)特性的特征。 1)運(yùn)動目標(biāo)的通用特征 常見的通用特征主要有面積、長寬比、離散度、空隙率(緊湊度)等。目標(biāo)面積是在像素平

23、面的投影面積,不是目標(biāo)的實(shí)際目標(biāo),同一位置的不同目標(biāo)大小各異,但是攝像機(jī)拍攝的目標(biāo)近大遠(yuǎn)小,即使是同一目標(biāo),攝像頭拍攝的距離不同,面積也是不一樣的,在固定單攝像機(jī)的情況下,面積對不同類目標(biāo)之間的區(qū)分度不是很大;攝像機(jī)標(biāo)定后該特征有一定的應(yīng)用。長寬比即目標(biāo)外接矩形的長寬比例,與距離攝像頭遠(yuǎn)近無關(guān),具有歸一化的特性,能真實(shí)反映目標(biāo)的形狀比例,是最常用的一種目標(biāo)特征。離散度即運(yùn)動目標(biāo)周長的平方與面積的比值,外形越復(fù)雜的目標(biāo),離散度越大;對于目標(biāo)碎片比較多的運(yùn)動目標(biāo),由于目標(biāo)的輪廓準(zhǔn)確獲取不易,離散度計(jì)算比較復(fù)雜并且計(jì)算的準(zhǔn)確性無法保證??障堵始茨繕?biāo)外接矩形內(nèi)部非目標(biāo)像素點(diǎn)所占的比例,與其相反的特征就

24、是緊湊度。 2)運(yùn)動目標(biāo)的屬性特征 人的屬性特征主要有圓、人體運(yùn)動周期性等。人頭近似圓,從人的頭頂往下的角度看,人頭所在位置可以檢測到圓;研究中發(fā)現(xiàn)圓特征嚴(yán)重依賴目標(biāo)角度、姿勢,正面、側(cè)面的角度下,圓特征不明顯、人頭所在位置常常無法檢測到圓。人體運(yùn)動周期性特征反映的是人體步態(tài)的規(guī)律性變化,周期性特征的提取對目標(biāo)的觀察角度有很高的要求,只有人體目標(biāo)偏側(cè)面才能準(zhǔn)確提取到該特征。 汽車的屬性特征主要有運(yùn)動速度、離散度變化量等。運(yùn)動速度即相鄰兩幀的目標(biāo)像素距離與時間間隔的比值,該特征在一定程度上反應(yīng)了目標(biāo)在視頻圖像中的運(yùn)動快慢,汽車的運(yùn)動速度比較快;但是由于目標(biāo)在不同的視頻中所處的環(huán)境和位置不同,攝像

25、頭拍攝的角度和距離也不同,該特征與面積特征一樣,只有進(jìn)行攝像機(jī)標(biāo)定后,才有實(shí)際應(yīng)用意義。離散度變化量反映了各個目標(biāo)的變化幅度。離散度變化量特征與離散度一樣,計(jì)算比較復(fù)雜并且計(jì)算的準(zhǔn)確性無法保證??障堵首兓坑?jì)算簡單,也能反映各個目標(biāo)的變化幅度,并且在目標(biāo)碎片比較多的情況下也能很好的提取,可以較好地替代離散度變化量特征。自行車既不是剛體,也不是非剛體,是一種介于剛體(汽車)與非剛體(人)的目標(biāo)。目前很少有文獻(xiàn)提起自行車行之有效的屬性特征,其特征一般都是介于人、汽車之間。運(yùn)動目標(biāo)特征的選取 由于實(shí)驗(yàn)中提取到的前景目標(biāo)存在多角度、目標(biāo)含有少量影子、目標(biāo)區(qū)域提取不完整和目標(biāo)較小等情況,采用基于形狀的特征分類目標(biāo),可較好地適應(yīng)這些情況。因此,我們參賽的特征主要是基于形狀的特征。目標(biāo)基于形狀的特征主要有目標(biāo)輪廓、面積、長寬比、離散度、質(zhì)心、外接矩形等。目前研究中廣泛使用的目標(biāo)特征主要有長寬比P、面積

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論