


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第 25卷 第 2期 2010年 4月 鄭州輕工業(yè)學(xué)院學(xué)報 (自然科學(xué)版 ) J RNAL O F ZH ENG ZHOU U N I ER S I O F L I OU V TY GHT I NDU STRY ( N atu ral Science) V o . 25 N o 2 l . A pr 2010 . 文章編號: 1004- 1478( 2010) 02- 0082- 03 基于 Gabor變換和 BP神經(jīng)網(wǎng)絡(luò)的 人臉檢測算法的 M atlab實現(xiàn)王麗娟 (中北大學(xué) 信息與通信工程學(xué)院, 山西 太原 030051) 摘要: 提出了一種基于 Gabor變換和 BP 神經(jīng)網(wǎng)絡(luò)的人臉檢測
2、算法. 該算法以 M atlab為平臺, 運用 Ga bor小波變換實現(xiàn)圖像特征的提取, 并對所提取的特征進行降維處理, 通過構(gòu)造 2層 BP 神經(jīng)網(wǎng)絡(luò), 對 從 ORL 人臉庫中提取的樣本進行訓(xùn)練學(xué)習(xí)并利用模板匹配及形態(tài)學(xué)腐蝕和膨脹處理, 實現(xiàn)對測試樣 本的人臉檢測. 試驗結(jié)果表明, 該算法計算復(fù)雜度低, 運算快, 對正面人臉的檢測與定位準確性較高. 關(guān)鍵詞: 人臉識別; G abor變換; BP神經(jīng)網(wǎng)絡(luò) 中圖分類號: TP334 4 文獻標志碼: A Face detection realization by M atlab using Gabor wavelet and BP WANG
3、L i ju an (C ollege of Infor. and Com. Eng., N orth Un iv of China, T aiyuan 030051, China ) Abstract A face detect io n algorith based on Gabor transfor and BP neura l netw ork w as proposed It : m m runs in th e platfor of M atlab, and uses the G abor w ave let transfor for i age feature extractio
4、n then m m m , m akes reductio n of di ensionality, constructs a tw o BP N eural netw orks to train the sam ples extracted m from the ORL face database and fin ally do the face detection for th e test samp le usin g tem plate m atch in g and m orpho lo g ical erosio n and d ilat io n processin g The
5、 resu lts show th a, the a lg orithm has low com plex i . t ty, qu ick operation and high veracity in detect ing and locat ing th e rig ht frontal face . K ey w ords: face detection Gabo r w avele; BP neura l ne t ork ; t w 的不同, 常用的人臉識別方法有基于幾何特征的識 別方法、 基于統(tǒng)計特征的識別方法和基于連接機制 的識別方法 2 0 引言近年來, 隨著 計算機技術(shù)的迅
6、速發(fā)展, 人臉識 別技術(shù)得到廣泛研究與開發(fā), 成為模式識別和圖像 處理中最熱門的研究方向之一. 人臉檢測是指在輸 入圖像中, 確定所有人臉 ( 若存在 ) 的位置、 大小、 位 姿的過程 1 . 本文以 M at lab為平臺, 提出基于 Gabor變換與 BP 神經(jīng)網(wǎng)絡(luò)的人臉檢測算法, 以期實現(xiàn)計算復(fù)雜度 低、 識別準確率高的效果. , 是人臉識別技 術(shù)的核心內(nèi)容. 人臉識 別系統(tǒng)可使用的特征通常包括視覺特征、 像素統(tǒng)計 特征、 變化系數(shù)特征、 代數(shù)特征. 根據(jù)人臉表征方式收稿日期: 2009- 05- 15 作者簡介: 王麗娟 ( 1984 1 G abor小波變換人臉檢測算法框圖如圖 1
7、所示. ), 女, 湖南省新化縣人, 中北大學(xué)碩士研究生, 主要研究方向 為圖像處理. 第 2期 王麗娟: 基于 G abo r變換與 BP神經(jīng)網(wǎng)絡(luò)的人臉檢測算 法的 M atlab實現(xiàn) 83 到獲取的文件數(shù)目, 于是再使用 i read 圖像讀取命 m 令, 就能實現(xiàn)所有樣本圖像數(shù)據(jù)的讀取. 3 2 Gabor小波變換提取圖像特征 . 利用矩陣翻轉(zhuǎn)命令 f lirp lr與矩陣循環(huán)平移命令 圖 1 人臉檢測算法框圖 G abor小波變換被廣泛 應(yīng)用于計算機視 覺、 紋 理分析、 模式識別等領(lǐng)域. 二維 Gabor小波可以同時 在空域、 時域和方向上獲得 最佳的分辨率, 可以很 好地模擬哺乳動
8、物視覺神經(jīng)簡單細胞 的感受野輪 廓 3 c ircsh ift實現(xiàn)對所讀取圖像的 10 種不同的鏡像, 將 這些圖像數(shù)據(jù)分別與 Gabor核函數(shù)做卷積處理, 并 將變換結(jié)果轉(zhuǎn)換成矢量形式, 以便以該矢量為輸入 進行 BP 訓(xùn)練, 這樣就完成了圖像數(shù)據(jù)特征的提取. 定義一個細胞矩陣 I GDB= ce ll( 3, ) , 其中 I G M M DB 1用來存取圖像的文 件名; I GDB 2 存取分 M 類信 息, 這 里設(shè) 人 臉 圖 像為 0 9 非 人 連 圖 像 為 . , - 0 9, 利用該信息可進行圖像分 類; I GDB 3 存 M 取所提取圖像相應(yīng)的特征信息. Gabor變換
9、的 M atlab實現(xiàn)代碼如下: function Psi = G abor ( w, nu m u, Kmax , sig ) , , f % w: W indo 32 32 w % nu: Scale 0 . . 4 , mu : O rienta tion 0. . . 7 . . G abor變換屬于加窗傅立葉變換, 二維 Gabor 4 函數(shù)可以表示為 gMN ( x, y ) = exp ik 其中, k = kx ky = k 2 2 exp k (x + y ) 2 2 2 2 2 2 x y u u - exp ;k = 2 2 , u k cos k sin ( v + 2
10、) 2 =u k . % Km ax = pi/2, f = sqrt( 2), sig = 2* pi/3 m = w ( 1); n = w ( 2); K = Km ax / fnu * K real = rea l( K ); K i ag = i ag( K ) ; m m NK = K rea l2+ K i ag 2 m ; P si = zeros( m, n); fo r x = 1: m fo r y = 1: n Z = X - m /2; y- n /2; P si( x y) = ( sig ( - 2) ) * exp( ( - . 5) * NK* ( Z ( 1
11、) , 2+ Z( 2) 2) /( sig 2) )* . . . ( exp( * K real K i ag * Z ) - exp( - ( s ig 2) /2) ); i m end end exp( * mu* pi/8); i V 的取值決定了 G abor濾波的波長, M 的取值 表示 Gabor核函數(shù)的方向, K 表示總的方向數(shù), 參數(shù) k 決定了高斯窗口的大小, 這里取 = 3 /2 5個 , 頻率 ( v= 0 1 . . . , 4) , 8個方向 ( 即 K = 8 u = 0 , , , , 1 . . . , 7) , 共 40個 Gabor核函數(shù). , 2 B
12、P神經(jīng)網(wǎng)絡(luò) BP 神經(jīng)網(wǎng)絡(luò)是一種單向傳播的多層前向網(wǎng)絡(luò), 包括輸入層、 隱含層和輸出 層. 上下層 之間實現(xiàn)全 連接, 而每層神經(jīng)元之間無 連接. BP 網(wǎng)絡(luò)是 ! 誤差 逆?zhèn)鞑ニ惴??, 它的傳 遞函數(shù)是非線性函數(shù)最常用 的是 lonsig和 tansig 函數(shù). 理論證明在不限制隱層節(jié) 點數(shù)的情況下, 2層 ( 只有 1個隱層 )的 BP 網(wǎng)絡(luò)可以 實現(xiàn)任意的非線性映射. 在模式樣本相對較少的情 況下, 較少的隱層節(jié)點, 可以實現(xiàn)模式 樣本空間的 超平面劃分, 因此, 選擇 2層 BP 網(wǎng)絡(luò)就可以滿足要 求了 5 3 3 BP 網(wǎng)絡(luò)構(gòu)建 . 經(jīng)過多次的 訓(xùn)練測試, 筆者 構(gòu)建了含 10個
13、輸 入神經(jīng)元、 6個隱層神經(jīng)元和 1個輸出 神經(jīng)元的 2 層 BP 網(wǎng)絡(luò). 網(wǎng)絡(luò) 輸入為 I GDB 3 , 訓(xùn)練 目標 為 M M I GDB 2, 訓(xùn)練函 數(shù)采用 變梯度 算法 SCG. 構(gòu) 建 BP 網(wǎng)絡(luò), 隱層神經(jīng)元數(shù)的選擇沒有理想的 解析式 可供參照, 是個 十分復(fù)雜的問題. 參考前人的經(jīng) 驗 公式 n = 的常數(shù). 3 4 對測試樣本進行檢測 . 存儲一些人臉模板, 計算待測區(qū)域與標準模板 n1 + n0 + a , 式中 n 為隱層節(jié)點數(shù), n 1 2 . 3 M atlab實現(xiàn)過程 3 1 樣本圖像信息讀取 從 ORL 人臉庫中提取了 69 幅人臉圖像和 59 幅非人臉樣本,
14、大小為 18 # 27 將其分別存 放在 2 , 個文件夾下, 利用 M atlab的 d ir命令可以讀取整個 文件夾中某一格式的文件信息, 而 size命令可以得 為輸入節(jié)點數(shù), n0 為輸 出節(jié)點數(shù), a 為 1 10之 間 84 鄭州輕工業(yè)學(xué)院學(xué)報 ( 自然科學(xué)版 ) 2010年 的相似程度 ( 或稱相關(guān)性 ) , 利用這一相似度可以判 斷某一區(qū)域是否為人臉. 然后利用 bw labeln 函數(shù)求 得連通區(qū)域, 圖像分析函數(shù) reg io nprops可用來度量 圖像區(qū)域?qū)?性的函數(shù), 從 而實現(xiàn)人臉圖 像的檢測. 人臉區(qū)域檢測的 M atlab實現(xiàn)代碼如下: xy_ = Ce l.
15、net > T hresho ld; l xy_ = i reg iona l ax ( xy_) ; m m xy_ = i d ilate ( xy _ stre l( d isk,' 2 4) ); m , ' , L abeM atrix, nL abel = bw labe ln( xy_ 4) ; l , Cen tro idM atrix = reg ionprops( LabeM atr ix c l , 'entro id )' xy_ = ze ros(m, n) ; for i = 1: nL abe l xy_( fix( Cen
16、tro id atrix ( i). Centro id( 2) ), . . . M fix( Centroid a trix( i). Centro id( 1) ) ) = 1 M ; end xy_ = draw rec( xy _ 27 18 ); , m i _ou t (: , : , 1) = i ; m m i _ou t (: , : , 2) = i ; m m i _ou t (: , : , 3) = i ; m for i = 1: m for j= 1: n if xy_( , j) = = 1 i m i _ou t ( , , 1) = 0; i j m i
17、_ou t ( , , 2) = 255; i j m i _ou t ( , , 3) = 0; i j end end end 圖 2 部分人臉檢測結(jié)果 部最小. 此外, 目前還沒有確定 隱層神經(jīng)元數(shù)的 有 效方法, 容易導(dǎo)致欠適 配或過適配的 情況出現(xiàn), 這 些問題還有待在今后的研究工作中加以解決. 參考文獻 : 1 2 3 樊振萍. 人臉檢測與識 別技術(shù)綜述 J. 人工智能 識別 技術(shù), 2008( 1): 1292. 馮素玲. 人臉 識別 常用方 法研 究 J. 微計算 機信 息, 2004( 20) : 94. 彭仕玉, 張國云. 基于 G abor小波支持向量機的 人臉檢 測 J . 湖 南 理 工 學(xué) 院 學(xué) 報: 自 然 科 學(xué) 版, 2008 ( 21): 20 . 4 5 池萬樂. 基于 G abor于支持 向量機 的人臉 識別 J. 電 腦知識與技術(shù), 2005( 12): 98 . 楊 淑瑩. 模 式識 別 與 智 能計 算 M a tlab技 術(shù) 實 現(xiàn) M . 北京: 北 京電子工業(yè)出版社,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人工智能與醫(yī)學(xué)的融合創(chuàng)新
- 手術(shù)室恢復(fù)室護理
- 禹城公務(wù)員試題及答案
- 用藥法律法規(guī)試題及答案
- 銀行運管條線面試題目及答案
- 銀行崗位筆試題庫及答案
- 醫(yī)院安全消防試題及答案
- 2025年蘇教版數(shù)學(xué)六年級下冊期末測試題及答案(典型題)(六)
- 煙臺歷年公務(wù)員面試題及答案
- 學(xué)校消防測試題及答案
- 《獻給阿爾吉儂的花束》讀后感優(yōu)秀5篇
- 中醫(yī)臨床路徑
- 輻射及其安全防護(共38張PPT)
- 初中信息技術(shù)-算法基礎(chǔ)知識教學(xué)教學(xué)課件
- 訴訟文書送達地址確認書
- 《中興通訊績效管理制度》-人事制度表格【管理資料】
- 鐵路工務(wù)技術(shù)手冊
- (完整版)硬件測試規(guī)范
- 電腦節(jié)能環(huán)保證書
- DBJ∕T 13-183-2014 基樁豎向承載力自平衡法靜載試驗技術(shù)規(guī)程
- 烤煙田間成熟度的辨別
評論
0/150
提交評論