智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第1頁
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第2頁
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第3頁
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第4頁
智能機(jī)器人原理與應(yīng)用 課件 第10章 智能機(jī)器人的前沿 AI技術(shù)_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

北京信息科技大學(xué)自動化學(xué)院智能機(jī)器人原理與應(yīng)用“智能檢測技術(shù)與模式識別”研究所北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》第十章智能機(jī)器人的前沿AI技術(shù)“人工智能”的概念第一次提出是在1956年的達(dá)特茅斯人工智能研究會議上。當(dāng)時的科學(xué)家主要討論了計算機(jī)科學(xué)領(lǐng)域尚未解決的問題,期待通過模擬人類大腦的運(yùn)行解決一些特定領(lǐng)域的具體問題。首次提出了把利用計算機(jī)進(jìn)行的復(fù)雜信息處理稱為“人工智能”(artificial

intelligence),簡稱AI。簡言之,人工智能是研究開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)科學(xué),其主要目標(biāo)是使人工智能機(jī)器能夠勝任那些需要人類智能才能完成的專業(yè)工作。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.1新一代人工智能技術(shù)

人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.1新一代人工智能技術(shù)

人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。AI的第1次浪潮。第1次浪潮與圖靈和他在1950年提出的“圖靈測試”緊密相關(guān)。1966年MIT的教授Weizenbaum發(fā)明了一個可以和人對話的小程序———Eliza,轟動世界。AI的第2次浪潮。第2次浪潮出現(xiàn)在1980—1990年代,語音識別是最具代表性的幾項突破性進(jìn)展之一。AI的第3次浪潮。第3次浪潮始于2006年,很大程度上歸功于深度學(xué)習(xí)的實(shí)用化進(jìn)程。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.2機(jī)器人智能化在人工智能的加持下,智能化機(jī)器人應(yīng)運(yùn)而生。機(jī)器人的外延及邊界已被擴(kuò)大數(shù)倍,新物種的誕生及傳統(tǒng)設(shè)備的智能化將共同驅(qū)動“機(jī)器人”產(chǎn)業(yè)以十倍及百倍速度增長。人工智能技術(shù)帶給機(jī)器人質(zhì)的改變,主要在于以下兩個方面:10.2.1機(jī)器人是人工智能的實(shí)體化(1)智能化大幅提升。(2)智能化場景適用性提升。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.2機(jī)器人智能化智能化是逐步讓機(jī)器人具有自主智能,其發(fā)展路徑從學(xué)習(xí)單一任務(wù)開始,舉一反三,逐步達(dá)到與環(huán)境動態(tài)交互的主動學(xué)習(xí),最終實(shí)現(xiàn)自我進(jìn)化的高級智能。人工智能主要解決機(jī)器人智能化所需要的算法和技術(shù),具體包括以下3方面要素。10.2.2機(jī)器人智能化三要素1.感知要素機(jī)器人的感覺器官用來認(rèn)識周圍環(huán)境狀態(tài)以及和外界環(huán)境進(jìn)行交互,包括能感知視覺、接近、距離等的非接觸型傳感器和能感知力、壓覺、觸覺等的接觸型傳感器等。2.決策要素決策要素也稱為思考要素,根據(jù)傳感器收集的數(shù)據(jù)思考出采用什么樣的動作。智能機(jī)器人的決策要素是3個要素中的關(guān)鍵,包括判斷、邏輯分析、理解等方面的智力活動。3.控制要素控制要素也稱為運(yùn)動要素,是對外界做出反應(yīng)性動作.北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)機(jī)器人發(fā)展的趨勢是人工智能化,深度學(xué)習(xí)是智能機(jī)器人的前沿技術(shù),也是機(jī)器學(xué)習(xí)領(lǐng)域的新課題。深度學(xué)習(xí)可以簡單理解為多層的神經(jīng)網(wǎng)絡(luò)模型,這里簡約介紹幾種典型的神經(jīng)網(wǎng)絡(luò)架構(gòu)。10.3.1深度學(xué)習(xí)在感知機(jī)的基礎(chǔ)上,研究人員提出一種新的網(wǎng)絡(luò)結(jié)構(gòu)———CNN。CNN的本質(zhì)是一種采用監(jiān)督方式訓(xùn)練的面向兩維形狀不變性識別的特定多層感知機(jī),每層由多個二維平面組成,而每個平面由多個獨(dú)立神經(jīng)元組成,專門用來處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。如圖所示,CNN的結(jié)構(gòu)大致可以分為3層:卷積層、池化層和全連接層。1.卷積神經(jīng)網(wǎng)絡(luò)CNN北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)1)卷積層卷積層依賴于卷積計算,通過卷積運(yùn)算可以提取輸入圖像的特征,使得原始信號的某些特征增強(qiáng),并且在一定程度上降低噪聲。利用不同卷積算子對圖像進(jìn)行濾波,得到顯著的邊緣特征。10.3.1深度學(xué)習(xí)2)池化層池化層的原理是對圖像進(jìn)行下采樣,在減少數(shù)據(jù)處理量的同時保留有用信息。因此池化層的主要作用是在語義上把相似的特征合并起來,具有一定程度的位移、尺度、形變的魯棒性,可以消除輸入圖像的部分畸變與位移等的影響。3)全連接層全連接層采用softmax全連接,得到的激活值即卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征。卷積后得到多組特征,池化后會對特征進(jìn)行聚合。卷積池化的多次疊加自動提取圖片中的低級、中級、高級特征,實(shí)現(xiàn)對圖片的高精度分類。1.卷積神經(jīng)網(wǎng)絡(luò)CNN北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)VGG是牛津大學(xué)科學(xué)工程系計算機(jī)視覺組(visualgeometrygroup)2014年提出的。在其發(fā)表的論文中,一共提及4種不同深度層數(shù)的卷積神經(jīng)網(wǎng)絡(luò),分別是VGG11、VGG13、VGG16和VGG19。這幾種網(wǎng)絡(luò)結(jié)構(gòu)除了網(wǎng)絡(luò)深度,本質(zhì)并沒有什么區(qū)別,增加網(wǎng)絡(luò)的深度能夠在一定程度上影響網(wǎng)絡(luò)的最終性能。在VGG網(wǎng)絡(luò)中,通過使用多個較小卷積核(3×3)的卷積層可以替代一個卷積核較大的卷積層,這也是VGG系列網(wǎng)絡(luò)的一大特色之一。使用小卷積核不僅可以減少參數(shù),還可以進(jìn)一步增加網(wǎng)絡(luò)的擬合能力。更深的層數(shù)和逐漸遞增的通道數(shù),也使得VGG網(wǎng)絡(luò)可以從數(shù)據(jù)中獲取更多的信息。2.卷積神經(jīng)網(wǎng)絡(luò)VGG北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)3.殘差神經(jīng)網(wǎng)絡(luò)ResNetResNet中最重要的結(jié)構(gòu)就是殘差塊,是由多個卷積層相互連接形成的。形成的每一個殘差塊相互連接,每個殘差塊利用了恒等跳躍式連接的方式。如圖所示輸入直接來自給定的圖像數(shù)據(jù),然后用于訓(xùn)練每個殘差塊中的網(wǎng)絡(luò)結(jié)構(gòu),這也被稱為恒等映射。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)3.殘差神經(jīng)網(wǎng)絡(luò)ResNet傳統(tǒng)的卷積網(wǎng)絡(luò)或全連接網(wǎng)絡(luò)在信息傳遞時或多或少會存在信息丟失、損耗等問題,還有導(dǎo)致梯度消失或者梯度爆炸,導(dǎo)致很深的網(wǎng)絡(luò)無法訓(xùn)練。ResNet在一定程度上解決了這個問題,通過直接將輸入信息繞道傳到輸出保護(hù)信息的完整性,整個網(wǎng)絡(luò)只需要學(xué)習(xí)輸入、輸出差別的那一部分,簡化學(xué)習(xí)目標(biāo)和難度??梢?ResNet的結(jié)構(gòu)可以極快地加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,模型的準(zhǔn)確率也有較大的提升。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法YOLO算法是經(jīng)典的目標(biāo)檢測算法之一,隨著算法的改進(jìn),版本也從YOLOV1逐漸演變到了YOLOV7。最經(jīng)典的YOLOV1是典型的端到端目標(biāo)檢測算法,采用卷積神經(jīng)網(wǎng)絡(luò)提取特征,主干特征提取網(wǎng)絡(luò)的基礎(chǔ)是GooLeNet,與其他目標(biāo)檢測算法不同的是,它使用劃分網(wǎng)格的策略來對目標(biāo)進(jìn)行檢測。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法如圖10.5所示,YOLOV1的檢測流程如下北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法(1)劃分網(wǎng)格。將原圖像劃分為7×7的網(wǎng)格。(2)生成預(yù)測框。每個網(wǎng)格生成2個邊界預(yù)測框和置信度信息,進(jìn)行物體的框定和分類,一共有98個邊界預(yù)測框。(3)置信度計算。計算每個預(yù)測框的置信度信息。(4)去除重復(fù)框。通過非極大值抑制得到最后的預(yù)測框。置信度包含預(yù)測框中含有目標(biāo)的可能性和預(yù)測框的準(zhǔn)確度。假設(shè)YOLOV1算法可以檢測出n種類別的目標(biāo),則該單元格中檢測出的目標(biāo)屬于n個分類的置信度概率可以表示為Pr(classi|object)。各個邊界框類別的置信度如下所示:1)YOLOV1算法流程式中,Pr(classi)*IoU是置信度,而IoU是預(yù)測框和實(shí)際框的交并比。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法(1)執(zhí)行速度快。由于YOLOV1算法的流程比較簡單,執(zhí)行檢測任務(wù)時,不需要提取輸入內(nèi)容的候選區(qū)域,因此與其他目標(biāo)檢測算法相比,執(zhí)行速度很快,基本能達(dá)到40到50fps。而在V1算法的基礎(chǔ)上進(jìn)行輕量化處理的FastYOLO算法,其檢測速度甚至能達(dá)到標(biāo)準(zhǔn)YOLOV1算法的3倍以上。(2)準(zhǔn)確率高。當(dāng)輸入的圖片中待檢測目標(biāo)與背景相近時,不會將背景誤檢成目標(biāo),背景誤檢率比較低;除此之外,其他目標(biāo)檢測算法是基于滑動窗口的,每個滑動窗口的大小不一,無法在整體上對輸入圖片進(jìn)行檢測,而YOLOV1支持輸入整張圖片,無須采用滑動窗口的方式,所以極少會出現(xiàn)將背景誤檢為目標(biāo)的情況,因此檢測的準(zhǔn)確度較高。(3)泛化能力強(qiáng)。檢測比較抽象的圖片時,例如國畫、油畫等畫作,能夠很好地學(xué)習(xí)目標(biāo)的概化特征,降低檢測的錯誤率。因此,YOLO系列算法具有優(yōu)秀的檢測速度和通用性。2)YOLO算法的優(yōu)勢北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.2生成式對抗網(wǎng)絡(luò)GAN2014年,蘭·吉德費(fèi)羅等人首次提出生成式對抗網(wǎng)絡(luò)(generative

adversarial

nets,GAN),通過生成器和判別器互相競爭對抗來生成數(shù)據(jù),引起學(xué)術(shù)界的關(guān)注。經(jīng)理論與工程驗(yàn)證,GAN網(wǎng)絡(luò)在圖像、文本、音頻等領(lǐng)域具有廣泛的適用性。GAN的基本結(jié)構(gòu)如圖所示,它由一個生成模型(generative

model,G)和一個判別模型(discriminative

model,D)構(gòu)成。生成模型可以看作一個樣本生成器,通過輸入一個隨機(jī)噪聲Z并且模仿真實(shí)數(shù)據(jù)樣本的分布,盡可能使生成的假樣本擁有與真實(shí)樣本一致的概率分布。判別模型用來判別輸入的樣本是否為真實(shí)樣本,輸出值為0或1,相當(dāng)于一個二分類過程。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.2生成式對抗網(wǎng)絡(luò)GAN訓(xùn)練GAN網(wǎng)絡(luò)相當(dāng)于動態(tài)博弈過程,通過交替訓(xùn)練GAN的生成模型與判別模型不斷地調(diào)整參數(shù),最終使判別器無法判別生成器的輸出結(jié)果是否為真,達(dá)到使生成器生成以假亂真數(shù)據(jù)樣本的目的。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)2016年,DeepMind公司主要基于強(qiáng)化學(xué)習(xí)算法研發(fā)的AlphaGo程序擊敗人類頂尖的職業(yè)圍棋選手這一消息震驚了全世界。強(qiáng)化學(xué)習(xí)方法起源于動物心理學(xué)的相關(guān)原理,模仿人類和動物學(xué)習(xí)的試錯機(jī)制,是一種通過與環(huán)境交互,從學(xué)習(xí)狀態(tài)到行為的映射關(guān)系,以獲得最大累積期望回報的方法。狀態(tài)到行為的映射關(guān)系也即策略,表示在各個狀態(tài)下智能體采取的行為或行為概率。強(qiáng)化學(xué)習(xí)最大的特點(diǎn)是在與環(huán)境的交互中進(jìn)行學(xué)習(xí)。在與環(huán)境的互動中,智能體根據(jù)它們獲得的獎勵和懲罰不斷學(xué)習(xí),以更好地適應(yīng)環(huán)境。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)的核心思想是試錯機(jī)制,即讓智能體在與環(huán)境的交互過程中不斷學(xué)習(xí)和反饋,以獲得最大的累計獎勵。通常可以使用馬爾可夫決策過程對RL問題建模,表示為一個五元組(S,P,A,R,γ),其中S代表一個有限的狀態(tài)集合,A代表一個動作集合,P代表一個狀態(tài)轉(zhuǎn)移概率矩陣,R代表一個回報函數(shù),γ代表一個折扣因子,具體的學(xué)習(xí)過程如圖所示。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)為了獲得環(huán)境反饋給智能體的最大獎勵,智能體根據(jù)環(huán)境的即時狀態(tài)St選擇并執(zhí)行它認(rèn)為的最優(yōu)動作At。環(huán)境接受動作At后,以一定概率轉(zhuǎn)移到下一狀態(tài)St+1,并把一個獎勵Rt反饋給智能體,智能體根據(jù)獎勵Rt和當(dāng)前狀態(tài)St+1選擇下一個動作。而t時刻的累計獎勵R就是即時獎勵Rt與后續(xù)所有可能采取的動作和導(dǎo)致的環(huán)境狀態(tài)的價值之和。由于距離當(dāng)前狀態(tài)越遠(yuǎn),不確定性越高,需要乘以一個折扣因子γ來調(diào)整未來的每個即時獎勵對于累計獎勵的影響。累計獎勵公式R表示如下:北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)如果Agent的某個行為策略導(dǎo)致環(huán)境對Agent正的獎賞(reward),則Agent以后采取這個行為策略的趨勢會加強(qiáng)。反之,若某個行為策略導(dǎo)致了負(fù)的獎賞,那么Agent此后采取這個動作的趨勢會減弱。人工智能的目標(biāo)是賦予機(jī)器像人一樣思考的能力。更進(jìn)一步,希望創(chuàng)造出像人類一樣具有自我意識和思考的人工智能。強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)的不同之處在于,監(jiān)督學(xué)習(xí)涉及以執(zhí)行任務(wù)的正確動作集的形式向代理提供反饋。相比之下,強(qiáng)化學(xué)習(xí)使用獎勵和懲罰作為積極和消極行為的信號,它可以從自己的經(jīng)驗(yàn)和行為中學(xué)習(xí),對機(jī)器人自己創(chuàng)建一個高效的自適應(yīng)控制系統(tǒng)至關(guān)重要。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)遷移學(xué)習(xí)主要是運(yùn)用已有的知識對不同但相關(guān)領(lǐng)域的問題進(jìn)行求解,從根本上放寬了傳統(tǒng)機(jī)器學(xué)習(xí)的基本假設(shè)。它打破了傳統(tǒng)機(jī)器學(xué)習(xí)對測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)必須同分布的要求,是一種跨領(lǐng)域、跨任務(wù)的學(xué)習(xí)方法。遷移學(xué)習(xí)可以使訓(xùn)練過程中的時間成本和計算資源大大降低,獲得了廣泛的關(guān)注和應(yīng)用。遷移學(xué)習(xí)的基本思路是從一個或多個源領(lǐng)域(sourcedomain)任務(wù)中抽取知識和經(jīng)驗(yàn),然后應(yīng)用到一個目標(biāo)領(lǐng)域(targetdomain)中去。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)假設(shè)一個有標(biāo)簽的數(shù)據(jù)集為其中,xi為數(shù)據(jù)集中的第i個樣本,yi為其標(biāo)簽。定義χ為描述樣本X的特征空間,P(X)為X的邊緣概率分布,X的特征空間表示為定義γ為描述標(biāo)簽Y的標(biāo)簽空間,f(X)=P(Y|X)為條件概率分布,Y的標(biāo)簽空間表示為在遷移學(xué)習(xí)中,定義域D被定義為由樣本的特征空間及其邊緣概率分布的集合,即D={χ,P(X)};任務(wù)T被定義為由標(biāo)簽的標(biāo)簽空間及目標(biāo)預(yù)測函數(shù)的集合,即T={γ,ft(·)}。對于給定源域Ds和對應(yīng)的任務(wù)Ts,給定目標(biāo)域Dt和對應(yīng)任務(wù)Tt,遷移學(xué)習(xí)旨在Ds≠Dt或Ts≠Tt的條件下,通過在源域Ds和源任務(wù)Ts獲得的知識來幫助模型解決在目標(biāo)域Dt上的目標(biāo)任務(wù)Tt的預(yù)測函數(shù)ft(·),使得ft(·)在目標(biāo)域Dt上擁有最小的預(yù)測誤差。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)遷移學(xué)習(xí)的過程如圖所示。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個不同的類別。現(xiàn)有的遷移學(xué)習(xí)研究大多都建立在源域和目標(biāo)域相似度較高的全局約束下。盡管整個源域數(shù)據(jù)不能直接被用到目標(biāo)域數(shù)據(jù)里,但還是可能在源域中找到一些可以重新被用到目標(biāo)域中的數(shù)據(jù)。基于實(shí)例的遷移學(xué)習(xí)方法根據(jù)一定的權(quán)重生成規(guī)則,對相同或相似的數(shù)據(jù)樣本調(diào)整權(quán)重,進(jìn)行重用,遷移學(xué)習(xí)后的預(yù)測效果更準(zhǔn)確。1.基于實(shí)例的遷移學(xué)習(xí)北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個不同的類別。基于特征的遷移學(xué)習(xí)方法是指通過特征變換的方式進(jìn)行遷移,來減少源域和目標(biāo)域之間的差距。在機(jī)器學(xué)習(xí)的訓(xùn)練過程中,篩選出一些好的有代表性的特征,通過特征變換把源域和目標(biāo)域的特征變換到同樣的空間,使這個空間中源域和目標(biāo)域的數(shù)據(jù)具有相同的分布,然后利用傳統(tǒng)的機(jī)器學(xué)習(xí)進(jìn)行分類和預(yù)測研究。2.基于特征的遷移學(xué)習(xí)北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個不同的類別。假設(shè)源域任務(wù)模型和目標(biāo)域任務(wù)模型之間可以共享一些參數(shù),或者共享模型超參數(shù)的先驗(yàn)分布,基于模型的遷移學(xué)習(xí)方法就是將源域任務(wù)模型可以共享的參數(shù)遷移到新的目標(biāo)域任務(wù)的模型上。在機(jī)器學(xué)習(xí)訓(xùn)練中,這種方法可以節(jié)省大量的時間成本和計算資源,使訓(xùn)練過程更高效、更快捷。3.基于模型的遷移學(xué)習(xí)北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個不同的類別?;陉P(guān)系的遷移學(xué)習(xí)方法重點(diǎn)關(guān)注源域和目標(biāo)域樣本之間的關(guān)系,利用源域中的邏輯網(wǎng)絡(luò)將相似的關(guān)系進(jìn)行遷移,比如生物病毒傳播到計算機(jī)病毒傳播的遷移,師生關(guān)系到上司下屬關(guān)系的遷移。統(tǒng)計關(guān)系學(xué)習(xí)是基于關(guān)系的遷移學(xué)習(xí)方法的主要技術(shù)。4.基于關(guān)系的遷移學(xué)習(xí)北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)智能交互是人與機(jī)器之間使用某種對話語言,以一定的交互方式,為完成確定任務(wù)的人與機(jī)器之間的交換過程。整個交互系統(tǒng)中從接入用戶的輸入信息開始,包括語音、表情、手勢等多模態(tài)信息。我們在對話系統(tǒng)中對輸入的信息進(jìn)行理解,通過這個對話部分以后產(chǎn)生輸出,最后用文字、合成語音或行為展現(xiàn)出來。目前,新型的人機(jī)交互方式主要有語音交互、姿勢交互、觸摸交互、視線跟蹤與輸入交互、腦機(jī)交互、肌電交互、表情交互、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)以及多通道交互等。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)語音交互是讓機(jī)器能夠聽懂人說話,并根據(jù)人的話語執(zhí)行相應(yīng)的命令。語言是人類最重要的交流方式,如果機(jī)器能與人進(jìn)行語音交互,將使人們享受到更加輕松、自然的交互體驗(yàn)。語音交互的關(guān)鍵技術(shù)主要包括語音識別、語音合成和語義理解。語音識別對用戶的語言進(jìn)行特征分析,將其轉(zhuǎn)化為相應(yīng)的文本或計算機(jī)系統(tǒng)可識別的命令;語音合成將文本轉(zhuǎn)換成機(jī)器合成的語音;語義理解技術(shù)是,從語音識別輸出的文本中獲取語義信息從而理解用戶的意圖。10.4.1語音交互北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)姿勢交互是通過穿戴/移動式傳感技術(shù)或計算機(jī)視覺技術(shù)對人體各個部位的狀態(tài)和動作進(jìn)行檢測和識別。穿戴/移動式傳感技術(shù)通過各種傳感設(shè)備主要感知以下3類信息:形狀變化、平移及旋轉(zhuǎn)運(yùn)動、方位與距離。計算機(jī)視覺技術(shù)則是通過各種波長的電磁波來感知軀體動作。利用穿戴/移動式傳感技術(shù)實(shí)現(xiàn)姿勢交互是一種主動感知,其精度較高,但附屬感、侵入性較強(qiáng)。利用計算機(jī)視覺技術(shù)實(shí)現(xiàn)姿勢交互是一種被動感知,不需要穿戴額外的設(shè)備,交互體驗(yàn)更加自然,但對動作和姿勢的識別精度略遜一籌。10.4.2姿勢交互北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)姿勢交互方式利用人的姿勢行為主要分為以下幾類:10.4.2姿勢交互(1)手部與手臂姿勢交互。五指和手臂的運(yùn)動最精細(xì)復(fù)雜。(2)頭部姿勢交互。頭部姿勢包括“空間姿勢”和“移動姿勢”。(3)全身姿勢交互。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)觸覺是人們感知物理世界的重要方式。人全身的皮膚上處處有能感知溫度、濕度、壓力、震動、痛覺等多種感覺的觸覺感覺細(xì)胞,它們在指尖上的分布尤為密集,所以人們的手指觸覺非常敏感,在很多情況下幾乎可以替代視覺和聽覺。因此觸摸式交互界面在人機(jī)交互領(lǐng)域大有可為。觸摸界面是一種“能把數(shù)字信息結(jié)合于日常的實(shí)體物件與物理環(huán)境中,從而實(shí)現(xiàn)對真實(shí)物理世界的增強(qiáng)”的用戶界面。具體而言,就是用戶通過物理操控(如傾斜、擠壓、搖晃等)進(jìn)行輸入,系統(tǒng)感知到用戶輸入后,以改變某物件物理形態(tài)(如顯示、收縮、震動等)的方式為用戶提供反饋。10.4.3觸摸交互不同種類觸摸屏性能對比。P228北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)人們觀察外部世界時,眼睛總是與其他人體活動自然協(xié)調(diào)地工作,并且眼動所需的認(rèn)知負(fù)荷很低,人眼的注視包含著當(dāng)前的任務(wù)狀況以及人的內(nèi)部狀態(tài)等信息,因此眼注視是一種非常好的能使人機(jī)對話變得簡便、自然的候選輸入通道。眼動測量方法經(jīng)歷了早期的直接觀察法、主觀感知法,后來發(fā)展為瞳孔—角膜反射向量法、眼電圖法、虹膜—鞏膜邊緣法、角膜反射法、雙普金野象法、接觸鏡法等。10.4.4視線跟蹤與輸入北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)目前,根據(jù)用戶眼動信息發(fā)揮的不同作用和特點(diǎn),眼動交互技術(shù)可分為視線反饋技術(shù)、視線點(diǎn)擊技術(shù)和視線輸入技術(shù)。(1)基于自然眼動信息的視線反饋技術(shù)。視線反饋技術(shù)指的是一種基于視線眼動信息,通過反饋來促進(jìn)視覺操作績效的交互技術(shù)。(2)基于視線操作的視線點(diǎn)擊技術(shù)。用于點(diǎn)擊操作的眼控技術(shù)主要是通過收集顯示屏上用戶注視點(diǎn)的坐標(biāo),再結(jié)合其他用戶行為來代替?zhèn)鹘y(tǒng)鼠標(biāo)部分功能的交互技術(shù)。(3)利用視線行為進(jìn)行輸入的視線輸入技術(shù)。眼控技術(shù)的另一種重要用途是視線輸入技術(shù),它在用戶對特定輸入規(guī)則進(jìn)行學(xué)習(xí)的基礎(chǔ)上,結(jié)合計算機(jī)的識別和編碼,將視線移動的軌跡序列或一定的停留時間編譯為輸入特定字符的指令,即利用視線動作完成數(shù)字字母等字符的輸入任務(wù)。10.4.4視線跟蹤與輸入北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)腦機(jī)交互是人機(jī)交互的重要方向,依靠人的腦波信號直接識別翻譯成為機(jī)器的指令。顯然,這是一種直接的人機(jī)交互方式,將會對人機(jī)交互方式產(chǎn)生革命性的影響。10.4.5腦機(jī)交互腦機(jī)交互的實(shí)現(xiàn)有賴于腦功能的研究。腦功能的研究手段可分為以下幾類。(1)侵入式腦功能研究。就是把電極植入到腦內(nèi),形成皮質(zhì)腦電圖。(2)非侵入式腦功能研究。一種非侵入式MEG(腦磁信號)設(shè)備,體量通常較大。另一種非侵入式設(shè)備是利用EEG(腦電)信號,特點(diǎn)是設(shè)備非常小,非常便宜,可以做成便攜式裝置,實(shí)用性很好。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)通過腦電識別,人們可以探索人腦,發(fā)現(xiàn)感知認(rèn)知機(jī)理,解釋邏輯推理過程,提供有效的人工智能研究手段和技術(shù)途徑。如圖所示,腦機(jī)接口技術(shù)使用在頭皮或皮層神經(jīng)元記錄的腦電活動,并把它轉(zhuǎn)化為對外界的控制信號。10.4.5腦機(jī)交互腦電信號直接反映人腦的活動和認(rèn)知特性,可以做情緒、疾病的監(jiān)測和腦機(jī)交互。它的應(yīng)用領(lǐng)域和前景非常廣闊,比如在人工智能領(lǐng)域,它可以探索人腦活動和認(rèn)知規(guī)律,在腦機(jī)交互上也可以幫助殘疾人來控制輪椅等設(shè)備。在情緒監(jiān)測上可以感知人的工作狀態(tài)、壓力和焦慮等。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)另一方面,腦電信號分析研究目前仍存在不少問題。主要包括以下幾點(diǎn)10.4.5腦機(jī)交互(1)腦電信號的識別性能。腦電信號的信噪比非常低,因此識別準(zhǔn)確率和計算復(fù)雜度通常難以滿足實(shí)際應(yīng)用需求。在研究中需要發(fā)現(xiàn)新的視覺驅(qū)動與腦電信號的相關(guān)性,即低信噪比腦電信號下的高準(zhǔn)確識別理論。(2)腦電信號的降噪方法。目前,針對腦電信號多通道、強(qiáng)噪聲特點(diǎn)的有效降噪方法和分類理論尚不完善。(3)腦電信號的多通道鑒別分析。針對腦電信號的多通道鑒別分析,現(xiàn)有分類模型和相關(guān)通道選擇問題的思路尚不十分有效,缺乏理論性支持。在研究中,需要尋找和探索更有效的基于思維的腦機(jī)交互范式,探索基于人視覺感知機(jī)理的計算模型。(4)腦機(jī)接口系統(tǒng)模式相對單一。研究中需要解決面向多種范式的思維腦控技術(shù)。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)生肌電一體化是近年來快速發(fā)展的前沿科學(xué)技術(shù),它通過生物體運(yùn)動執(zhí)行系統(tǒng),感知系統(tǒng),控制系統(tǒng)等與機(jī)電裝置(機(jī)構(gòu)、傳感器、控制器等)的功能集成,使生物體或機(jī)電裝備的功能得到延伸。生肌電一體化機(jī)器人與普通機(jī)器人相比,最大的特點(diǎn)就是將“固定在人體上的機(jī)器”發(fā)展為神經(jīng)系統(tǒng)直接控制的運(yùn)動功能替代裝置,由人的神經(jīng)電生理信號來控制假肢的行動。10.4.6肌電交互人體的任何一個動作都是由多組肌群在神經(jīng)系統(tǒng)的支配下相互協(xié)調(diào)、共同完成的。肌肉組織運(yùn)動時會產(chǎn)生微弱的(mV級)電位變化,肌肉的活動信息不但能反映關(guān)節(jié)的伸屈狀態(tài)和伸屈強(qiáng)度,還能反映動作過程中肢體的形狀和位置等信息。可見,獲取肌電信號變化是感知人體動作的重要方式,這可以由安裝在相應(yīng)肌群皮膚表面的表面肌電傳感器來完成。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)目前,表情交互研究主要針對靜態(tài)圖像、圖像序列或視頻中的二維、三維或四維數(shù)據(jù)提出大量的表情識別算法。除對人臉的6種基本表情以及中性表情的分析識別外,還有一些關(guān)于疼痛、微表情等的識別,這大大促進(jìn)了表情識別在醫(yī)學(xué)、心理學(xué)及助老助殘上的應(yīng)用。10.4.7表情交互表情交互是指從給定的人臉靜態(tài)圖像或動態(tài)視頻序列中分離出特定的表情狀態(tài),從而確定被識別對象的心理情緒,實(shí)現(xiàn)對表情的理解與識別,實(shí)現(xiàn)更優(yōu)的人機(jī)交互。這種技術(shù)的重要性在于,人類在日常交流中,人臉表情可傳遞高達(dá)55%的信息。計算機(jī)對人類表情的識別和分析能夠改善人際交流,尤其對殘障人士的信息表達(dá)與理解具有重要意義。表情交互通常需要對面部表情進(jìn)行追蹤、編碼、識別。其中,面部表情的識別是最關(guān)鍵的一步。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)虛擬現(xiàn)實(shí)技術(shù)是20世紀(jì)末興起的一門嶄新的綜合性信息技術(shù),它融合了數(shù)字圖像處理、計算機(jī)圖形學(xué)、多媒體技術(shù)、傳感器技術(shù)等多個信息技術(shù)分支,大大推進(jìn)了計算機(jī)技術(shù)的發(fā)展。虛擬現(xiàn)實(shí)技術(shù)有3個特性,即沉浸感(immersion),交互性(interaction),思維構(gòu)想性(imagination)。10.4.8虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)虛擬現(xiàn)實(shí)技術(shù)是一種綜合應(yīng)用各種技術(shù)制造逼真的人工模擬環(huán)境,并有效模擬人在自然環(huán)境中的各種感知系統(tǒng)行為的高級人機(jī)交互技術(shù)。虛擬現(xiàn)實(shí)技術(shù)利用計算機(jī)生成三維視、聽、觸覺等感覺,使人通過適當(dāng)裝置,以虛擬的方式來體驗(yàn),并和所虛擬的世界進(jìn)行交互作用。北京信息科技大學(xué)自動化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)(1)桌面式虛擬現(xiàn)實(shí)系統(tǒng)(desktopVR)。桌面式虛擬現(xiàn)實(shí)系統(tǒng)用電腦屏幕呈現(xiàn)三維虛擬環(huán)境,通過鼠標(biāo)、手柄等進(jìn)行交互。使用者可能因受到現(xiàn)實(shí)環(huán)境的干擾而缺乏沉浸體驗(yàn),但由于成本相對較低,應(yīng)用廣泛。(2)完全沉浸式虛擬現(xiàn)實(shí)系統(tǒng)(fully-immersiveVR)。完全沉浸式虛擬現(xiàn)實(shí)系統(tǒng)需要佩戴沉浸式的輸出設(shè)備(如頭盔、具有力反饋的機(jī)械手

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論