




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法目
錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n
智能大數(shù)據(jù)時代n
數(shù)據(jù)量,以及數(shù)據(jù)類型不斷增加n
對機器學(xué)習(xí)模型的要求:快速構(gòu)建和強泛化能力n
雖然數(shù)據(jù)量多,但是大部分?jǐn)?shù)據(jù)往往沒有標(biāo)注n
收集標(biāo)注數(shù)據(jù),或者從頭開始構(gòu)建每一個模型,代價高昂且費時n
對已有標(biāo)簽的數(shù)據(jù)和模型進(jìn)行重用成為了可能n
傳統(tǒng)機器學(xué)習(xí)方法通常假定這些數(shù)據(jù)服從相同分布,不再適用如何基于已有的不同分布數(shù)據(jù),快速構(gòu)建模型,實現(xiàn)數(shù)據(jù)標(biāo)定,是一個重要問題1遷移學(xué)習(xí)的背景圖片及視頻音頻行為文本n
核心思想n
找到不同任務(wù)之間的相關(guān)性n
“舉一反三”、“照貓畫虎”,但不要“東施效顰”(負(fù)遷移)n
遷移學(xué)習(xí)n通過減小源域(輔助領(lǐng)域)到目標(biāo)域的分布差異,進(jìn)行知識遷移,從而實現(xiàn)數(shù)據(jù)標(biāo)定。遷移學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域用于解決標(biāo)記數(shù)據(jù)難獲取這一基礎(chǔ)問題的重要手段1遷移學(xué)習(xí)簡介源域數(shù)據(jù)減小差異知識遷移135n
應(yīng)用前景廣闊n
模式識別、計算機視覺、語音識別、自然語言處理、數(shù)據(jù)挖掘
…1遷移學(xué)習(xí)應(yīng)用場景不同用戶、不同設(shè)備、不同位置的行為識別不同場景、不同設(shè)備、不同時間的室內(nèi)定位不同用戶、不同接口、不同情境的人機交互不同視角、不同背景、不同光照的圖像識別不同領(lǐng)域、不同背景下的文本翻譯、輿情分析語料匱乏條件下不同語言
的相互翻譯學(xué)習(xí)n
數(shù)據(jù)為王,計算是核心n數(shù)據(jù)爆炸的時代!n
計算機更強大了!
n
但是n
大數(shù)據(jù)、大計算能力只是有錢人的游戲普通研究人員無法獲取足夠標(biāo)定數(shù)據(jù),并且沒有足夠的計算資源1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)Googlea4onn
云+端的模型被普遍應(yīng)用n
通常需要對設(shè)備、環(huán)境、用戶作具體優(yōu)化n
個性化適配通常很復(fù)雜、很耗時n
對于不同用戶,需要不同的隱私處理方式如何針對新用戶、新設(shè)備、新環(huán)境,快速構(gòu)建模型?1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)沒有足夠的用戶數(shù)據(jù),如何構(gòu)建模型?n
特定的機器學(xué)習(xí)應(yīng)用n
推薦系統(tǒng)中的冷啟動問題:沒有數(shù)據(jù),如何作推薦?1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)n
為什么需要遷移學(xué)習(xí)n
數(shù)據(jù)的角度n
收集數(shù)據(jù)很困難n
為數(shù)據(jù)打標(biāo)簽很耗時n
訓(xùn)練一對一的模型很繁瑣n
模型的角度n
個性化模型很復(fù)雜n
云+端的模型需要作具體化適配n
應(yīng)用的角度n
冷啟動問題:沒有足夠用戶數(shù)據(jù),推薦系統(tǒng)無法工作因此,遷移學(xué)習(xí)是必要的1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)基于實例的遷移(instance
basedTL)?
通過權(quán)重重用源域和目標(biāo)域的樣例進(jìn)行遷移基于特征的遷移
(feature
basedTL)?
將源域和目標(biāo)域的特征變換到相同空間基于模型的遷移
(parameter
basedTL)?
利用源域和目標(biāo)域的參數(shù)共享模型基于關(guān)系的遷移
(relation
basedTL)?
利用源域中的邏輯網(wǎng)絡(luò)關(guān)系進(jìn)行遷移1遷移學(xué)習(xí)簡介:遷移學(xué)習(xí)方法n
常見的遷移學(xué)習(xí)方法分類1遷移學(xué)習(xí)簡介:遷移學(xué)習(xí)方法研究領(lǐng)域n
常見的遷移學(xué)習(xí)研究領(lǐng)域與方法分類目
錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n
遷移學(xué)習(xí)基本概念n
域(Domain):由數(shù)據(jù)特征和特征分布組成,是學(xué)習(xí)的主體nSourcedomain(源域):已有知識的域n
Targetdomain
(目標(biāo)域):要進(jìn)行學(xué)習(xí)的域n
任務(wù)(Task):由目標(biāo)函數(shù)和學(xué)習(xí)結(jié)果組成,是學(xué)習(xí)的結(jié)果n
形式化n目標(biāo):利用
和
學(xué)習(xí)在目標(biāo)域上的預(yù)測函數(shù)
。n
限制條件:
或
Ts
/
TT2領(lǐng)域分布自適應(yīng):形式化條件:給定一個源域Ds
的學(xué)習(xí)任務(wù)TT和源域上的學(xué)習(xí)任務(wù)Ts
,目標(biāo)域DT
和目標(biāo)域上nn
領(lǐng)域自適應(yīng)問題nDomainAdaptation
(DA);cross-domain
learning;
同構(gòu)遷移學(xué)習(xí)n問題定義:有標(biāo)簽的源域和無標(biāo)簽的目標(biāo)域共享相同的特征和類別,但是特征分布不同,如何利用源域標(biāo)定目標(biāo)域Ds
/
DT:PS
(X)
/
PT
(X)n
計算機視覺中的一個重要問題n
每年發(fā)表大量相關(guān)論文:CVPR、ICCV、ICML、NIPS、IJCAI、AAAI2領(lǐng)域自適應(yīng):形式化n
領(lǐng)域自適應(yīng)問題n
按照目標(biāo)域有無標(biāo)簽n目標(biāo)域全部有標(biāo)簽:supervised
DAn目標(biāo)域有一些標(biāo)簽:semi-supervised
DAn目標(biāo)域全沒有標(biāo)簽:unsupervised
DAn
Unsupervised
DA最有挑戰(zhàn)性,是我們的關(guān)注點2領(lǐng)域自適應(yīng):形式化目
錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n
基本假設(shè)n
數(shù)據(jù)分布角度:源域和目標(biāo)域的概率分布相似n
最小化概率分布距離n
特征選擇角度:源域和目標(biāo)域共享著某些特征n
選擇出這部分公共特征n
特征變換角度:源域和目標(biāo)域共享某些子空間n
把兩個域變換到相同的子空間3領(lǐng)域自適應(yīng):方法概覽解決思路數(shù)據(jù)分布特征選擇法(Feature
Selection)子空間學(xué)習(xí)法(Subspace
Learning)概率分布適配法(DistributionAdaptation)特征變換特征選擇nn概率分布適配法
(DistributionAdaptation)n
邊緣分布適配
(Marginal
distribution
adaptation)n假設(shè):
P(xg)豐P(X)n
條件分布適配
(Conditional
distribution
adaptation)n
假設(shè):
P(YS]X)*P(Y
X)n
聯(lián)合分布適配
(Joint
distribution
adaptation)n假設(shè):
P(xs,ys)*p(xt,y)3領(lǐng)域自適應(yīng):概率分布適配法源域數(shù)據(jù)
目標(biāo)域數(shù)據(jù)(1)
目標(biāo)域數(shù)據(jù)(2)優(yōu)先考慮邊緣分布
優(yōu)先考慮條件分布n
邊緣分布適配
(1)n
遷移成分分析
(Transfer
Component
Analysis,TCA)[Pan,
TNN-11]n優(yōu)化目標(biāo):3領(lǐng)域自適應(yīng):概率分布適配法n
最大均值差異(Maximum
Mean
Discrepancy,
MMD)n
最小化MMD,同時維持遷移過程中目標(biāo)域的結(jié)構(gòu)n
DomainTransfer
Multiple
Kernel
Learning
(DTMKL)
[Duan,
PAMI-12]n
多核MMDn
Deep
Domain
Confusion
(DDC)
[Tzeng,
arXiv-14]n
把MMD加入到神經(jīng)網(wǎng)絡(luò)中n
Deep
Adaptation
Networks
(DAN)
[Long,
ICML-15]n
把MKK-MMD加入到神經(jīng)網(wǎng)絡(luò)中n
Distribution-Matching
Embedding
(DME)
[Baktashmotlagh,
JMLR-16]n
先計算變換矩陣,再進(jìn)行映射n
Central
Moment
Discrepancy
(CMD)
[Zellinger,
ICLR-17]n
不只是一階的MMD,推廣到了k階n
邊緣分布適配
(2)n
遷移成分分析
(TCA)方法的一些擴(kuò)展n
Adapting
Component
Analysis
(ACA)
[Dorri,
ICDM-12]3領(lǐng)域自適應(yīng):概率分布適配法n
條件分布適配n
DomainAdaptationofConditional
Probability
Modelsvia
Feature
Subsetting
[Satpal,
PKDD-07]n
條件隨機場+分布適配n優(yōu)化目標(biāo):n
Conditional
Transferrable
Components
(CTC)
[Gong,
ICML-15]n
定義條件轉(zhuǎn)移成分,對其進(jìn)行建模3領(lǐng)域自適應(yīng):概率分布適配法n
聯(lián)合分布適配
(1)n
聯(lián)合分布適配
(Joint
Distribution
Adaptation,JDA)[Long,
ICCV-13]n
直接繼承于TCA,但是加入了條件分布適配n優(yōu)化目標(biāo):n問題:如何獲得估計條件分布?n
充分統(tǒng)計量:用類條件概率近似條件概率n
用一個弱分類器生成目標(biāo)域的初始軟標(biāo)簽n
最終優(yōu)化形式3領(lǐng)域自適應(yīng):概率分布適配法n
聯(lián)合分布適配的結(jié)果普遍優(yōu)于比單獨適配邊緣或條件分布n
聯(lián)合分布適配
(2)n
聯(lián)合分布適配(JDA)方法的一些擴(kuò)展n
Adaptation
Regularization
(ARTL)
[Long,
TKDE-14]n
分類器學(xué)習(xí)+聯(lián)合分布適配n
Visual
Domain
Adaptation
(VDA)
[Tahmoresnezhad,
KIS-17]n
加入類內(nèi)距、類間距n
JointGeometricalandStatisticalAlignment(JGSA)
[Zhang,
CVPR-17]n
加入類內(nèi)距、類間距、標(biāo)簽適配n[Hsu,TIP-16]:加入結(jié)構(gòu)不變性控制n[Hsu,AVSS-15]:目標(biāo)域選擇n
Joint
Adaptation
Networks
(JAN)
[Long,
ICML-17]n
提出JMMD度量,在深度網(wǎng)絡(luò)中進(jìn)行聯(lián)合分布適配3領(lǐng)域自適應(yīng):概率分布適配法n
聯(lián)合分布適配
(3)n
平衡分布適配
(Balanced
Distribution
Adaptation,
BDA)[Wang,n
僅僅適配條件分布和邊緣分布就夠了嗎?n
聯(lián)合分布適配的問題:兩種分布同等重要n
真實環(huán)境:兩種分布不一定同等重要n
加入平衡因子動態(tài)衡量兩種分布的重要性ue
[0,1n
當(dāng)
,表示邊緣分布更占優(yōu),應(yīng)該優(yōu)先適配n
當(dāng),表示條件分布更占優(yōu),應(yīng)該優(yōu)先適配n
最終表示形式平衡因子3領(lǐng)域自適應(yīng):概率分布適配法ICDM-2017]n
聯(lián)合分布適配
(4)n
平衡分布適配
(BDA):平衡因子的重要性n
對于不同的任務(wù),邊緣分布和條件
分布并不是同等重要,因此,BDA方法可以有效衡量這兩個分布的權(quán)
重,從而達(dá)到最好的結(jié)果n
平衡分布適配
(BDA):平衡因子的求解與估計n
目前尚無精確的估計方法;我們采用A-distance來進(jìn)行估計n
求解源域和目標(biāo)域整體的A-distancen
對目標(biāo)域聚類,計算源域和目標(biāo)域每個類的A-distancen
計算上述兩個距離的比值,則為平衡因子3領(lǐng)域自適應(yīng):概率分布適配法n
概率分布適配:總結(jié)
n
方法n
基礎(chǔ):大多數(shù)方法基于MMD距離進(jìn)行優(yōu)化求解n
分別進(jìn)行邊緣/條件
/聯(lián)合概率適配n效果:平衡
(BDA)
>聯(lián)合
(JDA)
>邊緣
(TCA)
>條件
n
使用n
數(shù)據(jù)整體差異性大
(相似度較低),邊緣分布更重要n
數(shù)據(jù)整體差異性小
(協(xié)方差漂移),條件分布更重要n
最新成果n
深度學(xué)習(xí)+分布適配往往有更好的效果
(DDC、DAN、JAN)3領(lǐng)域自適應(yīng):概率分布適配法DDC、DAN、JAN與其他方法結(jié)果比較BDA、JDA、TCA精度比較n特征選擇法
(Feature
Selection)n
從源域和目標(biāo)域中選擇提取共享的特征,建立統(tǒng)一模型n
Structural
Correspondence
Learning
(SCL)
[Blitzer,
ECML-06]n
尋找Pivotfeature,將源域和目標(biāo)域進(jìn)行對齊3領(lǐng)域自適應(yīng):特征選擇法n
特征選擇法其他擴(kuò)展n
Joint
feature
selection
and
subspace
learning
[Gu,
IJCAI-11]n
特征選擇/變換+子空間學(xué)習(xí)n
優(yōu)化目標(biāo):
n
Transfer
Joint
Matching
(TJM)
[Long,
CVPR-14]n
MMD分布適配+源域樣本選擇n
優(yōu)化目標(biāo):
n
Feature
Selection
and
Structure
Preservation
(FSSL)[Li,
IJCAI-16]n
特征選擇+信息不變性n
優(yōu)化目標(biāo):3領(lǐng)域自適應(yīng):特征選擇法n
特征選擇法:總結(jié)n
從源域和目標(biāo)域中選擇提取共享的特征,建立統(tǒng)一模型n
通常與分布適配進(jìn)行結(jié)合n
選擇特征通常利用稀疏矩陣3領(lǐng)域自適應(yīng):特征選擇法n子空間學(xué)習(xí)法
(Subspace
Learning)n
將源域和目標(biāo)域變換到相同的子空間,然后建立統(tǒng)一的模型n
統(tǒng)計特征變換
(Statistical
Feature
Transformation)n
將源域和目標(biāo)域的一些統(tǒng)計特征進(jìn)行變換對齊n
流形學(xué)習(xí)
(Manifold
Learning)n
在流形空間中進(jìn)行子空間變換3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法統(tǒng)計特征變換流形學(xué)習(xí)n
統(tǒng)計特征變換
(1)n
子空間對齊法
(Subspace
Alignment,
SA)
[Fernando,
ICCV-13]n
直接尋求一個線性變換,把source變換到target空間中n優(yōu)化目標(biāo):n直接獲得線性變換的閉式解:n
子空間分布對齊法
(Subspace
Distribution
Alignment,SDA)
[Sun,
BMVC-15]n
子空間對齊+概率分布適配3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法n
空間對齊法:方法簡潔,計算高效n
統(tǒng)計特征變換
(2)n
關(guān)聯(lián)對齊法
(CORrelation
Alignment,CORAL)[Sun,
AAAI-15]n
最小化源域和目標(biāo)域的二階統(tǒng)計特征n優(yōu)化目標(biāo):n
形式簡單,求解高效n
深度關(guān)聯(lián)對齊
(Deep-CORAL)
[Sun,
ECCV-16]n
在深度網(wǎng)絡(luò)中加入CORALnCORAL
loss:3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法n
流形學(xué)習(xí)
(1)n
采樣測地線流方法
(Sample
Geodesic
Flow,
SGF)
[Gopalan,
ICCV-11]n
把領(lǐng)域自適應(yīng)的問題看成一個增量式“行走”問題n
從源域走到目標(biāo)域就完成了一個自適應(yīng)過程n
在流形空間中采樣有限個點,構(gòu)建一個測地線流n
測地線流式核方法
(Geodesic
Flow
Kernel,
GFK)
[Gong,
CVPR-12]n
繼承了SGF方法,采樣無窮個點n
轉(zhuǎn)化成Grassmann流形中的核學(xué)習(xí),構(gòu)建了GFKn優(yōu)化目標(biāo):3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法GFK方法SGF方法n
流形學(xué)習(xí)
(2)n
域CVP不R-變13]映射
(Domain-Invariant
Projection,
DIP)[Baktashmotlagh,
n
直接度量分布距離是不好的:原始空間特征扭曲n
僅作流形子空間學(xué)習(xí):無法刻畫分布距離n
解決方案:流形映射+分布度量n
統(tǒng)計流形法
(Statistical
Manifold)
[Baktashmotlagh,
CVPR-14]n
在統(tǒng)計流形(黎曼流形)上進(jìn)行分布度量n
用Fisher-Raodistance
(Hellingerdistance)進(jìn)行度量3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法n
子空間學(xué)習(xí)法:總結(jié)n
主要包括統(tǒng)計特征對齊和流形學(xué)習(xí)方法兩大類n
和分布適配結(jié)合效果更好n
趨勢:與神經(jīng)網(wǎng)絡(luò)結(jié)合3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法目
錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n領(lǐng)域自適應(yīng)的最新研究成果(1)n
與深度學(xué)習(xí)進(jìn)行結(jié)合n
Deep
Adaptation
Networks
(DAN)
[Long,
ICML-15]n
深度網(wǎng)絡(luò)+MMD距離最小化n
Joint
Adaptation
Networks
(JAN)
[Long,
ICML-17]n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 行政法學(xué)議題探討試題及答案
- 2025年VB考試模擬題與詳細(xì)試題及答案
- 法學(xué)概論考試形式介紹試題及答案
- 突破法學(xué)概論難題的試題及答案
- 2025超市供貨合同模板
- 信息處理技術(shù)員2025年試題及答案
- 前臺文員如何做好多任務(wù)處理計劃
- 二級VB考試分析報告試題及答案
- 行政法中的社會公平與效率的動態(tài)平衡試題及答案
- 郵員工考核評語
- 肩周炎的康復(fù)PPT通用課件
- GB/T 328.5-2007建筑防水卷材試驗方法第5部分:高分子防水卷材厚度、單位面積質(zhì)量
- GB/T 15970.6-2007金屬和合金的腐蝕應(yīng)力腐蝕試驗第6部分:恒載荷或恒位移下預(yù)裂紋試樣的制備和應(yīng)用
- 案款收款賬戶確認(rèn)書
- 9-馬工程《藝術(shù)學(xué)概論》課件-第九章(20190403)【已改格式】.課件電子教案
- 施工現(xiàn)場建筑垃圾處置專項方案
- 歡迎新同學(xué)幼兒園中小學(xué)開學(xué)第一課入學(xué)準(zhǔn)備ppt
- (整理)柴油發(fā)電機的檢修
- 2021年肇慶市端州區(qū)華佗醫(yī)院醫(yī)護(hù)人員招聘筆試試題及答案解析
- JJG 694-2009 原子吸收分光光度計-(高清現(xiàn)行)
- DB23∕T 482-1998 主要樹種樹高級立木材積表
評論
0/150
提交評論