遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法_第1頁
遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法_第2頁
遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法_第3頁
遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法_第4頁
遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

遷移學(xué)習(xí)中的領(lǐng)域自適應(yīng)方法目

錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n

智能大數(shù)據(jù)時代n

數(shù)據(jù)量,以及數(shù)據(jù)類型不斷增加n

對機器學(xué)習(xí)模型的要求:快速構(gòu)建和強泛化能力n

雖然數(shù)據(jù)量多,但是大部分?jǐn)?shù)據(jù)往往沒有標(biāo)注n

收集標(biāo)注數(shù)據(jù),或者從頭開始構(gòu)建每一個模型,代價高昂且費時n

對已有標(biāo)簽的數(shù)據(jù)和模型進(jìn)行重用成為了可能n

傳統(tǒng)機器學(xué)習(xí)方法通常假定這些數(shù)據(jù)服從相同分布,不再適用如何基于已有的不同分布數(shù)據(jù),快速構(gòu)建模型,實現(xiàn)數(shù)據(jù)標(biāo)定,是一個重要問題1遷移學(xué)習(xí)的背景圖片及視頻音頻行為文本n

核心思想n

找到不同任務(wù)之間的相關(guān)性n

“舉一反三”、“照貓畫虎”,但不要“東施效顰”(負(fù)遷移)n

遷移學(xué)習(xí)n通過減小源域(輔助領(lǐng)域)到目標(biāo)域的分布差異,進(jìn)行知識遷移,從而實現(xiàn)數(shù)據(jù)標(biāo)定。遷移學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域用于解決標(biāo)記數(shù)據(jù)難獲取這一基礎(chǔ)問題的重要手段1遷移學(xué)習(xí)簡介源域數(shù)據(jù)減小差異知識遷移135n

應(yīng)用前景廣闊n

模式識別、計算機視覺、語音識別、自然語言處理、數(shù)據(jù)挖掘

…1遷移學(xué)習(xí)應(yīng)用場景不同用戶、不同設(shè)備、不同位置的行為識別不同場景、不同設(shè)備、不同時間的室內(nèi)定位不同用戶、不同接口、不同情境的人機交互不同視角、不同背景、不同光照的圖像識別不同領(lǐng)域、不同背景下的文本翻譯、輿情分析語料匱乏條件下不同語言

的相互翻譯學(xué)習(xí)n

數(shù)據(jù)為王,計算是核心n數(shù)據(jù)爆炸的時代!n

計算機更強大了!

n

但是n

大數(shù)據(jù)、大計算能力只是有錢人的游戲普通研究人員無法獲取足夠標(biāo)定數(shù)據(jù),并且沒有足夠的計算資源1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)Googlea4onn

云+端的模型被普遍應(yīng)用n

通常需要對設(shè)備、環(huán)境、用戶作具體優(yōu)化n

個性化適配通常很復(fù)雜、很耗時n

對于不同用戶,需要不同的隱私處理方式如何針對新用戶、新設(shè)備、新環(huán)境,快速構(gòu)建模型?1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)沒有足夠的用戶數(shù)據(jù),如何構(gòu)建模型?n

特定的機器學(xué)習(xí)應(yīng)用n

推薦系統(tǒng)中的冷啟動問題:沒有數(shù)據(jù),如何作推薦?1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)n

為什么需要遷移學(xué)習(xí)n

數(shù)據(jù)的角度n

收集數(shù)據(jù)很困難n

為數(shù)據(jù)打標(biāo)簽很耗時n

訓(xùn)練一對一的模型很繁瑣n

模型的角度n

個性化模型很復(fù)雜n

云+端的模型需要作具體化適配n

應(yīng)用的角度n

冷啟動問題:沒有足夠用戶數(shù)據(jù),推薦系統(tǒng)無法工作因此,遷移學(xué)習(xí)是必要的1遷移學(xué)習(xí)簡介:為什么需要遷移學(xué)習(xí)基于實例的遷移(instance

basedTL)?

通過權(quán)重重用源域和目標(biāo)域的樣例進(jìn)行遷移基于特征的遷移

(feature

basedTL)?

將源域和目標(biāo)域的特征變換到相同空間基于模型的遷移

(parameter

basedTL)?

利用源域和目標(biāo)域的參數(shù)共享模型基于關(guān)系的遷移

(relation

basedTL)?

利用源域中的邏輯網(wǎng)絡(luò)關(guān)系進(jìn)行遷移1遷移學(xué)習(xí)簡介:遷移學(xué)習(xí)方法n

常見的遷移學(xué)習(xí)方法分類1遷移學(xué)習(xí)簡介:遷移學(xué)習(xí)方法研究領(lǐng)域n

常見的遷移學(xué)習(xí)研究領(lǐng)域與方法分類目

錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n

遷移學(xué)習(xí)基本概念n

域(Domain):由數(shù)據(jù)特征和特征分布組成,是學(xué)習(xí)的主體nSourcedomain(源域):已有知識的域n

Targetdomain

(目標(biāo)域):要進(jìn)行學(xué)習(xí)的域n

任務(wù)(Task):由目標(biāo)函數(shù)和學(xué)習(xí)結(jié)果組成,是學(xué)習(xí)的結(jié)果n

形式化n目標(biāo):利用

學(xué)習(xí)在目標(biāo)域上的預(yù)測函數(shù)

。n

限制條件:

Ts

/

TT2領(lǐng)域分布自適應(yīng):形式化條件:給定一個源域Ds

的學(xué)習(xí)任務(wù)TT和源域上的學(xué)習(xí)任務(wù)Ts

,目標(biāo)域DT

和目標(biāo)域上nn

領(lǐng)域自適應(yīng)問題nDomainAdaptation

(DA);cross-domain

learning;

同構(gòu)遷移學(xué)習(xí)n問題定義:有標(biāo)簽的源域和無標(biāo)簽的目標(biāo)域共享相同的特征和類別,但是特征分布不同,如何利用源域標(biāo)定目標(biāo)域Ds

/

DT:PS

(X)

/

PT

(X)n

計算機視覺中的一個重要問題n

每年發(fā)表大量相關(guān)論文:CVPR、ICCV、ICML、NIPS、IJCAI、AAAI2領(lǐng)域自適應(yīng):形式化n

領(lǐng)域自適應(yīng)問題n

按照目標(biāo)域有無標(biāo)簽n目標(biāo)域全部有標(biāo)簽:supervised

DAn目標(biāo)域有一些標(biāo)簽:semi-supervised

DAn目標(biāo)域全沒有標(biāo)簽:unsupervised

DAn

Unsupervised

DA最有挑戰(zhàn)性,是我們的關(guān)注點2領(lǐng)域自適應(yīng):形式化目

錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n

基本假設(shè)n

數(shù)據(jù)分布角度:源域和目標(biāo)域的概率分布相似n

最小化概率分布距離n

特征選擇角度:源域和目標(biāo)域共享著某些特征n

選擇出這部分公共特征n

特征變換角度:源域和目標(biāo)域共享某些子空間n

把兩個域變換到相同的子空間3領(lǐng)域自適應(yīng):方法概覽解決思路數(shù)據(jù)分布特征選擇法(Feature

Selection)子空間學(xué)習(xí)法(Subspace

Learning)概率分布適配法(DistributionAdaptation)特征變換特征選擇nn概率分布適配法

(DistributionAdaptation)n

邊緣分布適配

(Marginal

distribution

adaptation)n假設(shè):

P(xg)豐P(X)n

條件分布適配

(Conditional

distribution

adaptation)n

假設(shè):

P(YS]X)*P(Y

X)n

聯(lián)合分布適配

(Joint

distribution

adaptation)n假設(shè):

P(xs,ys)*p(xt,y)3領(lǐng)域自適應(yīng):概率分布適配法源域數(shù)據(jù)

目標(biāo)域數(shù)據(jù)(1)

目標(biāo)域數(shù)據(jù)(2)優(yōu)先考慮邊緣分布

優(yōu)先考慮條件分布n

邊緣分布適配

(1)n

遷移成分分析

(Transfer

Component

Analysis,TCA)[Pan,

TNN-11]n優(yōu)化目標(biāo):3領(lǐng)域自適應(yīng):概率分布適配法n

最大均值差異(Maximum

Mean

Discrepancy,

MMD)n

最小化MMD,同時維持遷移過程中目標(biāo)域的結(jié)構(gòu)n

DomainTransfer

Multiple

Kernel

Learning

(DTMKL)

[Duan,

PAMI-12]n

多核MMDn

Deep

Domain

Confusion

(DDC)

[Tzeng,

arXiv-14]n

把MMD加入到神經(jīng)網(wǎng)絡(luò)中n

Deep

Adaptation

Networks

(DAN)

[Long,

ICML-15]n

把MKK-MMD加入到神經(jīng)網(wǎng)絡(luò)中n

Distribution-Matching

Embedding

(DME)

[Baktashmotlagh,

JMLR-16]n

先計算變換矩陣,再進(jìn)行映射n

Central

Moment

Discrepancy

(CMD)

[Zellinger,

ICLR-17]n

不只是一階的MMD,推廣到了k階n

邊緣分布適配

(2)n

遷移成分分析

(TCA)方法的一些擴(kuò)展n

Adapting

Component

Analysis

(ACA)

[Dorri,

ICDM-12]3領(lǐng)域自適應(yīng):概率分布適配法n

條件分布適配n

DomainAdaptationofConditional

Probability

Modelsvia

Feature

Subsetting

[Satpal,

PKDD-07]n

條件隨機場+分布適配n優(yōu)化目標(biāo):n

Conditional

Transferrable

Components

(CTC)

[Gong,

ICML-15]n

定義條件轉(zhuǎn)移成分,對其進(jìn)行建模3領(lǐng)域自適應(yīng):概率分布適配法n

聯(lián)合分布適配

(1)n

聯(lián)合分布適配

(Joint

Distribution

Adaptation,JDA)[Long,

ICCV-13]n

直接繼承于TCA,但是加入了條件分布適配n優(yōu)化目標(biāo):n問題:如何獲得估計條件分布?n

充分統(tǒng)計量:用類條件概率近似條件概率n

用一個弱分類器生成目標(biāo)域的初始軟標(biāo)簽n

最終優(yōu)化形式3領(lǐng)域自適應(yīng):概率分布適配法n

聯(lián)合分布適配的結(jié)果普遍優(yōu)于比單獨適配邊緣或條件分布n

聯(lián)合分布適配

(2)n

聯(lián)合分布適配(JDA)方法的一些擴(kuò)展n

Adaptation

Regularization

(ARTL)

[Long,

TKDE-14]n

分類器學(xué)習(xí)+聯(lián)合分布適配n

Visual

Domain

Adaptation

(VDA)

[Tahmoresnezhad,

KIS-17]n

加入類內(nèi)距、類間距n

JointGeometricalandStatisticalAlignment(JGSA)

[Zhang,

CVPR-17]n

加入類內(nèi)距、類間距、標(biāo)簽適配n[Hsu,TIP-16]:加入結(jié)構(gòu)不變性控制n[Hsu,AVSS-15]:目標(biāo)域選擇n

Joint

Adaptation

Networks

(JAN)

[Long,

ICML-17]n

提出JMMD度量,在深度網(wǎng)絡(luò)中進(jìn)行聯(lián)合分布適配3領(lǐng)域自適應(yīng):概率分布適配法n

聯(lián)合分布適配

(3)n

平衡分布適配

(Balanced

Distribution

Adaptation,

BDA)[Wang,n

僅僅適配條件分布和邊緣分布就夠了嗎?n

聯(lián)合分布適配的問題:兩種分布同等重要n

真實環(huán)境:兩種分布不一定同等重要n

加入平衡因子動態(tài)衡量兩種分布的重要性ue

[0,1n

當(dāng)

,表示邊緣分布更占優(yōu),應(yīng)該優(yōu)先適配n

當(dāng),表示條件分布更占優(yōu),應(yīng)該優(yōu)先適配n

最終表示形式平衡因子3領(lǐng)域自適應(yīng):概率分布適配法ICDM-2017]n

聯(lián)合分布適配

(4)n

平衡分布適配

(BDA):平衡因子的重要性n

對于不同的任務(wù),邊緣分布和條件

分布并不是同等重要,因此,BDA方法可以有效衡量這兩個分布的權(quán)

重,從而達(dá)到最好的結(jié)果n

平衡分布適配

(BDA):平衡因子的求解與估計n

目前尚無精確的估計方法;我們采用A-distance來進(jìn)行估計n

求解源域和目標(biāo)域整體的A-distancen

對目標(biāo)域聚類,計算源域和目標(biāo)域每個類的A-distancen

計算上述兩個距離的比值,則為平衡因子3領(lǐng)域自適應(yīng):概率分布適配法n

概率分布適配:總結(jié)

n

方法n

基礎(chǔ):大多數(shù)方法基于MMD距離進(jìn)行優(yōu)化求解n

分別進(jìn)行邊緣/條件

/聯(lián)合概率適配n效果:平衡

(BDA)

>聯(lián)合

(JDA)

>邊緣

(TCA)

>條件

n

使用n

數(shù)據(jù)整體差異性大

(相似度較低),邊緣分布更重要n

數(shù)據(jù)整體差異性小

(協(xié)方差漂移),條件分布更重要n

最新成果n

深度學(xué)習(xí)+分布適配往往有更好的效果

(DDC、DAN、JAN)3領(lǐng)域自適應(yīng):概率分布適配法DDC、DAN、JAN與其他方法結(jié)果比較BDA、JDA、TCA精度比較n特征選擇法

(Feature

Selection)n

從源域和目標(biāo)域中選擇提取共享的特征,建立統(tǒng)一模型n

Structural

Correspondence

Learning

(SCL)

[Blitzer,

ECML-06]n

尋找Pivotfeature,將源域和目標(biāo)域進(jìn)行對齊3領(lǐng)域自適應(yīng):特征選擇法n

特征選擇法其他擴(kuò)展n

Joint

feature

selection

and

subspace

learning

[Gu,

IJCAI-11]n

特征選擇/變換+子空間學(xué)習(xí)n

優(yōu)化目標(biāo):

n

Transfer

Joint

Matching

(TJM)

[Long,

CVPR-14]n

MMD分布適配+源域樣本選擇n

優(yōu)化目標(biāo):

n

Feature

Selection

and

Structure

Preservation

(FSSL)[Li,

IJCAI-16]n

特征選擇+信息不變性n

優(yōu)化目標(biāo):3領(lǐng)域自適應(yīng):特征選擇法n

特征選擇法:總結(jié)n

從源域和目標(biāo)域中選擇提取共享的特征,建立統(tǒng)一模型n

通常與分布適配進(jìn)行結(jié)合n

選擇特征通常利用稀疏矩陣3領(lǐng)域自適應(yīng):特征選擇法n子空間學(xué)習(xí)法

(Subspace

Learning)n

將源域和目標(biāo)域變換到相同的子空間,然后建立統(tǒng)一的模型n

統(tǒng)計特征變換

(Statistical

Feature

Transformation)n

將源域和目標(biāo)域的一些統(tǒng)計特征進(jìn)行變換對齊n

流形學(xué)習(xí)

(Manifold

Learning)n

在流形空間中進(jìn)行子空間變換3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法統(tǒng)計特征變換流形學(xué)習(xí)n

統(tǒng)計特征變換

(1)n

子空間對齊法

(Subspace

Alignment,

SA)

[Fernando,

ICCV-13]n

直接尋求一個線性變換,把source變換到target空間中n優(yōu)化目標(biāo):n直接獲得線性變換的閉式解:n

子空間分布對齊法

(Subspace

Distribution

Alignment,SDA)

[Sun,

BMVC-15]n

子空間對齊+概率分布適配3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法n

空間對齊法:方法簡潔,計算高效n

統(tǒng)計特征變換

(2)n

關(guān)聯(lián)對齊法

(CORrelation

Alignment,CORAL)[Sun,

AAAI-15]n

最小化源域和目標(biāo)域的二階統(tǒng)計特征n優(yōu)化目標(biāo):n

形式簡單,求解高效n

深度關(guān)聯(lián)對齊

(Deep-CORAL)

[Sun,

ECCV-16]n

在深度網(wǎng)絡(luò)中加入CORALnCORAL

loss:3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法n

流形學(xué)習(xí)

(1)n

采樣測地線流方法

(Sample

Geodesic

Flow,

SGF)

[Gopalan,

ICCV-11]n

把領(lǐng)域自適應(yīng)的問題看成一個增量式“行走”問題n

從源域走到目標(biāo)域就完成了一個自適應(yīng)過程n

在流形空間中采樣有限個點,構(gòu)建一個測地線流n

測地線流式核方法

(Geodesic

Flow

Kernel,

GFK)

[Gong,

CVPR-12]n

繼承了SGF方法,采樣無窮個點n

轉(zhuǎn)化成Grassmann流形中的核學(xué)習(xí),構(gòu)建了GFKn優(yōu)化目標(biāo):3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法GFK方法SGF方法n

流形學(xué)習(xí)

(2)n

域CVP不R-變13]映射

(Domain-Invariant

Projection,

DIP)[Baktashmotlagh,

n

直接度量分布距離是不好的:原始空間特征扭曲n

僅作流形子空間學(xué)習(xí):無法刻畫分布距離n

解決方案:流形映射+分布度量n

統(tǒng)計流形法

(Statistical

Manifold)

[Baktashmotlagh,

CVPR-14]n

在統(tǒng)計流形(黎曼流形)上進(jìn)行分布度量n

用Fisher-Raodistance

(Hellingerdistance)進(jìn)行度量3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法n

子空間學(xué)習(xí)法:總結(jié)n

主要包括統(tǒng)計特征對齊和流形學(xué)習(xí)方法兩大類n

和分布適配結(jié)合效果更好n

趨勢:與神經(jīng)網(wǎng)絡(luò)結(jié)合3領(lǐng)域自適應(yīng):子空間學(xué)習(xí)法目

錄CONTENTS最新研究成果遷移學(xué)習(xí)簡介領(lǐng)域自適應(yīng)問題領(lǐng)域自適應(yīng)方法參考資料12345n領(lǐng)域自適應(yīng)的最新研究成果(1)n

與深度學(xué)習(xí)進(jìn)行結(jié)合n

Deep

Adaptation

Networks

(DAN)

[Long,

ICML-15]n

深度網(wǎng)絡(luò)+MMD距離最小化n

Joint

Adaptation

Networks

(JAN)

[Long,

ICML-17]n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論