Simultaneous Deep Transfer Across Domains and Tasks 域和任務同時深度遷移

阿新 • • 發佈：2018-12-15

文中提到：現有的遷移學習方法很多都只做了一步：域適應，也就是減少邊緣概率(marginal distribution)差異----使兩個域儘可能重疊、融合，但是當邊緣分佈得到對齊之後，並不能保證每個域之間的類別能夠對齊，類別沒有對齊有什麼影響呢？論文中並沒有很好的說明，那就根據我的理解強行解釋一波，比如分類器對源域中的一張圖片識別出是一個瓶子的概率最大，是一個馬克杯的概率次之，在目標域中有瓶子和玻璃杯這兩個類別，但是沒有馬克杯這個類別怎麼辦，不好用源域輔助目標域判別了呀。同時，在目標域中識別出瓶子的概率最高（與源域一樣），識別是玻璃瓶的概率次高（與源域中馬克杯類似），那麼通過類別對齊，我們想讓源域中馬克杯這個類別近似看做是目標域中的玻璃杯，並且將瓶子–馬克杯這兩個源域之間的類別關係（識別出瓶子概率最高，馬克杯次之）也對映到目標域中的瓶子–玻璃杯中。另外，網路學習的目的之一是將資料與標籤（類別）完成一種對映，在遷移學習中，我們希望能夠通過源域與目標域儘可能的相似（域適應），然後通過源域和目標域完成與標籤的對映，因為用到的絕大部分資料是來自源域的，但是目標域中標籤之間的關係並不一定和源域的相似，就像域適應一樣—源域和目標域資料之間並不一定相似，域適應通過邊緣對齊讓源域和目標域之間的資料儘可能相似，而任務遷移則可以通過類別對齊，將源域中的類別及類別之間關係（各類別的判別概率）也遷移到目標域的任務空間中，文章提出的深度遷移網路就是基於這一點，期望於同時遷移域、任務，來幫助對目標域的任務判別。邊緣對齊好說，之前這麼多方法都是邊緣對齊，那如何類別對齊呢？作者提出了一個叫做"soft label"的東西來幫助目標分類器優化，而這個"soft label"則是根據源域分類器產生的。好了，文中框架的主要工作也是這兩個：

通過域融合完成域對齊
通過soft labels對齊源域和目標域類別

通過域融合完成域對齊

提出的框架如下：

框架是在Alexnet的基礎上改動而成，前7層是一個標準的卷積神經網路，而需要做的第一步就是將在源域資料上搭建的卷積網路根據源域有標籤資料訓練好，這是一個正常的有監督卷積網路訓練過程，其損失函式優化如下：

$\mathcal{L}_C(x,y;\theta_{repr},\theta_C)=-\sum_k \mathbb{1} [y=k]logp_k$

其中 $\theta_{repr}$ 表示的是模型引數，p是分類器中的softmax層的輸出： $p=softmax(\theta_C^Tf(x;\theta_{repr}))$ 。

那怎麼完成域對齊呢？所基於的思想是啥？----運用生成對抗網路的一種思想，如果一個分類器無法分辨出輸入是來自源域還是來自來自目標域的時候，就認為二者已經達到域對齊了。思路已經很清晰了，作者在框架第7層後加了一個域分類器—fcD，用於判別第七層出來的特徵表示是屬於源域還是目標域，當fcD無法分辨的時候，他們就已經到達了那個傳說中的境界----雌雄同體（域對齊，也是域融合，也是域適應），哈哈。還有一個細節就是，fcD是個典型的二分類器，標籤就是域標籤（例如1表示源域，0表示目標域），分類器的損失函式如下：

$\mathcal{L}_D(x_S,x_T,\theta_{repr};\theta_D)=-\sum_d \mathbb{1} [y_D=d]logq_d$

其實與上面那個損失函式類似，只不過是把標籤換成了域標籤。 q和上面的p類似，是域分類器fcD的softmax輸出。為了讓兩個域達到最大融合，提取到更好的域不變(domain invariance)特徵以致於最好的域分類器在這些特徵上都變現的很差，作者又加了一個損失函式：

$\mathcal{L}_{conf}(x_S,x_T,\theta_{D};\theta_{repr})=-\sum_d \frac{1}{D} logq_d$

啥意思呢？就是在上一步優化了分類器D的基礎上，再去優化引數 $\theta_{repr}$ ，這就是一個典型的交叉熵形式。1/D是域概率， $q_d$ 是預測概率。

好了，域對齊OK了，接下來就是作者提出來的用soft label進行任務對齊了。

通過soft labels對齊源域和目標域類別

上面提到soft labels由源域分類器產生，然後通過soft labels優化目標任務空間，而不是像正常的影象標籤。那麼soft label怎麼來呢？上面提到了將源域的類別即類別之間的關係遷移到目標域中，當然是用源域的類別資訊來做為soft label最合適不過，文中將soft label定義為源分類器對源域中類別k的樣本的softmax結果取均值，如下圖所示：

如原圖中所示，假設共有5類（Bottle、Mug、Chair、Laptop、keyboard），對模型識別所有屬於瓶子類別的樣本的softmax值(5個概率)進行平均，像圖中得到這個平均值(圖中最右邊)就是得到的一個soft label（一種關係的衡量，比如在這裡是瓶子的概率最高，馬克杯的概率次之，其他幾種基本不是）。好了，現在soft label也得到了，怎麼優化呢？首先，需要給出優化函式，如下：

$\mathcal{L}_{soft}(x_T,y_T;\theta_{repr},\theta_{C})=-\sum_i l_i^{(y_T)} logp_i$

其實也是和上面的損失函式類似的，同樣是交叉熵形式，通過資料和標籤優化特徵表示和分類器，其中 $l$ 表示soft label，因為資料集中目標域也存在部分帶標籤資料，所以這裡和有監督的優化類似，無標籤的就用上soft label，為了讓類別之間的聯絡更好的影響到微調，作者在 $p_i$ 中加入了一個權重引數， $p_i=softmax(\theta_C^T f(x_T;\theta_{repr})/\tau)$ ，其中 $\tau$ 是一個權重引數。

如上圖所示，通過源分類器得到soft label，然後使用soft label以及目標域自身的標籤求得交叉熵損失，通過後向傳播優化目標網路。這也與最上面那個網路框架圖中最後一坨對應。然後總結一下所有的損失函式：

其中 $lambda、v$ 是權重引數。和上面一樣， $\theta_{repr}$ 表示1-7層的特徵引數， $\theta_C$ 對應的第8層的分類器引數。 $\theta_D$ 對應fcD域分類器引數。

通過這樣，就達到了作者關於域對齊和任務對齊的目的。實驗感興趣的可以另外檢視論文。

參考

Hoffman J, Tzeng E, Darrell T, et al. Simultaneous Deep Transfer Across Domains and Tasks[J]. 2015, 30(31):4068-4076.

Simultaneous Deep Transfer Across Domains and Tasks 域和任務同時深度遷移

文中提到：現有的遷移學習方法很多都只做了一步：域適應，也就是減少邊緣概率(marginal distribution)差異----使兩個域儘可能重疊、融合，但是當邊緣分佈得到對齊之後，並不能保證每個域之間的類別能夠對齊，類別沒有對齊有什麼影響呢？論文中並沒有很

【論文：麥克風陣列增強】Speech Enhancement Based on the General Transfer Function GSC and Postfiltering

res transient ice ges nal gen image 增強 reg 作者：桂。時間：2017-06-06 16:10:47 鏈接：http://www.cnblogs.com/xingshansi/p/6951494.html 原文鏈接：http

論文筆記-Joint Deep Modeling of Users and Items Using Reviews for Recommendation

一個 solved default view http ati onf 評分分享基本思路：利用用戶和商品的評論構建CNN預測評分。網絡結構： user review網絡與 item review網絡結構一致，僅就前者進行說明從user review tex

論文閱讀計劃2(Deep Joint Rain Detection and Removal from a Single Image)

rem 領域深度學習 conf mage 圖片多任務 RoCE deep Deep Joint Rain Detection and Removal from a Single Image[1] 簡介：多任務全卷積從單張圖片中去除雨跡。本文在現有的模型上，開發了一種多

命名空間 and 作用域

image UNC pri 虛擬內存 print bsp 安全問題替代接受 1.命名空間 2.命名空間的優先順序 3.作用域 # 使用print（id（func））就能查找出函數的虛擬內存地址！！！應盡量不使用glob

理解javaScript中的作用域和上下文Understanding Scope and Context in JavaScript

譯者注：一直對於作用域和上下文感到很混亂，無意中看到這篇文章，覺得講得很好，故翻譯來與大家分享。翻譯不好之處，請大家多多指教。原文連結：http://ryanmorr.com/understanding-scope-and-context-in-javascript/ 前言部分，不做翻譯

論文翻譯：Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

相關部落格詳解一：https://blog.csdn.net/cdknight_happy/article/details/79731981 DeepSort論文學習 cdknight_happy 相關部落格詳解二：https://www.cnblogs.com/YiXiao

bit feild and CPU endian 位域和大小端

先看一個示例：// C code: bit fields & CPU endian #include <stdio.h> struct bit_field{ unsigned short bit4:4; unsigned short b

Mike Petersen dives deep into Cert Manager and Ingress

Mike Petersen starts out discussing kube-lego and cert manager history and its architecture. And demos the current state of Cert Mana

Using Istio across private and public clusters

Summary If you decided to go the hybrid cloud route, you know it isn't easy to manage all your different workloads. In this pattern,

深度遷移度量網路 Deep Transfer Metric Learning

論文地址：Deep Transfer Metric Learning 摘要（abstract）傳統的度量學習方法同城假定訓練和測試集是在相同的情景獲取得到，因此假設他們的分佈是一樣的。但是在實際視覺識別應用中，這種假設往往不符合的。特別是當這些樣本來源於不同的資料集。這篇論文提

Transfer WorkDocs File and Folder Ownership

Amazon Web Services is Hiring. Amazon Web Services (AWS) is a dynamic, growing business unit within Amazon.com. We are currently hiring So

Automatic Speech Recognition: A Deep Learning Approach (Signals and Communication Technology): Dong Yu, Li Deng: 9781447157786:

This book provides a comprehensive overview of the recent advancement in the field of automatic speech recognition with a focus on deep learn

Simultaneous Deep Transfer Across Domains and Tasks 域和任務同時深度遷移

通過域融合完成域對齊

通過soft labels對齊源域和目標域類別

參考

Simultaneous Deep Transfer Across Domains and Tasks 域和任務同時深度遷移

【論文：麥克風陣列增強】Speech Enhancement Based on the General Transfer Function GSC and Postfiltering

論文筆記-Joint Deep Modeling of Users and Items Using Reviews for Recommendation

論文閱讀計劃2(Deep Joint Rain Detection and Removal from a Single Image)

命名空間 and 作用域

理解javaScript中的作用域和上下文Understanding Scope and Context in JavaScript

論文翻譯：Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

bit feild and CPU endian 位域和大小端

Mike Petersen dives deep into Cert Manager and Ingress

Using Istio across private and public clusters

深度遷移度量網路 Deep Transfer Metric Learning

Transfer WorkDocs File and Folder Ownership

Automatic Speech Recognition: A Deep Learning Approach (Signals and Communication Technology): Dong Yu, Li Deng: 9781447157786:

16 On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima 1609.04836v1

Distributed deep learning with Horovod and PowerAI DDL

Deep SORT: Simple Online and Realtime Tracking with a Deep Association Metric

《On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima》-ICLR2017文章閱讀

論文翻譯：Speech Enhancement Based on the General Transfer Function GSC and Postfiltering

ajax主域和子域之間的跨域問題

Ajax跨域、Json跨域、Socket跨域和Canvas跨域等同源策略限制的解決方法

Simultaneous Deep Transfer Across Domains and Tasks 域和任務同時深度遷移

通過域融合完成域對齊

通過soft labels對齊源域和目標域類別

參考

相關推薦