遷移學習小記(一)僅用於學習記錄
萬事開頭難,剛接觸遷移學習,網上的資料水平又良莠不齊,在一時間沒能找到合適的學習資料,幸得老師為我們尋找了最新的也非常齊全的相關資料,讓我感到柳暗花明又一村。本應該動手實踐,但由於基本概念還未掌握,我選擇了先“紙上談兵”。以下記錄我本段時間的學習所得。
一.什麼是遷移學習
遷移學習,是指利用資料,任務,或者模型之間的相似性,將在舊的領域學習過的模型,應用於新領域的一種學習過程。
形式化定義如下:
-條件:給定一個源域Ds和源域上的學習任務Ts,目標域Dt和目標域上的學習任務Tt
-目標:利用Ds和Ts學習在目標域上的預測函式f(.)
-限制條件:Ds!=Dt或Ts!=Tt
(Domain-域:由資料特徵和特徵分佈組成,是學習的主體;源域是已有知識的域,目標域是要進行學習的域。 Task-任務:由目標函式和學習結果組成,是學習的結果)
二.遷移學習與其他概念的區別與聯絡
1.遷移學習VS傳統機器學習
2.遷移學習VS多工學習
多工學習是指多個相關任務一起協同學習;遷移學習則強調知識由一個領域遷移到另一個領域的過程。遷移是思想,多工是其中一個具體形式。
3.遷移學習VS終身學習
終身學習可以認為是序列化的多工學習,在已經學習好若干個任務之後,而面對新的任務可以繼續學習而不是遺忘之前學習的任務。遷移學習則側重於模型的遷移和共同學習。
4.遷移學習VS領域自適應
領域自適應問題是遷移學習的研究內容之一,它側重於解決特徵空間一致,類別空間一致,僅特徵分佈不一致的問題。而遷移學習也可以解決上述內容不一致的情況。
5.遷移學習VS增量學習
增量學習側重解決資料不斷到來,模型不斷更新的問題。
6.遷移學習VS自我學習
自我學習是指模型不斷地從自身處進行更新,而遷移學習強調知識在不同的領域間進行遷移。
7.遷移學習VS協方差漂移
協方差漂移是指資料的邊緣概率分佈發生變化。領域自適應研究問題解決的就是協方差漂移現象。
三.負遷移
在遷移學習中存在負遷移現象,即在源域上學習的知識,對於目標域上的學習產生負面作用。產生負遷移的主要原因有:(1)源域與目標域根本無相似性(2)源域與目標域是相似的,但是遷移學習的方法不夠好,沒找到可遷移的成分。
傳遞式學習可以較好的克服這一問題,傳統的遷移學習只有兩個領域足夠相似才可以完成,而當兩個領域不相似時,傳遞遷移學習可以將處於這兩個領域之間的若干領域,將知識傳遞式的完成遷移。其簡明示意圖如下:
四.常用的遷移學習分類方法
按照遷移情景分:歸納式遷移,直推式遷移,無監督式遷移
按照遷移方法分:基於實列的遷移,基於特徵的遷移,基於關係的遷移,基於模型的遷移
按照特徵空間分:同構遷移學習,異構遷移學習
本次只瞭解記錄了相關概念,後期會在動手實踐中再次補充記錄相關概念。