遷移學習、元學習、強化學習、聯邦學習等

阿新 • • 發佈：2022-03-18

1、遷移學習（Transfer Learning）

直觀理解：站在巨人的肩膀上學習。根據已有經驗來解決相似任務，類似於你用騎自行車的經驗來學習騎摩托車。
專業理解：將訓練好的內容應用到新的任務上，即將源域（被遷移物件）應用到目標域（被賦予經驗的領域）。
遷移學習不是具體的模型，更類似於解題思路。
當神經網路很簡單，訓練一個小的神經網路不需要特別多的時間，完全可以從頭開始訓練。如果遷移之前的資料和遷移後的資料差別很大，這時遷移來的模型起不到很大的作用，還可能干擾後續的決策。
應用場景：目標領域資料太少、節約訓練時間、實現個性化應用。
實際擅長應用例舉：語料匱乏的小語種之間的翻譯、缺乏標註的醫療影像資料識別、面向不同領域快速部署對話系統。

NLP領域中的應用：Transformer、Bert之類的預訓練語言模型，微調後可以完成不同的任務。

2、元學習（Meta Learning)

與傳統的監督學習不一樣，傳統的監督學習要求模型來識別訓練資料並且泛化到測試資料。
訓練目標：Learn to Learn，自己學會學習。例：你不認識恐龍，但是你有恐龍的卡片，這樣看見一張新的圖片時，你知道新的圖片上的動物與卡片上的動物長得很像，是同類的。
靠一張卡片來學習識別叫做：one-shot learning。

3、小樣本學習（Few-Shot Learning）

Few-Shot Learning是一種Meta Learning。
用很少的資料來做分類或迴歸。例如：模型學會了區分事物的異同，例如：雖然資料集中沒有狗的照片，模型不會識別狗，但模型也能判斷兩張狗的圖片上的事物是同類的。

資料集：Support Set。Support Set與訓練集的區別：訓練集的規模很大，每一類下面有很多圖片，可以用來訓練一個深度神經網路。相比這下，Support Set資料集比較小，每一類下面只有一張或幾張圖片，不足以訓練一個大的神經網路。Support Set只能在做預測的時候提供一些額外的資訊。
用足夠大的訓練集來訓練一個大模型，比如深度神經網路，訓練的目的不是為了讓模型來識別訓練集裡的事物，而是讓模型學會區分事物的異同。
傳統監督學習 VS Few-Shot Learning：傳統監督學習是先用一個訓練集來學習一個模型，模型學習好之後可以用來做預測，給一張沒有出現在訓練集中的圖片，模型沒有見過這張圖片，但是測試圖片的類別包含在訓練集中，模型能很容易就判斷出圖片的類別。而Few-Shot Learning不僅沒有見過這張圖片，訓練集中也沒有該類別的圖片。Few-Shot Learning的任務比傳統監督學習更難。

k-way n-shot Support Set：Support Set中有k個類別，每個類別；裡有n個樣本。

4、強化學習（Reinforcement Learning）

不是某種特定的模型和演算法，指的是訓練方法。
舉例：下棋：每當落下一子，對方都會再落下一子，這時主體就要認識新的局面也就是新的環境，分析判斷後再行動，主體的目標是在儘可能多的棋局中獲勝。
由於主體的每個行為都會改變環境，這決定了強化學習無法使用資料集訓練，只能通過真是環境或模擬器產生的資料來學習，由於計算量大，效率低，除AlphaGo和遊戲AI外落地應用並不多。
實際應用：推薦系統每次都會影響人們的購買，系統需要根據新的市場資料給出新的推薦；股票市場中每個人每時每刻買入賣出都會影響股價，交易系統需要理解新的環境後再行動。
強化學習演算法可以分為兩類：基於模型的（試圖用模型模擬真實環境）。無模型的（不模擬環境，只根據反饋資料構建關於回報的模型）。
在強化學習中，做出決策的一方稱為Agent（主體），主體每做出一個動作，環境都會給予反饋，主體會在評估反饋之後決定下一個動作。一切動作的基礎都是回報，目標是長期，也就是未來的回報儘可能的大。

5、深度強化學習（Deep Reinforcement Learning DRL)

深度強化學習：使用神經網路構建強化學習主體的方法。
使用深度強化學習原因：強化學習面對的情景多種多樣，環境、行為、回報很難窮盡，只要有輸入就一定有輸出，神經網路面對沒有見過的情況也能做出選擇。
Value-Based Method，將關注點放在回報上：
- DQN（Deep Q-Learning Network）：用數值Q表示特定狀態下采取某行動的收益，將計算Q的工作交給神經網路；
- DDQN（Double Deep Q-Learning Network）增加一個對Q值評估相對謹慎的網路，平衡兩者之間的看法，防止主體過於激進。
- NoiseNet：為了提高探索能力，適當在網路中增加噪音，增加主體的隨機性。
- RainBow:DQN+DDQN+NoiseNet.
Policy-Based Method，將關注點放在動作的選擇上：
- Policy Gradient，策略梯度：如果一個動作能使最終回報變大，就增加這個動作出現的概率，反之就減少。
Combination
- Actor-Critic：如果我們讓選擇動作的網路擔任主體Actor，關注回報的網路擔任老師Critic，為主體的表現打分提供指導。
- A3C（Asynchronous Advantage Actor-Critic）：使用多個Actor-Critic網路同時探索環境，並將採集到的資料交由主網路更新引數。

6、聯邦學習

二人同心，其利斷金。團結就是力量，機器學習同樣如此，資料越多，訓練出的模型效果越好，所以將大家的資料放在一起使用，每個人都能得到更好的模型。
現實世界中，資料是屬於使用者的，既不能不作申請的使用它們，還要保護資料的私密性。聯邦學習：安全高效的實現資料合作。
橫向聯邦學習（Horizontal Federated Learning）或特徵對對齊的聯邦學習（Feature-Aligned Federated Learning）：參與者們業務相似，資料的特徵重疊多，樣本重疊少（比如不同地區的兩家銀行），就可以通過上傳引數，在伺服器中聚合更新模型，再將最新的引數下放完成模型效果的提升。
縱向聯邦學習（Vertical Federated Learning）或樣本對對齊的聯邦學習（Sample-Aligned Federated Learning）：參與者的資料中樣本重疊多，特徵重疊少（比如同一地區的銀行和電商），就需要先將樣本對齊，由於不能直接比對，我們需要加密演算法的幫助，讓參與者在不暴露不重疊樣本的情況下，找出相同的樣本後聯合它們的特徵進行學習。
聯邦遷移學習：如果樣本和特徵重合的都不多，希望利用資料提升模型能力，就需要將參與者的模型和資料遷移到同一空間中運算。
目標：解決資料的協作和隱私問題。

PS：我只是知識的搬運工！！！

遷移學習、元學習、強化學習、聯邦學習等

1、遷移學習（Transfer Learning）直觀理解：站在巨人的肩膀上學習。根據已有經驗來解決相似任務，類似於你用騎自行車的經驗來學習騎摩托車。

TypeScript學習——陣列、元組、介面(2)

陣列陣列型別註解 const numberArr: (number | string)[] = [1, \'2\', 3]; //既可以是number 也可以是string

(Python學習) 40. Python 常用內建資料結構部分總結-列表、元組、字典、集合

一、列表list 1. 列表的特徵　　1. 列表中的每個元素都可變的，意味著可以對每個元素進行修改和刪除；

《Django Web應用開發實戰》學習筆記 14- Django模型-模型定義、資料遷移

目錄學習資料1. 模型與資料庫2. 模型定義與資料遷移2.1 定義模型django Model中常用型別欄位每個模型欄位的引數模型中Meta的屬性2.2 資料遷移資料匯入、匯出

python 學習（七）- 序列、列表、元組、字典、集合

一、序列序列是 python 中最基本的資料結構，序列中的元素都有對應的位置值，該位置值稱為索引，其中序列型別包括字串、列表、元組、集合和字典，區別在於：

某教程學習筆記（一）：08、MSSQL資料庫漏洞

你永遠不知道，愛你愛到發瘋的人，給你發過長篇大論的人，突然安靜下來，不再打擾你，他心裡經歷了怎樣的傷痛。。。

Java 學習筆記（三）之 ThreadLocal、InheritableThreadLocal、TransmittableThreadLocal

一、初識服務程式是由程序構成，程序是由無數個執行緒構成，執行緒是一組程式碼片段組成。在Java的多執行緒程式設計中，為保證多個執行緒對共享變數的安全訪問，通常會使用synchronized來保證同一時刻只有一個執行緒

深度學習伺服器完整配置手冊（三、GPU顯示卡cuda和驅動一起安裝，docker安裝）

引用： https://developer.nvidia.com/cuda-downloads https://blog.csdn.net/FYZ530357172/article/details/79217460

Pytorch學習筆記12----損失函式nn.CrossEntropyLoss()、nn.NLLLoss()

1.CrossEntropyLoss()損失函式 nn.CrossEntropyLoss()這個損失函式用於多分類問題雖然說的是交叉熵，但是和我理解的交叉熵不一樣。nn.CrossEntropyLoss()是nn.logSoftmax()和nn.NLLLoss()的整合,可以直接使用它來替換

OpenCV學習(5)--離散傅立葉變換、濾波、侵蝕、擴張

離散傅立葉變換 1 // 離散傅立葉變換 2 /* 3 離散傅立葉變換（DFT），是傅立葉變換在時域和頻域上都呈現離散的形式，將時域訊號

QT學習----建立Qt專案以及對.pro、.h檔案的介紹

一、建立專案 Location kits（構建套件） Details(類資訊) 彙總注意：點選建立專案後，選擇專案路徑以及給專案起名稱。名稱---不能有中文、不能有空格、不能有中文路徑。預設建立有視窗類，基類有

Tableau學習筆記——（1）tableau簡介、條形圖與直方圖

目錄 1、tableau簡介1.1 tableau精彩圖形案例1.2 tableau頁面介紹1.2.1 資料匯入介面1.2.2 資料來源介面1.2.3 工作表介面

Tableau學習筆記——（3）基本表、樹形圖、氣泡圖、詞雲

上一小節連結. 目錄 1、基本表1.1 基本表的使用1.2 凸顯表的使用 2、樹形圖2.1 不同型別電影數量與票房

[機器學習]評價指標：召回率(Recall)、準確率(Precision)、f1-score、Hit Ratio(HR)、NDCG、MAP(MARR)

目錄召回率(Recall)精確率(Precision)F1-scoreHit Ratio(HR)Normalized Discounted Cummulative Gain(NDCG)平均精度均值MAP（Mean Average Precision）

深度學習的優化器選擇（SGD、Momentum、RMSprop、Adam四種）

import torch import torch.utils.data as Data import torch.nn.functional as F import matplotlib.pyplot as plt

【JS高階程式設計(第4版)學習筆記】第四章變數、作用域與記憶體

4.1 原始值與引用值 ECMAScript變數可以包含兩種不同型別的資料：原始值和引用值。原始值就是最簡單的資料，引用值則是由多個值構成的物件。

Python學習系列之識別符號和保留字、變數（二）

Python中的識別符號和保留字保留字（也可以叫關鍵字），即有一些單詞被我賦予了特定的意義，這些單詞你在給你的任何物件起名字的時候都不能用　　比如：import keyword　　print(keyword.kwlist)

介面、抽象類以及匿名內部類的學習

用IDEA學習Java的第八天 instanceof和型別轉換 instanceof的作用就是判斷左邊物件是否是右邊類的例項，判斷物件是什麼型別。

Linux 學習筆記01丨Ubuntu系統安裝、配置及軟體教程集合

Ubuntu系統安裝 Windows10安裝ubuntu18.04雙系統教程 Ubuntu 20.04.1 映象下載軟碟通機械革命進入BIOS模式要按F2，注意將Boot Option中將U盤移到第一位。

Orcale資料庫學習之PL\SQL的使用、使用者的建立

這裡先說一下我的登入方法。一般來說在你下載安裝好Oracle之後，系統會自帶兩個user，一個是system dba，一個是system，我這裡是使用system登入的。

遷移學習、元學習、強化學習、聯邦學習等

相關推薦