半監督學習之self-training

阿新 • • 發佈：2019-01-05

一，半監督學習

　　半監督學習是一種介於監督式學習和無監督學習之間的學習正規化，我們都知道，在監督式學習中，樣本的類別標籤都是已知的，學習的目的找到樣本的特徵與類別標籤之間的聯絡。一般來講訓練樣本的數量越多，訓練得到的分類器的分類精度也會越高。但是在很多現實問題當中，一方面由於人工標記樣本的成本十分高昂，導致了有標籤的樣本十分稀少。而另一方面，無標籤的樣本很容易被收集到，其數量往往是有標籤樣本的上百倍。半監督學習（這裡僅針對半監督分類）就是要利用大量的無標籤樣本和少量的有標籤樣本來訓練分類器，解決有標籤樣本不足這個難題。

二，self-training

self-training可能是最早被提出來的半監督學習方法，最早可以追溯到Scudder(1965)。self-training相比其它的半監督學習方法的優勢在於簡單以及不需要任何假設。這裡寫圖片描述

上面是self-training的演算法流程圖，簡單解釋一下：
1，將初始的有標籤資料集作為初始的訓練集

(X_{t r a i n}, y_{t r a i n}) = (X_{l}, y_{l})

，根據訓練集訓練得到一個初始分類器

C_{i n t}

。
2，利用

C_{i n t}

對無標籤資料集

X_{u}

中的樣本進行分類，選出最有把握的樣本

(X_{c o n f}, y_{c o n f})

3，從

X_{u}

中去掉

(X_{c o n f}, y_{c o n f})

4，將

(X_{c o n f}, y_{c o n f})

加入到有標籤資料集中，

(X_{t r a i n}, y_{t r a i n}) \leftarrow (X_{l}, y_{l}) \cup (X_{c o n f}, y_{c o n f})

5，根據新的訓練集訓練新的分類器，重複步驟2到5直到滿足停止條件（例如所有無標籤樣本都被標記完了）
最後得到的分類器就是最終的分類器。

半監督學習之self-training

一，半監督學習

二，self-training

半監督學習之self-training

半監督學習演算法——ATDA(Asymmetric Tri-training for Unsupervised Domain Adaptation)

目標追蹤論文之狼吞虎嚥(5):基於張量的圖嵌入半監督學習及其在判別式目標追蹤的應用

[深度學習]半監督學習、無監督學習之Autoencoders自編碼器(附程式碼)

[深度學習]半監督學習、無監督學習之DCGAN深度卷積生成對抗網路(附程式碼)

機器學習之圖半監督學習LabelPropagation

機器學習之圖半監督學習LabelSpreading

[深度學習]半監督學習、無監督學習之Variational Auto-Encoder變分自編碼器(附程式碼)

資料科學個人筆記：推薦系統之推薦演算法（基於內容+標籤+半監督學習模型）

監督學習，無監督學習和半監督學習

無監督學習之聚類2——DBSCAN

詳解使用EM算法的半監督學習方法應用於樸素貝葉斯文本分類

有監督學習、無監督學習、半監督學習

sklearn半監督學習

偽標籤：教你玩轉無標籤資料的半監督學習方法

【IM】關於半監督學習的理解

半監督學習演算法——標籤傳播演算法(LPA)與其擴充套件

【GCN】圖卷積網路的半監督學習脈絡

從零開始-Machine Learning學習筆記(29)-半監督學習

Strong Baselines for Neural Semi-supervised Learning under Domain Shift半監督學習

半監督學習之self-training

一，半監督學習

二，self-training

相關推薦