機器學習之圖半監督學習LabelSpreading

阿新 • • 發佈：2018-12-23

機器學習之圖半監督學習LabelSpreading

# -*- coding: utf-8 -*-
"""
Created on Tue Dec  4 13:32:30 2018

@author: muli
"""

import numpy as np
import matplotlib.pyplot as plt
from sklearn import  metrics
from sklearn import datasets

from scipy.sparse.csgraph import connected_components
# 解決AttributeError: module 'scipy.sparse' has no attribute 'csgraph'問題
from sklearn.semi_supervised.label_propagation import LabelSpreading


def load_data():
    '''
    載入資料集

    :return: 一個元組，依次為： 樣本集合、樣本標記集合、 未標記樣本的下標集合
    '''
    digits = datasets.load_digits()
    ######   混洗樣本　########
    rng = np.random.RandomState(0)
    indices = np.arange(len(digits.data)) # 樣本下標集合
    rng.shuffle(indices) # 混洗樣本下標集合
    X = digits.data[indices]
    y = digits.target[indices]
    ###### 生成未標記樣本的下標集合 ####
    n_labeled_points = int(len(y)/10) # 只有 10% 的樣本有標記
    unlabeled_indices = np.arange(len(y))[n_labeled_points:] # 後面 90% 的樣本未標記

    return X,y,unlabeled_indices


def test_LabelSpreading(*data):
    '''
    測試 LabelSpreading 的用法

    :param data: 一個元組，依次為： 樣本集合、樣本標記集合、 未標記樣本的下標集合
    :return: None
    '''
    X,y,unlabeled_indices=data
    y_train=np.copy(y) # 必須拷貝，後面要用到 y
    y_train[unlabeled_indices]=-1 # 未標記樣本的標記設定為 -1
    clf=LabelSpreading(max_iter=100,kernel='rbf',gamma=0.1)
    clf.fit(X,y_train)
    ### 獲取預測準確率
    predicted_labels = clf.transduction_[unlabeled_indices] # 預測標記
    true_labels = y[unlabeled_indices] # 真實標記
    print("Accuracy:%f"%metrics.accuracy_score(true_labels,predicted_labels))
    # 或者 print("Accuracy:%f"%clf.score(X[unlabeled_indices],true_labels))
    

def test_LabelSpreading_rbf(*data):
    '''
    測試 LabelSpreading 的 rbf 核時，預測效能隨 alpha 和 gamma 的變化

    :param data: 一個元組，依次為： 樣本集合、樣本標記集合、 未標記樣本的下標集合
    :return: None
    '''
    X,y,unlabeled_indices=data
    y_train=np.copy(y) # 必須拷貝，後面要用到 y
    y_train[unlabeled_indices]=-1 # 未標記樣本的標記設定為 -1

    fig=plt.figure()
    ax=fig.add_subplot(1,1,1)
    alphas=np.linspace(0.01,1,num=10,endpoint=False)
    gammas=np.logspace(-2,2,num=50)
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),) # 顏色集合，不同曲線用不同顏色
    ## 訓練並繪圖
    for alpha,color in zip(alphas,colors):
        scores=[]
        for gamma in gammas:
            clf=LabelSpreading(max_iter=100,gamma=gamma,alpha=alpha,kernel='rbf')
            clf.fit(X,y_train)
            scores.append(clf.score(X[unlabeled_indices],y[unlabeled_indices]))
        ax.plot(gammas,scores,label=r"$\alpha=%s$"%alpha,color=color)

    ### 設定圖形
    ax.set_xlabel(r"$\gamma$")
    ax.set_ylabel("score")
    ax.set_xscale("log")
    ax.legend(loc="best")
    ax.set_title("LabelSpreading rbf kernel")
    plt.show()


def test_LabelSpreading_knn(*data):
    '''
   測試 LabelSpreading 的 knn 核時，預測效能隨 alpha 和 n_neighbors 的變化


    :param data:  一個元組，依次為： 樣本集合、樣本標記集合、 未標記樣本的下標集合
    :return:  None
    '''
    X,y,unlabeled_indices=data
    y_train=np.copy(y) # 必須拷貝，後面要用到 y
    y_train[unlabeled_indices]=-1 # 未標記樣本的標記設定為 -1

    fig=plt.figure()
    ax=fig.add_subplot(1,1,1)
    alphas=np.linspace(0.01,1,num=10,endpoint=False)
    Ks=[1,2,3,4,5,8,10,15,20,25,30,35,40,50]
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),) # 顏色集合，不同曲線用不同顏色
    ## 訓練並繪圖
    for alpha,color in zip(alphas,colors):
        scores=[]
        for K in Ks:
            clf=LabelSpreading(kernel='knn',max_iter=100,n_neighbors=K,alpha=alpha)
            clf.fit(X,y_train)
            scores.append(clf.score(X[unlabeled_indices],y[unlabeled_indices]))
        ax.plot(Ks,scores,label=r"$\alpha=%s$"%alpha,color=color)

    ### 設定圖形
    ax.set_xlabel(r"$k$")
    ax.set_ylabel("score")
    ax.legend(loc="best")
    ax.set_title("LabelSpreading knn kernel")
    plt.show()


 
if __name__=='__main__':
    data=load_data() # 獲取半監督分類資料集
#    test_LabelSpreading(*data) # 呼叫 test_LabelSpreading
#    test_LabelSpreading_rbf(*data)# 呼叫 test_LabelSpreading_rbf
    test_LabelSpreading_knn(*data)# 呼叫 test_LabelSpreading_knn

如圖：

機器學習之圖半監督學習LabelSpreading

機器學習之圖半監督學習LabelSpreading # -*- coding: utf-8 -*- """ Created on Tue Dec 4 13:32:30 2018 @author: muli """ import numpy as np import

機器學習之圖半監督學習LabelPropagation

機器學習之圖半監督學習LabelPropagation # -*- coding: utf-8 -*- """ Created on Tue Dec 4 12:17:46 2018 @author: muli """ import numpy as np impo

機器學習15：半監督學習semi-supervised

一、why semi-supervised dataset中只有部分資料進行了lable標註，即，有的資料成對出現｛輸入，輸出｝，有的資料只有輸入｛輸入｝； Transductive learning（直推試學習）：unlabled資料作為測試集； Inductive learning（

圖半監督學習——標記傳播

從書上301~304頁的介紹可知，圖半監督學習具有兩個明顯的缺點：處理大規模資料時效能欠佳；難以直接對新樣本進行分類。下面採用sklearn的半監督學習模組來驗證上述特性。選用iris資料集的第1、3項屬性開展測試，skle

從零開始-Machine Learning學習筆記(29)-半監督學習

文章目錄 1. 生成式方法 2. 半監督SVM(Semi-Supervised Support Vector Machine, S3VM) 3. 圖半監督學習 3.1 針對於二分類問題的標記傳播

目標追蹤論文之狼吞虎嚥(5):基於張量的圖嵌入半監督學習及其在判別式目標追蹤的應用

一、摘要作者將一個影象（image patch）看做是一個保留了原始影象結構的二階張量，然後設計了兩個圖來描繪目標和背景所在的張量樣本中固有的區域性幾何結構，從而構建一個判別式嵌入空間。圖嵌入可以在降低張量維度的同時保留著圖的結構。此外，作者提出了兩種思路(？)用來尋找原始張量樣

吳裕雄 python 機器學習——半監督學習LabelSpreading模型

info cti 預測 knn mas 設定分享 test int import numpy as np import matplotlib.pyplot as plt from sklearn import metrics from sklearn im

【GCN】圖卷積網路的半監督學習脈絡

1、入門：知乎回答：從CNN到GCN的聯絡與區別——GCN從入門到精（fang）通（qi） 2、論文閱讀：論文地址：SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS 論文翻譯1：圖卷積神經網路的半監督

[深度學習]半監督學習、無監督學習之Autoencoders自編碼器(附程式碼)

目錄自編碼器介紹從零開始訓練自編碼器驗證模型訓練結果視覺化結果載入預訓練模型自編碼器介紹自編碼器的結構簡單，由Encoder和Decoder組成，Encoder產生的Latent variables是潛在變數，它是Decoder的輸入。

[深度學習]半監督學習、無監督學習之DCGAN深度卷積生成對抗網路(附程式碼)

論文全稱：《Generative Adversarial Nets》論文地址：https://arxiv.org/pdf/1406.2661.pdf 論文全稱：《UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GEN

機器學習與深度學習系列連載：第一部分機器學習（十三）半監督學習（semi-supervised learning）

在實際資料收集的過程中，帶標籤的資料遠遠少於未帶標籤的資料。我們據需要用帶label 和不帶label的資料一起進行學習，我們稱作半監督學習。 Transductive learning：沒有標籤的資料是測試資料 Inductive learning：沒有標

[深度學習]半監督學習、無監督學習之Variational Auto-Encoder變分自編碼器(附程式碼)

論文全稱：《Auto-Encoding Variational Bayes》論文地址：https://arxiv.org/pdf/1312.6114.pdf 論文程式碼： keras 版本：https://github.com/bojone/vae pytorch 版本：https

機器學習中的有監督學習，無監督學習，半監督學習

3、監督式學習有兩種形態的模型。最一般的，監督式學習產生一個全域模型，會將輸入物件對應到預期輸出。而另一種，則是將這種對應實作在一個區域模型。（如案例推論及最近鄰居法）。為了解決一個給定的監督式學習的問題（手寫辨識），必須考慮以下步驟： 1）決定訓練資料的範例的形態。在做其它事前，工程師應決定要使用哪種資料為

半監督學習之self-training

一，半監督學習　　半監督學習是一種介於監督式學習和無監督學習之間的學習正規化，我們都知道，在監督式學習中，樣本的類別標籤都是已知的，學習的目的找到樣本的特徵與類別標籤之間的聯絡。一般來講訓練樣本的數量越多，訓練得到的分類器的分類精度也會越高。但是在很多現實問

資料科學個人筆記：推薦系統之推薦演算法（基於內容+標籤+半監督學習模型）

一、基於內容的模型（一）推薦系統冷啟動問題使用者冷啟動：給新使用者推薦物品冷啟動：新物品被推薦系統冷啟動：為新開發的網站（還沒有使用者和使用者行為，只有一些物品資訊）設計推薦系統冷啟動問題的一些解決方案：1.推薦熱門；2.用註冊資訊進行粗粒度的個性化；3.

機器學習中的有監督學習，無監督學習，半監督學習的區別

在機器學習(Machine learning)領域，主要有三類不同的學習方法：監督學習(Supervised learning)、非監督學習(Unsupervised learning)、半監督學習(Semi-supervised learning)，監督學

機器學習-----有監督，無監督，半監督學習的簡單闡釋

來源：機器學習演算法盤點 - ranjiewen - 部落格園http://www.cnblogs.com/ranjiewen/p/6235388.html為啥感覺完全是被圈粉了----好厲害啊------主頁都那麼漂亮文章：機器學習演算法盤點：　機器學習無疑是當前資料分

結合圖拉普拉斯的半監督學習

摘要：在半監督學習中一個基本的問題是對於潛在資料如何建造圖。我們提出使用結合一系列不同的構造圖方法。我們計算最優的結合核函式。這個核解決了一個拓展的regularization問題，其要求一個共同最小包括資料和圖核集合。我們呈現很好的結果在不同的OCK任務上，最

機器視覺學習之--貝葉斯學習 MATLAB二維正態分佈二維圖

1、貝葉斯介紹我個人一直很喜歡演算法一類的東西，在我看來演算法是人類智慧的精華，其中蘊含著無與倫比的美感。而每次將學過的演算法應用到實際中，並解決了實際問題後，那種快感更是我在其它地方體會不到的。一直想寫關於演算法的博文，也曾寫過零散的兩篇，但也許是相

機器學習（二）：有監督學習、無監督學習和半監督學習

一、基本概念 1 特徵（feature）資料的特徵。舉例：書的內容 2 標籤（label）資料的標籤。舉例：書屬於的類別，例如“計算機”“圖形學”“英文書”“教材”等。 3 學習（learning）將很多資料丟給計算機分析，以此

機器學習之圖半監督學習LabelSpreading

相關推薦