機器學習之KPCA降維

阿新 • • 發佈：2018-11-29

機器學習之KPCA降維

# -*- coding: utf-8 -*-
"""
Created on Sun Nov 25 21:30:48 2018

@author: muli
"""

import numpy as np
import matplotlib.pyplot as plt
from sklearn import  datasets,decomposition


def load_data():
    '''
    載入用於降維的資料

    :return: 一個元組，依次為訓練樣本集和樣本集的標記
    '''
    iris=datasets.load_iris()# 使用 scikit-learn 自帶的 iris 資料集
    return  iris.data,iris.target


def test_KPCA(*data):
    '''
    測試 KernelPCA 的用法

    :param data: 可變引數。
    它是一個元組，這裡要求其元素依次為：訓練樣本集、訓練樣本的標記
    :return: None
    '''
    X,y=data
    kernels=['linear','poly','rbf','sigmoid']
    for kernel in kernels:
        kpca=decomposition.KernelPCA(n_components=None,kernel=kernel) # 依次測試四種核函式
        kpca.fit(X)
        print(np.shape(kpca.lambdas_))
        print("-----------")
        print('kernel=%s --> lambdas: %s'% (kernel,kpca.lambdas_))


def plot_KPCA(*data):
    '''
    繪製經過 KernelPCA 降維到二維之後的樣本點

    :param data: 可變引數。它是一個元組，這裡要求其元素依次為：訓練樣本集、訓練樣本的標記
    :return: None
    '''
    X,y=data
    kernels=['linear','poly','rbf','sigmoid']
    fig=plt.figure()
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 顏色集合，不同標記的樣本染不同的顏色

    for i,kernel in enumerate(kernels):
        kpca=decomposition.KernelPCA(n_components=2,kernel=kernel)
        kpca.fit(X)
        # 原始資料集轉換到二維
        X_r=kpca.transform(X)
        ax=fig.add_subplot(2,2,i+1) ## 兩行兩列，每個單元顯示一種核函式的 KernelPCA 的效果圖
        for label ,color in zip( np.unique(y),colors):
            position=y==label
            ax.scatter(X_r[position,0],X_r[position,1],label="target= %d"%label,
            color=color)
        ax.set_xlabel("X[0]")
        ax.set_ylabel("X[1]")
#        ax.legend(loc="best")
        ax.set_title("kernel=%s"%kernel)
    plt.suptitle("KPCA")
    plt.show()


def plot_KPCA_poly(*data):
    '''
    繪製經過 使用 poly 核的KernelPCA 降維到二維之後的樣本點

    :param data: 可變引數。
    它是一個元組，這裡要求其元素依次為：訓練樣本集、訓練樣本的標記
    :return: None
    '''
    X,y=data
    fig=plt.figure()
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 顏色集合，不同標記的樣本染不同的顏色
    Params=[(3,1,1),(3,10,1),(3,1,10),(3,10,10),(10,1,1),(10,10,1),(10,1,10),(3,3,1)] # poly 核的引數組成的列表。
            # 每個元素是個元組，代表一組引數（依次為：p 值， gamma 值， r 值）
            # p 取值為：3，10
            # gamma 取值為 ：1，10
            # r 取值為：1，10
            # 排列組合一共 8 種組合
    for i,(p,gamma,r) in enumerate(Params):
        kpca=decomposition.KernelPCA(n_components=2,kernel='poly'
        ,gamma=gamma,degree=p,coef0=r)  # poly 核，目標為2維
        kpca.fit(X)
        X_r=kpca.transform(X)# 原始資料集轉換到二維
        ax=fig.add_subplot(2,4,i+1)## 兩行四列，每個單元顯示核函式為 poly 的 KernelPCA 一組引數的效果圖
        for label ,color in zip( np.unique(y),colors):
            position=y==label
            ax.scatter(X_r[position,0],X_r[position,1],label="target= %d"%label,
            color=color)
        ax.set_xlabel("X[0]")
        ax.set_xticks([]) # 隱藏 x 軸刻度
        ax.set_yticks([]) # 隱藏 y 軸刻度
        ax.set_ylabel("X[1]")
#        ax.legend(loc="best")
        ax.set_title(r"$ (%s (x \cdot z+1)+%s)^{%s}$"%(gamma,r,p))
    plt.suptitle("KPCA-Poly")
    plt.show()


def plot_KPCA_rbf(*data):
    '''
    繪製經過 使用 rbf 核的KernelPCA 降維到二維之後的樣本點

    :param data: 可變引數。它是一個元組，這裡要求其元素依次為：訓練樣本集、訓練樣本的標記
    :return: None
    '''
    X,y=data
    fig=plt.figure()
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 顏色集合，不同標記的樣本染不同的顏色
    Gammas=[0.5,1,4,10]# rbf 核的引數組成的列表。每個引數就是 gamma值
    for i,gamma in enumerate(Gammas):
        kpca=decomposition.KernelPCA(n_components=2,kernel='rbf',gamma=gamma)
        kpca.fit(X)
        X_r=kpca.transform(X)# 原始資料集轉換到二維
        ax=fig.add_subplot(2,2,i+1)## 兩行兩列，每個單元顯示核函式為 rbf 的 KernelPCA 一組引數的效果圖
        for label ,color in zip( np.unique(y),colors):
            position=y==label
            ax.scatter(X_r[position,0],X_r[position,1],label="target= %d"%label,
            color=color)
        ax.set_xlabel("X[0]")
        ax.set_xticks([]) # 隱藏 x 軸刻度
        ax.set_yticks([]) # 隱藏 y 軸刻度
        ax.set_ylabel("X[1]")
#        ax.legend(loc="best")
        ax.set_title(r"$\exp(-%s||x-z||^2)$"%gamma)
    plt.suptitle("KPCA-rbf")
    plt.show()


def plot_KPCA_sigmoid(*data):
    '''
    繪製經過 使用 sigmoid 核的KernelPCA 降維到二維之後的樣本點

    :param data: 可變引數。它是一個元組，這裡要求其元素依次為：訓練樣本集、訓練樣本的標記
    :return: None
    '''
    X,y=data
    fig=plt.figure()
    colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),
        (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 顏色集合，不同標記的樣本染不同的顏色
    Params=[(0.01,0.1),(0.01,0.2),(0.1,0.1),(0.1,0.2),(0.2,0.1),(0.2,0.2)]# sigmoid 核的引數組成的列表。
        # 每個元素就是一種引數組合（依次為 gamma,coef0）
        # gamma 取值為： 0.01，0.1，0.2
        # coef0 取值為： 0.1,0.2
        # 排列組合一共有 6 種組合
    for i,(gamma,r) in enumerate(Params):
        kpca=decomposition.KernelPCA(n_components=2,kernel='sigmoid',gamma=gamma,coef0=r)
        kpca.fit(X)
        X_r=kpca.transform(X)# 原始資料集轉換到二維
        ax=fig.add_subplot(3,2,i+1)## 三行兩列，每個單元顯示核函式為 sigmoid 的 KernelPCA 一組引數的效果圖
        for label ,color in zip( np.unique(y),colors):
            position=y==label
            ax.scatter(X_r[position,0],X_r[position,1],label="target= %d"%label,
            color=color)
        ax.set_xlabel("X[0]")
        ax.set_xticks([]) # 隱藏 x 軸刻度
        ax.set_yticks([]) # 隱藏 y 軸刻度
        ax.set_ylabel("X[1]")
#        ax.legend(loc="best")
        ax.set_title(r"$\tanh(%s(x\cdot z)+%s)$"%(gamma,r))
    plt.suptitle("KPCA-sigmoid")
    plt.show()
    

if __name__=='__main__':
    X,y=load_data() # 產生用於降維的資料集
#    test_KPCA(X,y)   # 呼叫 test_KPCA
#    plot_KPCA(X,y)   # 呼叫 plot_KPCA
#    plot_KPCA_poly(X,y)   # 呼叫 plot_KPCA_poly
#    plot_KPCA_rbf(X,y)   # 呼叫 plot_KPCA_rbf
    plot_KPCA_sigmoid(X,y)   # 呼叫 plot_KPCA_sigmoid

如圖：

機器學習之KPCA降維

機器學習之KPCA降維 # -*- coding: utf-8 -*- """ Created on Sun Nov 25 21:30:48 2018 @author: muli """ import numpy as np import matplotlib.py

【火爐煉AI】機器學習053-資料降維絕招-PCA和核PCA

【火爐煉AI】機器學習053-資料降維絕招-PCA和核PCA (本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 主成分分析（Principal Component Analysis, PCA)可以

吳恩達機器學習 - PCA演算法降維吳恩達機器學習 - PCA演算法降維

原吳恩達機器學習 - PCA演算法降維 2018年06月25日 13:08:17 離殤灬孤狼閱讀數：152 更多

人工智障學習筆記——機器學習(13)LLE降維

一.概念 LLE：Locally linear embedding(區域性線性嵌入演算法)是一種非線性降維演算法，它能夠使降維後的資料較好地保持原有流形結構。LLE可以說是流形學習方法最經典的工作之一。和傳統的PCA，LDA等關注樣本方差的降維方法相比，LLE關注於降維時保

機器學習：資料降維

1、主成分分析（Principle Component Analysis，PCA）PCA原理主成分分析是最常用的一種降維方法，為了便於維度變換，作出如下假設：1）樣本資料是維的。2）原始座標系為：由標準

機器學習筆記13-降維

機器學習筆記13-降維低維嵌入在高維情形下資料樣本會出現稀疏、距離計算困難等問題，稱為“維數災難”，緩解維數災難的一個重要途徑是降維，即通過數學變換將原始高維屬性空間轉變為一個低維子空間，在這個子空間中樣本密度大幅提高，距離計算也變得更為容易。若要求原始空間中樣本之間的距離

人工智障學習筆記——機器學習(12)LDA降維

一.概念LDA：Linear Discriminant Analysis (也有叫做Fisher Linear Discriminant)。與PCA一樣，是一種線性降維演算法。不同於PCA只會選擇資料變化最大的方向，由於LDA是有監督的（分類標籤），所以LDA會主要以類別為

人工智障學習筆記——機器學習(11)PCA降維

一.概念 Principal Component Analysis(PCA)：主成分分析法，是最常用的線性降維方法，它的目標是通過某種線性投影，將高維的資料對映到低維的空間中表示，即把原先的n個特徵用數目更少的m個特徵取代，新特徵是舊特徵的線性組合。並期望在所投影的維度上資

機器學習四大資料降維方法詳解

引言：機器學習領域中所謂的降維就是指採用某種對映方法，將原高維空間中的資料點對映到低維度的空間中。降維的本質是學習一個對映函式 f : x->y，其中x是原始資料點的表達，目前最多使用向量表達形式。 y是資料點對映後的低維向量表達，通常y的維度小於x的維度（當然提高維度也是可以的）。f可能是顯

維度打擊，機器學習中的降維演算法：ISOMAP & MDS

降維是機器學習中很有意思的一部分，很多時候它是無監督的，能夠更好地刻畫資料，對模型效果提升也有幫助，同時在資料視覺化中也有著舉足輕重的作用。一說到降維，大家第一反應總是PCA，基本上每一本講機器學習的書都會提到PCA，而除此之外其實還有很多很有意思的降維演算

吳恩達機器學習筆記 —— 15 降維

本章重點講述了降維方法以及其中最主要的PCA主成分分析的原理、使用降維的作用：資料壓縮與視覺化降維的第一個作用就是進行資料的壓縮，解決磁碟和計算的問題。比如把二維資料降維到一維：或者資料從三維降維到2維。降維的另一個作用就是進行視覺化，比如我們的資料有很多維度，如果想要在圖形上展示各個資料，

[吳恩達機器學習筆記]14降維1-2降維的應用資料壓縮與資料視覺化

14.降維覺得有用的話,歡迎一起討論相互學習~Follow Me 14.1動機一：資料壓縮降維也是一種無監督學習的方法，降維並不需要使用資料的標籤。降維的其中一個目的是資料壓

機器學習演算法（降維）—SVD奇異值分解

一、SVD奇異值分解的定義假設是一個的矩陣，如果存在一個分解：其中為的酉矩陣，為的半正定對角矩陣，為的共軛轉置矩陣，且為的酉矩陣。這樣的分解稱為的奇異值分解，對角線上的元素稱為奇異值，稱

【機器學習】資料降維—主成分分析（PCA）

本文程式碼推薦使用Jupyter notebook跑，這樣得到的結果更為直觀。主成分分析（PCA）特徵抽取通常用於提高計算效率，降低維度災難。主成分分析（Principe component analysis，PCA）：是一種廣泛應用於不同領域的無監督

【機器學習】資料降維—線性判別分析（LDA）

本文程式碼推薦使用Jupyter notebook跑，這樣得到的結果更為直觀。線性判別分析（Linear Discriminant Analysis,LDA）是一種可作為特徵抽取的技術 LDA可以提

淺析機器學習中的降維方法

在我們用機器學習去訓練資料集的時候，可能會遇到上千甚至上萬個特徵，隨著資料量的增大，所分析出結果的準確度雖然會提高很多，但同時處理起來也會變得十分棘手，此時我們不得不想出一種方法去減少特徵將高維的資料轉化為低維的資料（降維）。什麼是降維？簡單的說降維就是把一個n維的資

機器學習之路：python 特征降維主成分分析 PCA

repo nts total python learning bsp ota spa 像素 python3 學習api使用主成分分析方法實現降低維度使用了網絡上的數據集，我已經下載到了本地，可以去我的git上參考 git:https://github.com/lin

機器學習實踐（五）—sklearn之特徵降維

一、特徵降維概述為什麼要對特徵進行降維處理如果特徵本身存在問題或者特徵之間相關性較強，對於演算法學習預測會影響較大什麼是降維降維是指在某些限定條件下，降低隨機變數(特徵)個數，得到一組“不

機器學習之多維縮放(MDS)降維

機器學習之多維縮放(MDS)降維 # -*- coding: utf-8 -*- """ Created on Mon Nov 26 17:25:11 2018 @author: muli """ import numpy as np import matplotl

ML-64: 機器學習之線性判別分析(Linear Discriminant Analysis)降維演算法+程式碼

線性判別分析(Linear Discriminant Analysis)降維演算法機器學習分為監督學習、無監督學習和半監督學習(強化學習)。無監督學習最常應用的場景是聚類(clustering)和降維(dimension reduction)。聚類演算法包括

機器學習之KPCA降維

相關推薦