TSNE降維與視覺化

阿新 • • 發佈：2021-01-04

技術標籤：學習

TSNE是一種降維與視覺化技術，可以將資料點之間的相似度轉換為概率。在原空間（高維空間）中轉化為基於高斯分佈的概率；在嵌入空間（二維空間）中轉化為基於t分佈的概率。這使得t-SNE不僅可以關注區域性（SNE只關注相鄰點之間的相似度對映而忽略了全域性之間的相似度對映，使得視覺化後的邊界不明顯），還關注全域性，使視覺化效果更好（簇內不會過於集中，簇間邊界明顯）。也可以應用於深度學習中，將最後一層得到的輸出進行TSNE降維。

有興趣的朋友可以看這篇部落格：t-SNE實踐——sklearn教程

https://blog.csdn.net/hustqb/article/details/80628721



"""t-SNE對手寫數字進行視覺化"""
import numpy as np
from sklearn.manifold import TSNE

from time import time
import matplotlib.pyplot as plt
from sklearn import datasets

def get_data():
    digits = datasets.load_digits(n_class=6)
    data = digits.data                          # (1083,64)
    label = digits.target                       # (1083,)
    n_samples, n_features = data.shape
    return data, label, n_samples, n_features


def plot_embedding(data, label, title):
    data = (data - data.min()) / (data.max() - data.min()) # 資料歸一化
    fig = plt.figure()
    ax = plt.subplot(111)
    for i in range(data.shape[0]):   # 遍歷；對每個資料進行操作
        plt.text(data[i, 0], data[i, 1], str(label[i]),   # plt.cm.Set()將不同的點用不同的顏色顯示出來
                 color = plt.cm.Set1(label[i] / 10.),
                 fontdict={'weight':'bold', 'size': 9})
    plt.xticks([])
    plt.yticks([])
    plt.title(title)
    return fig


if __name__ == '__main__':
    data, label, n_samples, n_features = get_data()
    print('Computing t-SNE embedding')
    # 關鍵步驟：
    tsne = TSNE(n_components=2, init='pca', random_state= 0)
    t0 = time()
    result = tsne.fit_transform(data)   # ndarray;(1083,2)

    fig = plot_embedding(result, label, 't-SNE embedding of the digits (time %.2fs)'%(time() - t0))
    plt.show()

TSNE降維與視覺化的關鍵程式碼：

tsne = TSNE(n_components=2, init='pca', random_state= 0)
result = tsne.fit_transform(data)   # ndarray;(1083,2)

TSNE降維與視覺化

TSNE降維與視覺化

python程式碼實現TSNE降維資料視覺化教程

Apache RocketMQ 訊息佇列部署與視覺化介面安裝

6. EFK：免費的日誌採集與視覺化搜尋套件

豆瓣讀書top250資料爬取與視覺化

在模仿中精進資料分析與視覺化01——顆粒物濃度時空變化趨勢（Mann–Kendall Test）

爬取中國大學排名變化資料與視覺化分析

利用Anemometer做mysql慢日誌的查詢與視覺化

Python資料分析與視覺化

大資料應用與管理1：描述性統計與視覺化

真正傻瓜式操作：這款國產BI軟體，輕鬆實現資料分析預測與視覺化

Java解除安裝工具：幾個JDK自帶命令與視覺化工具

【JVM】【二】【Java反編譯命令列與視覺化工具】

基於GCC的C語言抽象語法樹重建與視覺化研究

樓盤價格資料採集與視覺化分析

KMeans聚類演算法思想與視覺化

更新前沿技術！大資料實時專案從架構設計到實戰部署大資料專案分析與視覺化實現

Mysql過濾與視覺化軟體

氣象DAT檔案的讀取與視覺化

工業大資料與商業智慧：裝置運維的Qlik視覺化

TSNE降維與視覺化

相關推薦