【TensorFlow】使用TensorFlow執行K-Means

阿新 • • 發佈：2019-02-04

import numpy as np
import tensorflow as tf
from tensorflow.contrib.factorization import KMeans

載入資料

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)
full_data_x = mnist.train.images

Extracting /tmp/data/train-images-idx3-ubyte.gz
Extracting /tmp/data/train-labels-idx1-ubyte.gz
Extracting /tmp/data/t10k-images-idx3-ubyte.gz
Extracting /tmp/data/t10k-labels-idx1-ubyte.gz

引數

num_features = 784 # 圖片尺寸為28*28=784
num_classes = 10 # 0~9共10個數字
k = 25
num_steps = 50 # 訓練執行的次數
batch_size = 1024

構建模型

X = tf.placeholder(tf.float32,shape=[None,num_features])
Y = tf.placeholder(tf.float32,shape=[None,num_classes])
kmeans = KMeans(inputs=X,num_clusters=k,distance_metric='cosine',use_mini_batch= 
True)

(all_scores, cluster_idx, scores, cluster_centers_initialized, 
 init_op,training_op) = kmeans.training_graph()
cluster_idx = cluster_idx[0]
avg_distance = tf.reduce_mean(scores)

init_vars = tf.global_variables_initializer()

訓練

sess = tf.Session()

sess.run(init_vars, feed_dict={X: full_data_x} 
)
sess.run(init_op, feed_dict={X: full_data_x})

for i in range(1,num_steps+1):
    _,d,idx = sess.run([training_op,avg_distance,cluster_idx],feed_dict={X:full_data_x})
    if(i%10==0 or i==1):print("Step %i,Avg Distance:%f"%(i,d))

Step 1,Avg Distance:0.341471
Step 10,Avg Distance:0.221609
Step 20,Avg Distance:0.220328
Step 30,Avg Distance:0.219776
Step 40,Avg Distance:0.219419
Step 50,Avg Distance:0.219154

評估

# k個簇中，各個型別的個數
# 例如counts[i][j]是第2個簇中第j個類別樣本的數量
counts = np.zeros(shape=(k,num_classes))
for i in range(len(idx)):
    # idx是所有樣本所屬簇的id
    counts[idx[i]] += mnist.train.labels[i]
# labels_map是一個len為25的list
# labels_map[i]表示第i簇中樣本應該屬於的類別
labels_map = [np.argmax(c) for c in counts]
labels_map = tf.convert_to_tensor(labels_map)

# 給定一個cluster_idx，返回這個cluster在樣本中對應的labels
cluster_label = tf.nn.embedding_lookup(labels_map, cluster_idx)
correct_prediction = tf.equal(cluster_label, tf.cast(tf.argmax(Y, 1), tf.int32))
accuracy_op = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

test_x, test_y = mnist.test.images, mnist.test.labels
print("Test Accuracy:", sess.run(accuracy_op, feed_dict={X: test_x, Y: test_y}))

Test Accuracy: 0.7127

【TensorFlow】使用TensorFlow執行K-Means

import numpy as np import tensorflow as tf from tensorflow.contrib.factorization import KMeans 載入資料

【TF】tensorflow 中 tf.app.run() 什麼意思？

tensorflow的程式中,在main函式下,都是使用tf.app.run()來啟動檢視原始碼可知,該函式是用來處理flag解析，然後執行main函式，那麼flag解析是什麼意思呢？諸如這樣的： # tensorflow/tensorflow/python/platform/d

【譯】TensorFlow Tutorial #02 Convolutional Neural Network

溫馨提示，TensorFlow更新的太快了，有些程式碼實現方式可能變了，但是思想還是沒有變滴，主要還是理解原文地址介紹前面的教程表明，簡單的線性模型具有大約91％的分類準確度，用於識別MNIST資料集中的手寫數字。在本教程中，我們將在TensorFlow中實現一個簡單的卷積神經網路，如果您進行一

【翻譯】TensorFlow卷積神經網路識別CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow

原網址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Published May 21, 2018 · Updated September 15, 2018 1、目標-TensorFlow C

【翻譯】TensorFlow卷積神經網絡識別CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow

man 加載 published class cif alt lis update air 原網址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Publish

【Tensorflow】Tensorflow的圖、會話、裝置、變數、核心

前言基礎知識，前面我們介紹到，Tensorflow的資料流圖是由節點和邊組成的有向無環圖，此外，還涉及一些其他概念，如圖、會話、裝置、變數、核心等。圖（Graph） import tensorflow as tf # 建立圖 # 建立一個常量運算操作，產生一個1 x 2

【Tensorflow】Tensorflow基礎知識

Tensorflow簡介 \quad\quad 在我們使用以統計方法為核心的機器學習方法的時候，重要的是做特徵工程，

【tensorflow】tensorflow中的全域性變數GLOBAL_VARIABLES及區域性變數LOCAL_VARIABLES

在初學tensorflow的時候，我們會發現在函式體內定義tf.variable()或者tf.get_variable()變數的時候，跟其他語言不同，在tensorflow的函式體內定義的變數並不會隨著函式的執行結束而消失。這是因為tensorflow設定的全域性變數及區域性變數與其他

【Tensorflow】Tensorflow生成一個服從正態分佈的變數

Tensorflow生成一個服從正態分佈的變數： import tensorflow as tf a = tf.get_variable('a',shape=[2,3],initializer=tf.random_normal_initializer(stddev=1))

【tensorflow】tensorflow中使用gpu方法

在tensorflow中，我們可以使用 tf.device() 指定模型執行的具體裝置，可以指定執行在GPU還是CUP上，以及哪塊GPU上。設定使用GPU 使用 tf.device('/gpu:1') 指定Session在第二塊GPU上執行： import tenso

【專欄】- TensorFlow學習筆記

TensorFlow學習筆記學習深度學習時候的一些筆記、經驗與感想之類的，方便自己學習途中翻閱，也分享給別人，少踩一些坑不是。很多東西學過去之後想全部記住也記不住，只要知道這個東西它都能實現些什麼功能能幹些什麼事就夠了，在寫程式

【翻譯】 TensorFlow如何工作

學習TensorFlow過程中讀的一篇文章，索性就翻譯出來，雖然收穫感覺不是很大。原文地址：How TensorFlow Works 介紹 Google在2015年11越開源了TensorFlow系統。從那時起，TensorFlo

【轉載】TensorFlow實戰——CNN（VGGNet19）——影象風格轉化

轉自http://blog.csdn.net/u011239443/article/details/73721903 這次我們要做一件比較有趣的事——講影象風格轉化。如何將一張杭州西湖圖片：將其風格轉化為和梵高的《星夜》一樣具有鮮明藝術的風格呢？先給出完整的

【121】Tensorflow合成特徵和擷取離群值

開發環境 python 版本用的是2 資料來源沒有積分的讀者請給我留言，我給你單獨發。全部程式碼所有的程式碼都在下面，你可以把這些程式碼複製貼上到一個編輯器裡，然後執行程式碼。 import tensorflow as tf

【123】TensorFlow 多個特徵值線性迴歸，並且使用訓練集、驗證集和測試集的例子

我們的目標是構建數學模型來預測房價。通常情況下，會有多個因素影響房價，因此使用多個特徵值做線性迴歸。數學上，每個特徵值視為一個自變數，相當與構建一個包含多個自變數的函式。我寫了兩個 python 檔案，一個是用來訓練模型，並使用驗證集驗證模型。另

【126】TensorFlow 使用皮爾遜相關係數找出和標籤相關性最大的特徵值

在實際應用的時候，我們往往會收集多個維度的特徵值。然而這些特徵值未必都能派上用場。有些特徵值可能和標籤沒有什麼太大關係，而另外一些特徵值可能和標籤有很大的相關性。相關性不大的特徵值對於訓練模型沒有太大用處，還會影響效能。因此，最佳方式是找到相關性最大的幾個特

【122】TensorFlow檢查地圖資料

下圖是加利福尼亞州的地圖：為了驗證資料集是否存在缺陷，我們要讀取訓練集和驗證集，觀察這些資料的規律。並且按照經緯度繪製熱點圖，觀察地圖資料是否準確。下面的程式碼完成了上面的工作： import tensorflow as tf import n

【120】TensorFlow 從CSV檔案中讀取資料並訓練線性迴歸模型（面向新手）

正文開始。學習 TensorFlow 讓我的思維發生了變化。計算機本質上是一種數學的工具，而我在學習程式設計的時候，思維也不可避免地收到了影響。傳統的程式設計思想，常常認為程式就應該像數學定理或者數學函式一樣，給出一個確定的結果。這是一種基於邏輯推導

【127】TensorFlow對特徵值分箱並使用獨熱編碼

在實際應用的時候，許多特徵值和標籤之間不是線性關係。那麼該如何處理這種特徵值呢？有兩種思路回答此問題：設計複雜的數學公式，並利用資料對模型進行訓練，獲得各個同類項的權重。比如把簡單的 y = w0 + w1x 改成複雜的 y = w0 + w1x2

【無監督學習】1：K-means聚類演算法原理

前言：粗略研究完神經網路基礎——BP、CNN、RNN、LSTM網路後自己算是鬆懈了很多，好長的時間都沒有堅持再更新部落格了。“腐敗”生活了這麼久，還是要找到自己一點樂趣吧，於是想了一想，決定把《機器學習》的演算法研究過得都重新梳理一遍，於是就從無監督學習——聚類

【TensorFlow】使用TensorFlow執行K-Means

相關推薦