EM演算法之GMM聚類

阿新 • • 發佈：2019-01-09

以下為GMM聚類程式

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
data=pd.read_csv('Fremont.csv',index_col='Date',parse_dates=True)
print(data.head())

data.plot()
plt.show()
data.resample('w').sum().plot()#以周為時間統計

data.resample('D').sum().rolling(365).sum().plot()
plt.show()

##按照時間為統計
data.groupby(data.index.time).mean().plot()
plt.xticks(rotation=45)
plt.show()

data.columns=['West','East']
data['Total']=data['West']+data['East']
pivoted=data.pivot_table('Total',index=data.index.time,columns=data.index.date)
pivoted.iloc[:5,:5]
print(pivoted.iloc[:5,:5])
pivoted.plot(legend=False,alpha=0.01)
plt.xticks(rotation=45)
plt.show()

print(pivoted.shape)
X=pivoted.fillna(0).T.values
print(X.shape)


from sklearn.decomposition import PCA
X2 =PCA(2).fit_transform(X)
print(X2.shape)
plt.scatter(X2[:,0],X2[:,1])
plt.show()


from sklearn.mixture import GaussianMixture
gmm =GaussianMixture (2)
gmm.fit(X)
# labels= gmm.predict_proba(X)
# print(labels)
labels=gmm.predict(X)
print(labels)
plt.scatter(X2[:,0],X2[:,1],c=labels,cmap='rainbow')
plt.show()

from sklearn.datasets.samples_generator import make_blobs
X,y_true =make_blobs(n_samples=800,centers=4,random_state=11)
plt.scatter(X[:,0],X[:,1])
plt.show()

from sklearn.cluster import KMeans
KMeans =KMeans(n_clusters=4)
KMeans.fit(X)
y_Kmeans=KMeans.predict(X)
plt.scatter(X[:,0],X[:,1],c=y_Kmeans,s=50,cmap='viridis')
centers=KMeans.cluster_centers_
plt.show()

from sklearn.mixture import GaussianMixture
gmm =GaussianMixture(n_components=4).fit(X)
labels=gmm.predict(X)
print(labels)
plt.scatter(X[:,0],X[:,1],c=labels,s=40,cmap='viridis')
plt.show()

執行結果

EM演算法之GMM聚類

以下為GMM聚類程式 import pandas as pd import matplotlib.pyplot as plt import numpy as np data=pd.read_csv('Fremont.csv',index_col='Date'

聚類演算法之層次聚類

一、原型聚類和層次聚類原型聚類也稱基於原型的聚類(prototype-based clustering)，這類演算法假設聚類結構能夠通過一組原型刻畫，先對原型進行初始化，然後對原型進行迭代更新求解。採用不同的原型表示、不同的求解方式，產生不同的演算法。常用的原型聚類演算法有k

ML之Clustering之普聚類演算法：普聚類演算法的相關論文、主要思路、關鍵步驟、程式碼實現等相關配圖之詳細攻略

ML之Clustering之普聚類演算法：普聚類演算法的相關論文、主要思路、關鍵步驟、程式碼實現等相關配圖之詳細攻略普聚類演算法的相關論文 1、論文推薦 Clustering by fast search and find of density peak.

機器學習演算法原理總結系列---演算法基礎之(11)聚類K均值(Clustering K-means）

一、原理詳解歸類：聚類(clustering) 屬於非監督學習 (unsupervised learning) 無類別標記(class label) 舉例： K-means 演算法： 3.1 Clustering 中

聚類之均值聚類（k-means）演算法的python實現

# -*- coding: UTF-8 -*- import numpy import random import codecs import copy import re import matplotlib.pyplot as plt def calcuDistance(vec1, vec2):

機器學習之聚類演算法（層次聚類）

層次聚類也叫連通聚類方法，有兩個基本方法：自頂而下和自底而上。自頂而將所有樣本看做是同一簇，然後進行分裂。自底而上將初所有樣本看做不同的簇，然後進行凝聚。這種聚類的中心思想是：離觀測點較近的點相比離觀測點較遠的點更可能是一類。這種方法首先會生成下面的樹

機器學習之層次聚類演算法

層次聚類（Hierarchical Clustering）是對給定資料集在不同層次進行劃分，形成樹形的聚類結構，直到滿足某種停止條件為止。資料集的劃分可採用自底向上或自頂向下的劃分策略。1、凝聚的層次聚類演算法AGNES AGNES（AGglom

SparkMllib GMM聚類演算法的理解以及例子

在完成sparkMllib GMM演算法例子之前需要知道幾個概念。1、高斯分佈、2、多維高斯分佈。3、高斯混合分佈。4、協方差 GMM稱為混合高斯分佈，它在單高斯分佈（又稱正太分佈，一維正太分佈）的基礎上針對多元變數發展出來的。（以下參考了百度詞條內容） 1）單高斯分佈公式

Spark機器學習之-實時聚類演算法呼叫

Spark MLIB中的Kmenas聚類演算法，資料通過SparkStreaming 實時拉取kafka中的資料，並呼叫已經訓練好的聚類模型；根據讀取的資料實時的進行分類package com.demo.cn.streaming import org.apache.kafk

聚類分析之層次聚類演算法

層次聚類演算法：前面介紹的K-means演算法和K中心點演算法都屬於劃分式（partitional）聚類演算法。層次聚類演算法是將所有的樣本點自底向上合併組成一棵樹或者自頂向下分裂成一棵樹的過程，這兩種方式分別稱為凝聚和分裂。凝聚層次演算法: 初始階段，將每個樣本點分別

聚類分析之譜聚類

空間聚類 family 數據集 .cn 存在聚類算法 array 全局最優傳統聚類根據給定的樣本數據集定義一個描述成對數據點相似度的親合矩陣,並且計算矩陣的特征值和特征向量，然後選擇合適的特征向量聚類不同的數據點。譜聚類可以在任意形狀的樣本空間聚類，且

使用者畫像之標籤聚類

使用者畫像是個體系性比較強的內容模組，分一兩次部落格也寫不完，我爭取分多次部落格把各個模組都搭建起來。上次把使用者畫像方面的內容開了一個頭，講了關於標籤權重的計算方法，這次就聊聊標籤聚類的方法。其實聚類不限於方法和形式，只要能將同類物品 / 內容進行準確聚類的，都是好的方法。好啦，開篇結束啦，下面讓

機器學習之DBSCAN聚類

機器學習之DBSCAN聚類 # -*- coding: utf-8 -*- """ Created on Wed Nov 28 18:50:57 2018 @author: muli """ import numpy as np from sklearn.datas

機器學習之kMeans聚類

機器學習之kMeans聚類 # -*- coding: utf-8 -*- """ Created on Wed Nov 28 16:23:36 2018 @author: muli """ from sklearn.datasets.samples_generat

目錄：空間聚類演算法及時空聚類演算法

1.在本例項中，如果想將程式碼直接執行需注意以下幾點： Python版本3.X（本人使用的是Python 3.6） numpy版本 1.13.3（其他版本未實驗） scipy版本 0.19.1（其他版本未實驗） matplotlib版本 2.1.0（其他版本

【SciKit-Learn學習筆記】8：k-均值演算法做文字聚類,聚類演算法效能評估

學習《scikit-learn機器學習》時的一些實踐。原理見K-means和K-means++的演算法原理及sklearn庫中引數解釋、選擇。 sklearn中的KMeans from sklearn.datasets import make_blobs from m

聚類演算法:凝聚層次聚類

凝聚層次聚類：所謂凝聚的，指的是該演算法初始時，將每個點作為一個簇，每一步合併兩個最接近的簇。另外即使到最後，對於噪音點或是離群點也往往還是各佔一簇的，除非過度合併。對於這裡的“最接近”，有下面三種定義。我在實現是使用了MIN，該方法在合併時，只要依次取當前最近

機器學習之層次聚類及程式碼示例

一、層次聚類層次聚類是無監督學習方法，可對給定的N個待聚類的樣本進行層次的分類，直到某種條件（類的個數、類間的距離超過某個閾值）滿足為止。 1、層次聚類的劃分對於層次聚類，可具體分為： a. 凝聚的（agglomerative）層次聚類：採用

基於 K-Means 演算法的文字聚類

先粘一篇我的實驗報告，其中涉及的細節，有時間再提出來總結實驗內容：基於K-Means演算法的文字聚類實驗要求： 1、能夠從社交媒體或網上給定的資料集（資料集已給定），從中挖掘出新聞話題，如線上檢測微博訊息中大量突現的關鍵字，並將它們進行聚類，從而找

Python基於Kmeans演算法實現文字聚類的簡單練習

接觸機器學習時間不長，也一直有興趣研究這方面的演算法。最近在學習Kmeans演算法，但由於工作的原因無法接觸到相關的專案實戰。為了理清思路、熟悉程式碼，在參照了幾篇機器學習大神的博文後，做了一個簡單的Kmeans演算法的簡單練習。作為一枚機器學習的門外漢，對於文中的一些錯誤和

EM演算法之GMM聚類

相關推薦