python實現mean-shift聚類演算法

阿新 • • 發佈：2018-12-14

新建MeanShift.py檔案

import numpy as np

# 定義 預先設定 的閾值
STOP_THRESHOLD = 1e-4
CLUSTER_THRESHOLD = 1e-1


# 定義度量函式
def distance(a, b):
    return np.linalg.norm(np.array(a) - np.array(b))


# 定義高斯核函式
def gaussian_kernel(distance, bandwidth):
    return (1 / (bandwidth * np.sqrt(2 * np.pi))) * np.exp(-0.5 * ((distance / bandwidth)) ** 2)


# mean_shift類
class mean_shift(object):
    def __init__(self, kernel=gaussian_kernel):
        self.kernel = kernel

    def fit(self, points, kernel_bandwidth):

        shift_points = np.array(points)
        shifting = [True] * points.shape[0]

        while True:
            max_dist = 0
            for i in range(0, len(shift_points)):
                if not shifting[i]:
                    continue
                p_shift_init = shift_points[i].copy()
                shift_points[i] = self._shift_point(shift_points[i], points, kernel_bandwidth)
                dist = distance(shift_points[i], p_shift_init)
                max_dist = max(max_dist, dist)
                shifting[i] = dist > STOP_THRESHOLD

            if(max_dist < STOP_THRESHOLD):
                break
        cluster_ids = self._cluster_points(shift_points.tolist())
        return shift_points, cluster_ids

    def _shift_point(self, point, points, kernel_bandwidth):
        shift_x = 0.0
        shift_y = 0.0
        scale = 0.0
        for p in points:
            dist = distance(point, p)
            weight = self.kernel(dist, kernel_bandwidth)
            shift_x += p[0] * weight
            shift_y += p[1] * weight
            scale += weight
        shift_x = shift_x / scale
        shift_y = shift_y / scale
        return [shift_x, shift_y]

    def _cluster_points(self, points):
        cluster_ids = []
        cluster_idx = 0
        cluster_centers = []

        for i, point in enumerate(points):
            if(len(cluster_ids) == 0):
                cluster_ids.append(cluster_idx)
                cluster_centers.append(point)
                cluster_idx += 1
            else:
                for center in cluster_centers:
                    dist = distance(point, center)
                    if(dist < CLUSTER_THRESHOLD):
                        cluster_ids.append(cluster_centers.index(center))
                if(len(cluster_ids) < i + 1):
                    cluster_ids.append(cluster_idx)
                    cluster_centers.append(point)
                    cluster_idx += 1
        return cluster_ids

呼叫上述py檔案

# -*- coding: utf-8 -*-
"""
Created on Tue Oct 09 11:02:08 2018

@author: muli
"""

from sklearn.datasets.samples_generator import make_blobs
import matplotlib.pyplot as plt 
import random
import numpy as np
import MeanShift


def colors(n):
  ret = []
  for i in range(n):
    ret.append((random.uniform(0, 1), random.uniform(0, 1), random.uniform(0, 1)))
  return ret

def main():
    centers = [[-1, -1], [-1, 1], [1, -1], [1, 1]]
    X, _ = make_blobs(n_samples=300, centers=centers, cluster_std=0.4)

    mean_shifter = MeanShift.mean_shift()
    _, mean_shift_result = mean_shifter.fit(X, kernel_bandwidth=0.5)

    np.set_printoptions(precision=3)
    print('input: {}'.format(X))
    print('assined clusters: {}'.format(mean_shift_result))
    color = colors(np.unique(mean_shift_result).size)

    for i in range(len(mean_shift_result)):
        plt.scatter(X[i, 0], X[i, 1], color = color[mean_shift_result[i]])
    plt.show()


if __name__ == '__main__':
    main()

python實現mean-shift聚類演算法

新建MeanShift.py檔案 import numpy as np # 定義預先設定的閾值 STOP_THRESHOLD = 1e-4 CLUSTER_THRESHOLD = 1e-1 # 定義度量函式 def distance(a, b):

Python實現K-Means聚類演算法

宣告：程式碼的執行環境為Python3。Python3與Python2在一些細節上會有所不同，希望廣大讀者注意。本部落格以程式碼為主，程式碼中會有詳細的註釋。相關文章將會發布在我的個人部落格專欄《Python從入門到深度學習》，歡迎大家關注~

python實現一個層次聚類方法

mac ima 優先隊列 () don 標簽中位數 filepath normal 層次聚類(Hierarchical Clustering) 一.概念　　層次聚類不需要指定聚類的數目，首先它是將數據中的每個實例看作一個類，然後將最相似的兩個類合並，該過程叠代計算只到剩

使用Java實現K-Means聚類演算法

第一次寫部落格，隨便寫寫。關於K-Means介紹很多，還不清楚可以查一些相關資料。個人對其實現步驟簡單總結為4步: 1.選出k值,隨機出k個起始質心點。 2.分別計算每個點和k個起始質點之間的距離,就近歸類。 3.最終中心點集可以劃分為k類,

Mean Shift 聚類

演算法原理 Mean shift 演算法是基於核密度估計的爬山演算法，可用於聚類、影象分割等。樣本點集：上圖中的實心點，n個樣本點yi，i=1,2,…,n 區域圓心：藍色空心圓x 感興趣區域Sh：藍色圓形區域，以x為圓心，h為半徑的圓形內部。表示式為 Mean Shift向量：從藍

利用Python實現K-Means聚類並進行圖形化展示

利用K-means進行聚類，顯示聚類結果的各類別的數量，最終進行圖形化展示。 import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy import stats import c

用Python實現文件聚類

在本教程中，我會利用 Python 來說明怎樣聚類一系列的文件。我所演示的例項會識別出 top 100 電影的（來自 IMDB 列表）劇情簡介的隱藏結構。關於這個例子的詳細討論在初始版本里。本教程包括：對所有劇情簡介分詞（tokenizing）和詞幹化（stemming）

Python實現LeetCode連結串列類演算法（例子：Merge k Sorted Lists）

連結串列的演算法關鍵點：新建立一個頭結點，並且將這個節點賦值給另外的連結串列物件來完成操作。例如19. Remove Nth Node From End of List class Soluti

python實現Kmeans文字聚類，通過PCA降維和Matplotlib顯示聚類3d三維影象

首先感謝Eastmount寫的內容http://blog.csdn.net/Eastmount/article/details/50545937。點選開啟連結在此基礎上，主要實現以下改進及結果 1.替換使用sklearn.feature_extraction.text.T

對比，SPSS/SPSS modeler/python 實現FRM，聚類模型的使用者感受

SPSS計算FRM模型分值在spss的直銷模組下，可以對客戶資料進行FRM計算客戶的FRM的分值，1.交易資料

（R/Python）t-SNE聚類演算法實踐指南

首發連結： https://yq.aliyun.com/articles/70733 作者介紹：Saurabh.jaju2 Saurabh是一名資料科學家和軟體工程師，熟練分析各種資料集和開發智慧應用程式。他目前正在加州大學伯克利分校攻讀資訊和資料科學碩士學位，熱衷

聚類演算法(2)--Mean Shift

目錄 PS： Mean shift 演算法是基於核密度估計的爬山演算法，可用於聚類、影象分割、跟蹤等，因為最近搞一個專案，涉及到這個演算法的影象聚類實現，因此這裡做下筆記。 mean shift 演算法理論 Mean-shift（即：均值遷移）的基本

看完這篇文章，包你懂得如何用Python實現聚類演算法的層次演算法！

什麼是聚類將物理或抽象物件的集合分成由類似的物件組成的多個類的過程被稱為聚類。由聚類所生成的簇是一組資料物件的集合，這些物件與同一個簇中的物件彼此相似，與其他簇中的物件相異。聚類分析又稱群分析，它是研究（樣品或指標）分類問題的一種統計分析方法。聚類分析起源於分類學，但是聚

k-medoid(k中心點)聚類演算法Python實現

k-means演算法有個很大的缺點，就是對孤立點敏感性太高，孤立點即是脫離群眾的點，與眾不同的點，即在顯示中與其他點不是抱在一團的點。為了體現兩者的不同，我特意溫習了一下知識，在構造初始點的時候，自己定義加入了幾個孤立點，使用k-means演算法跑的效果如下：一開始的所有點：（可以看出其

層次聚類演算法的原理及python實現

層次聚類(Hierarchical Clustering)是一種聚類演算法，通過計算不同類別資料點間的相似度來建立一棵有層次的巢狀聚類樹。在聚類樹中，不同類別的原始資料點是樹的最低層，樹的頂層是一個聚類的根節點。聚類樹的建立方法：自下而上的合併，自上而下的分裂。（這裡介紹第一種） 1.2 層次聚類的合

聚類演算法——python實現SOM演算法

演算法簡介 SOM網路是一種競爭學習型的無監督神經網路，將高維空間中相似的樣本點對映到網路輸出層中的鄰近神經元。訓練過程簡述：在接收到訓練樣本後，每個輸出層神經元會計算該樣本與自身攜帶的權向量之間的距離，距離最近的神經元成為競爭獲勝者，稱為最佳匹配單元。然

K-means和PAM聚類演算法Python實現及對比

K-means（K均值劃分）聚類：簡單的說，一般流程如下：先隨機選取k個點，將每個點分配給它們，得到最初的k個分類；在每個分類中計算均值，將點重新分配，劃歸到最近的中心點；重複上述步驟直到點的劃歸不再改變。下圖是K-means方法的示意。 PAM

聚類——譜聚類演算法以及Python實現

譜聚類(spectral cluster)可以視為一種改進的Kmeans的聚類演算法。常用來進行影象分割。缺點是需要指定簇的個數，難以構建合適的相似度矩陣。優點是簡單易實現。相比Kmeans而言，處理高維資料更合適。核心思想構建樣本點的相似度矩陣(圖

python K-Means聚類演算法的實現

K-Means 簡介聚類演算法有很多種（幾十種），K-Means是聚類演算法中的最常用的一種，演算法最大的特點是簡單，好理解，運算速度快，但是一定要在聚類前需要手工指定要分成幾類。具體實現步驟如下：給定n個訓練樣本{x1，x2，x3，…，xn} 　

python 實現 AP近鄰傳播聚類演算法(Affinity Propagation)

Affinity Propagation (AP) 聚類是2007年在Science雜誌上提出的一種新的聚類演算法。它根據N個數據點之間的相似度進行聚類,這些相似度可以是對稱的,即兩個資料點互相之間的相似度一樣(如歐氏距離);也可以是不對稱的,即兩個資料點互相之間的相似度不等

python實現mean-shift聚類演算法

相關推薦