python實現密度聚類(模板程式碼+sklearn程式碼)

阿新 • • 發佈：2020-04-29

本人在此就不搬運書上關於密度聚類的理論知識了，僅僅實現密度聚類的模板程式碼和呼叫skelarn的密度聚類演算法。
有人好奇，為什麼有sklearn庫了還要自己去實現呢？其實，庫的程式碼是比自己寫的高效且容易，但自己實現程式碼會對自己對演算法的理解更上一層樓。

#呼叫科學計算包與繪圖包
import numpy as np
import random
import matplotlib.pyplot as plt

# 獲取資料
def loadDataSet(filename):
  dataSet=np.loadtxt(filename,dtype=np.float32,delimiter=',')
  return dataSet

#計算兩個向量之間的歐式距離
def calDist(X1,X2 ):
  sum = 0
  for x1,x2 in zip(X1,X2):
    sum += (x1 - x2) ** 2
  return sum ** 0.5

#獲取一個點的ε-鄰域（記錄的是索引）
def getNeibor(data,dataSet,e):
  res = []
  for i in range(dataSet.shape[0]):
    if calDist(data,dataSet[i])<e:
      res.append(i)
  return res

#密度聚類演算法
def DBSCAN(dataSet,e,minPts):
  coreObjs = {}#初始化核心物件集合
  C = {}
  n = dataSet.shape[0]
  #找出所有核心物件，key是核心物件的index，value是ε-鄰域中物件的index
  for i in range(n):
    neibor = getNeibor(dataSet[i],e)
    if len(neibor)>=minPts:
      coreObjs[i] = neibor
  oldCoreObjs = coreObjs.copy()
  k = 0#初始化聚類簇數
  notAccess = list(range(n))#初始化未訪問樣本集合（索引）
  while len(coreObjs)>0:
    OldNotAccess = []
    OldNotAccess.extend(notAccess)
    cores = coreObjs.keys()
    #隨機選取一個核心物件
    randNum = random.randint(0,len(cores)-1)
    cores=list(cores)
    core = cores[randNum]
    queue = []
    queue.append(core)
    notAccess.remove(core)
    while len(queue)>0:
      q = queue[0]
      del queue[0]
      if q in oldCoreObjs.keys() :
        delte = [val for val in oldCoreObjs[q] if val in notAccess]#Δ = N(q)∩Γ
        queue.extend(delte)#將Δ中的樣本加入佇列Q
        notAccess = [val for val in notAccess if val not in delte]#Γ = Γ\Δ
    k += 1
    C[k] = [val for val in OldNotAccess if val not in notAccess]
    for x in C[k]:
      if x in coreObjs.keys():
        del coreObjs[x]
  return C

# 程式碼入口
dataSet = loadDataSet(r"E:\jupyter\sklearn學習\sklearn聚類\DataSet.txt")
print(dataSet)
print(dataSet.shape)
C = DBSCAN(dataSet,0.11,5)
draw(C,dataSet)

結果圖：

python實現密度聚類(模板程式碼+sklearn程式碼)

下面是呼叫sklearn庫的實現

db = skc.DBSCAN(eps=1.5,min_samples=3).fit(dataSet) #DBSCAN聚類方法 還有引數，matric = ""距離計算方法
labels = db.labels_ #和X同一個維度，labels對應索引序號的值 為她所在簇的序號。若簇編號為-1，表示為噪聲
print('每個樣本的簇標號:')
print(labels)
raito = len(labels[labels[:] == -1]) / len(labels) #計算噪聲點個數佔總數的比例
print('噪聲比:',format(raito,'.2%'))
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0) # 獲取分簇的數目
print('分簇的數目: %d' % n_clusters_)
print("輪廓係數: %0.3f" % metrics.silhouette_score(X,labels)) #輪廓係數評價聚類的好壞
for i in range(n_clusters_):
  print('簇 ',i,'的所有樣本:')
  one_cluster = X[labels == i]
  print(one_cluster)
  plt.plot(one_cluster[:,0],one_cluster[:,1],'o')
plt.show()

到此這篇關於python實現密度聚類(模板程式碼+sklearn程式碼)的文章就介紹到這了,更多相關python 密度聚類內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python實現密度聚類(模板程式碼+sklearn程式碼)

本人在此就不搬運書上關於密度聚類的理論知識了，僅僅實現密度聚類的模板程式碼和呼叫skelarn的密度聚類演算法。

神經網路篇——程式碼實現密度聚類DBSCAN

技術標籤：神經網路深度學習機器學習神經網路一提到密度聚類，腦海中立馬就能呈現出一個聚類結果圖，不自然的就感覺非常的簡單，不就是基於密度的聚類嘛，原理不用看也懂了，但是真的實現起來，彷彿又不知道從哪

Python實現Kmeans聚類演算法

本節內容：本節內容是根據上學期所上的模式識別課程的作業整理而來，第一道題目是Kmeans聚類演算法，資料集是Iris(鳶尾花的資料集)，分類數k是3，資料維數是4。

拓端tecdat|Python實現譜聚類Spectral Clustering演算法和改變簇數結果視覺化比較

原文連結：http://tecdat.cn/?p=24842 原文出處：拓端資料部落公眾號譜聚類是一種將資料的相似矩陣的譜應用於降維的技術。它是有用且易於實現的聚類方法。

python 實現多執行緒下載視訊的程式碼

程式碼： def thread(url): r = requests.get(url,headers=None,stream=True,timeout=30) # print(r.status_code,r.headers)

python實現網站微信登入的示例程式碼

最近微信登入開放公測，為了方便微信使用者使用，我們的產品也決定加上微信登入功能，然後就有了這篇筆記。

Python 實現大整數乘法演算法的示例程式碼

我們平時接觸的長乘法，按位相乘，是一種時間複雜度為 O(n ^ 2) 的演算法。今天，我們來介紹一種時間複雜度為 O (n ^ log 3) 的大整數乘法(log 表示以 2 為底的對數)。

Python實現bilibili時間長度查詢的示例程式碼

說明：最近在B站看一些材料力學視訊時候，感覺有一些分集狂魔的分集真的很恐怖，有的甚至上百集，因此決定寫個小指令碼每次分析下到底這個系列視訊到底有多長。

python實現訊號時域統計特徵提取程式碼

1.實驗資料需求為了對採集的壓力實驗資料做特徵工程，需要對訊號進行時域的統計特徵提取，包含了均值、均方根、偏度、峭度、波形因子、波峰因子、脈衝因子、峭度因子等，現用python對其進行實現。

Python實現動態給類和物件新增屬性和方法操作示例

本文例項講述了Python實現動態給類和物件新增屬性和方法操作。分享給大家供大家參考，具體如下：

Python實現RabbitMQ6種訊息模型的示例程式碼

RabbitMQ與Redis對比 RabbitMQ是一種比較流行的訊息中介軟體，之前我一直使用redis作為訊息中介軟體，但是生產環境比較推薦RabbitMQ來替代Redis，所以我去查詢了一些RabbitMQ的資料。相比於Redis，RabbitMQ優

Python實現自動開啟電腦應用的示例程式碼

由於時間原因，有時候可能會錯過某個上網課的時間段。因此想要實現自動定時啟動DingDing。

python 實現分組求和與分組累加求和程式碼

我就廢話不多說了，大家還是直接看程式碼吧！ # -*- encoding=utf-8 -*- import pandas as pd

python實現人像動漫化的示例程式碼

利用百度api實現人像動漫化百度API地址：https://ai.baidu.com/tech/imageprocess/selfie_anime

基於Python實現2種反轉連結串列方法程式碼例項

題目：反轉一個單鏈表。示例: 輸入: 1->2->3->4->5->NULL 輸出: 5->4->3->2->1->NULL

Python實現檔案壓縮和解壓的示例程式碼

大家可能都熟悉.zip格式的檔案。它可以把多個檔案，壓縮成一個檔案。這在網路上傳輸時很有用，而且節省硬碟空間。

基於Python實現體育彩票選號器功能程式碼例項

一，概要需求：實現一個GUI介面下的 6+1體育彩票選號器. (1) 要求介面可以載入系統時間及開獎時間

Python 實現國產SM3加密演算法的示例程式碼

SM3是中華人民共和國政府採用的一種密碼雜湊函式標準，由國家密碼管理局於2010年12月17日釋出。主要用於報告檔案數字簽名及驗證。

Python實現定時監測網站執行狀態的示例程式碼

先說一下為啥會寫這段程式碼，大家在瀏覽網頁的時候都會看到友情連結，友情連結裡面的連結地址，如果不能正常的，那麼在SEO方面會有影響，如何及時的發現無效或者錯誤的連結並及時對其進行下線處理，這是一個至關重要

Python實現七個基本演算法的例項程式碼

1.順序查詢當資料儲存在諸如列表的集合中時，我們說這些資料具有線性或順序關係。每個資料元素都儲存在相對於其他資料元素的位置。由於這些索引值是有序的，我們可以按順序訪問它們。這個過程產實現的搜尋即為順

python實現密度聚類(模板程式碼+sklearn程式碼)

相關推薦