DBSCAN演算法實現---Python

阿新 • • 發佈：2018-12-06

生活不易啊，公司考核，初步寫出來了，腦闊疼。。。

思路：

　　設定閾值與半徑；

　　計算點之間的距離(歐式距離實現)；

　　區分核心點、邊界點與離群點；

　　將每個點的領域作為一個類(即將密度可達的點歸為一個簇)；

　　找出每個獨立的領域；

　　對最後的聚類進行標記；

　　視覺化。

程式碼實現：

　　1、設定eps = 2，MinPts = 3；

　　2、實現點與點歐氏距離的計算

 1 def ecludDist(x,y):
 2     return np.sqrt(sum(np.sqrt(np.array(x) - np.array(y))))
 
 3 
 4 def euclidean_distance(data):
 5     all_points = []
 6     for i in data:
 7         temp = []
 8         for j in data:
 9             temp.append(ecludDist(i,j))
10         all_points.append(temp)
11     return all_points

　　3、點種類的劃分：

 1 def classify(z):   #z為通過歐式距離計算所得的矩陣
 2     pts = []
 
 3     for row in z:
 4         density = np.sum(z.ix[row] < eps)
 5         pts = 0   
 6         if density > MinPts:
 7             pts = 1      #核心點
 8         elif density > 1:
 9             pts = 2　　　　#邊界點
10         else:
11             pts = 0　　　　#離群點
12         pts.append(pts)
13 return 
 pts

　　4、將每個點的領域作為一個類：

 1 def point_type:
 2     cluster = dict()
 3     i = 0
 4     for row in z:
 5         cluster[i] = np.where(z.ix[row] < eps)[0]
 6         i = i+1
 7     for i in range(len(cluster)):
 8         for j in range(len(cluster)):
 9             if len(set(cluster[i]) & set(cluster[j])) > 0 and i!=j:
10                 cluster[i] = cluster[i] | cluster[j]
11                 cluster[j] = []

　　5、找出獨立的領域

1 def independent_filed(cluster):
2     j = 0
3     result = dict()
4     for i in range(len(cluster)):
5         if len(cluster[i]) >0:    
6             result[j] = cluster[i]
7             j =j+1
8     return result

　　6、對最後聚類的結果標記

 1 def mark(df):    #傳進來的是轉換後的資料
 2     for i in range(result)：   #result 為一個字典型結構
 3         for j in result[i]:
 4             df.at[j,'type'] = i     #新建一列，並給它把i值新增上去
 5 
 6 
 7 plt.scatter(
 8     df['one'],
 9     df['two'],
10     c=df['type'])
11

最後把這些函式封裝一下就Ok啦

DBSCAN演算法實現---Python

生活不易啊，公司考核，初步寫出來了，腦闊疼。。。思路：　　設定閾值與半徑；　　計算點之間的距離(歐式距離實現)；　　區分核心點、邊界點與離群點；　　將每個點的領域作為一個類(即將密度可達的點歸為一個簇)；　　找出每個獨立的領域；　　對最後的聚類進行標記；　　視覺化。 &nbs

決策樹之ID3演算法實現(python) [置頂] 怒寫一個digit classification(不斷更新中)

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

決策樹之ID3演算法實現(python)

最近開始學習machine learning方面的內容，大致瀏覽了一遍《machine learning in action》一書，大概瞭解了一些常用的演算法如knn,svm等具體式幹啥的。在kaggle上看到一個練手的專案：digit classification,又有良好的資料，於是打算用這個

Python實現DBSCAN演算法

問題描述 Python實現DASCAN聚類。解題方法周志華老師的《機器學習》一書中詳細說明了演算法的過程，這裡就不再贅述，密度聚類的好壞與引數設定有很大的關係。 # coding:UTF-8 import numpy as np import random impor

鳶尾花三種聚類演算法（K-means,AGNES,DBScan）的python實現

一.分散性聚類(kmeans) 演算法流程: 1.選擇聚類的個數k. 2.任意產生k個聚類，然後確定聚類中心，或者直接生成k箇中心。 3.對每個點確定其聚類中心點。 4.再計算其聚類新中心。 5.重複以上步驟直到滿足收斂要求。（通常就是確定的中心點不再改變。

【Python】曲線簡化演算法實現

Overview 曲線簡化演算法通常應用於運動捕捉資料的關鍵幀提取，在此基礎上還演化出了更多的演算法本文對基本的曲線簡化演算法進行了程式碼實現，以關鍵幀個數或線性重建誤差作為迭代終止條件其中，計算點i到直線n1-n2的距離公式如下[1]：更多演算法及分析可參考[2]

密碼傳紙條演算法訓練 -- python 實現

今天幫朋友解了一個很有意思的問題 -- 傳紙條，(要求用python實現)題目如下: 李雷和韓梅梅坐前後排，上課想說話怕被老師發現，所以改為傳小紙條。為了不被老師發現他們紙條上說的是啥，他們約定了如下方法傳遞資訊：將26個英文字母（全為大寫），外加空格，一共27個字元分成3組，每組9個。也就是

演算法實現：歸併（合併）排序（C/C++、Python）

合併排序的關鍵步驟在於合併步驟中的合併兩個已排序子序列。為做合併，引入一個輔助過程MERGE(A, p, q, r), 其中A是一個數組，p、q和r是下標，滿足p小於等於q小於r。該過程假設子陣列A[p...q] 和A[q+1...r]都已排好序，並將它們合併成一個已排好序的子陣列代替當前子陣列

演算法實現：插入排序（C/C++、Python）

虛擬碼： INSERTION-SORT for j <- 2 to length[A] key <- A[j] Insert A[j]into the sorted sequence A[l...j-1]. i <- j - 1 wh

最長迴文子串--演算法思想探討和實現(python java)

最長迴文子串–演算法思想探討和實現(python java) 迴文串定義: 如果一個字串正著讀和反著讀是一樣的，那它就是迴文串。下面是一些迴文串的例項： 12321 a aba abba aaaa tattarrattat 問題定義最長迴

OneR演算法的Python簡單實現

OneR演算法就是，在已有資料中，根據具有相同特徵值的個體最可能屬於哪個類別進行分類。即取效果最好的那個特徵進行分類。 #-*- coding=utf-8 -*- # import numpy as np from sklearn.datasets import load_iris f

naive bayes 演算法的Python實現與理解

在機器學習中，樸素貝葉斯演算法對於大家來說其實並不陌生，在我前面的部落格中，我也對樸素貝葉斯演算法的原理有所介紹，這篇文章我們一起來學習如何用Python來實現這個樸素貝葉斯演算法。首先我們匯入numpy這個Python庫，來支援我們後續的一些數學運算。 from numpy i

【機器學習演算法實現】主成分分析 PCA ——基於python+numpy

python常用演算法實現

排序是計算機語言需要實現的基本演算法之一，有序的資料結構會帶來效率上的極大提升。 1.插入排序插入排序預設當前被插入的序列是有序的，新元素插入到應該插入的位置，使得新序列仍然有序。 def insertion_sort(old_list): n=len(old_list) k

【機器學習演算法實現】logistic迴歸基於Python和Numpy函式庫

【機器學習演算法實現】kNN演算法手寫識別——基於Python和NumPy函式庫

實現Apriori演算法（python）

1 # coding: utf-8 2 3 # 利用python實現apriori演算法 4 5 # In[1]: 6 7 8 #匯入需要的庫 9 from numpy import * 10 11 12 # In[2]: 13 14 15

Python基於K-均值、RLS演算法實現RBF神經網路（神經網路與機器學習第五章計算機實驗）

1、生成資料集 class moon_data_class(object): def __init__(self,N,d,r,w): self.N=N self.w=w self.d=d self.r=r

模擬退火演算法理論+Python解決函式極值+C++實現解決TSP問題

簡述演算法設計課這周的作業：趕緊寫了先，不然搞不完了。文章目錄簡述演算法理論部分變數簡單分析從狀態轉移概率到狀態概率推導理解當溫度收斂到接近0的時候，收斂到結果理論

usersig 生成演算法純 python 實現

#! /usr/bin/python # coding:utf-8 # 此檔案是 tls sig api 的 python 另一種實現 # 使用了 python ecdsa 開發庫 __author__ = "[email protected]" __date__

DBSCAN演算法實現---Python

生活不易啊，公司考核，初步寫出來了，腦闊疼。。。

思路：

相關推薦