1. 程式人生 > >2018.11.28——DBSCAN用於聚類、異常點檢測

2018.11.28——DBSCAN用於聚類、異常點檢測

 

一.簡介(類似於傳銷,用某個資料q去發展下線p,p再去發展下線

DBSCAN是聚類演算法,優於kmeans,首選DBSCAN。

DBSCAN基於密度的、帶有噪音的聚類。

二.演算法需要記住的概念

①相關概念:核心點

資料q為圓心,r(超參)為半徑畫圓,圓內資料多餘m個(超參),那麼資料q為核心點。如下圖:

②相關概念:直接密度可達;密度可達

======================密度可達=================

三.演算法引數

引數:半徑,半徑內點的個數。不需要設定kmeans中的k值,自動聚成簇。到底聚成多少堆,由演算法實際聚出來的。

半徑r的經驗值是:突變點,點q到所有點的距離d1、d2、d3、……dn,從小到大進行排序,突然d4變的很大,d3就作為半徑。