1. 程式人生 > >sklearn: metrics

sklearn: metrics

  • sklearn.metrics.calinski_harabaz_score()

    使用Calinski-Harabasz(CH)指標評價聚類結果.

    CH指標通過簇內的稠密程度和簇間的離散程度來評估聚類的效果, 公式為:

    s(k)=tr(Bk)tr(Wk)mkk1

    其中, m為樣本數量, k為類別數量, Bk為類別之間的協方差矩陣, Wk為類別內部資料的協方差矩陣. tr為矩陣的跡.

    也就是說, 類別內部資料的協方差越小越好, 類別之間的協方差越大越好, 這樣的Calinski-Harabasz分數會高.