聚類演算法 sklearn k_means (返回一維資料的最優聚類)

阿新 • • 發佈：2019-01-07

from sklearn.cluster import KMeans
import numpy
import collections
import pandas
from sklearn import metrics

def k_means(pp1,clus):


    pv=list(pp1)
    if len(set(pv))>clus:
        gf=numpy.array([pv]).T
        estimator = KMeans(n_clusters=clus)#構造聚類器

        estimator.fit(gf)#聚類
        label_pred = estimator.labels_ #獲取聚類標籤 


        #print(label_pred)
        aa=collections.Counter(label_pred)

        print('aa=',aa)
        v=pandas.Series(aa)
        gg=list(v)
        index_max=gg.index(max(gg))

        print('index_max=',index_max)

        centroids = estimator.cluster_centers_ #獲取聚類中心

        print('centroids=' 
,centroids)
        #inertia = estimator.inertia_ # 獲取聚類準則的總和
        center=centroids[index_max][0]
        return ((center))
    else:
        return (pp1.mean())


def k_means_label(a):


    def km_index(k):

        pv=list(a)

        gf=numpy.array([pv]).T

        #from sklearn.cluster import KMeans 

        y_pred = KMeans(n_clusters=k, random_state=9).fit_predict(gf)

        index=metrics.silhouette_score(gf, y_pred, metric='euclidean')

        print('index',index)

        return index
    cs=list(range(2,6))

    df=list(map(km_index,cs))

    df1=pandas.Series(df,index=cs)
    df2=df1.sort_values(ascending=False)

    df3=list(df2.index)[0]

    return df3


a=numpy.random.randint(0,1000,10)

cc=k_means_label(a)

b=k_means(a,cc)

print('b=',b)

index 0.804055967401
index 0.805649685362
index 0.65899543985
index 0.517110170591
aa= Counter({0: 5, 1: 3, 2: 2})
index_max= 0
centroids= [[ 160.8]
 [ 610. ]
 [ 824.5]]
b= 160.8

聚類演算法 sklearn k_means (返回一維資料的最優聚類)

from sklearn.cluster import KMeans import numpy import collections import pandas from sklearn import

返回一維整數陣列中最大子陣列的和

1.要求：（1）輸入一個整形陣列，數組裡有正數也有負數。（2）陣列中連續的一個或多個整陣列成一個子陣列，每個子陣列都有一個和。（3）如果陣列A[0]……A[j-1]首尾相鄰，允許A[i-1]， …… A[n-1]， A[0]……A[j-1]之和最大。（4）同時返回最大子陣列的位置。（5）求所有子陣列的和的最大

小白最優化學習（四）演算法學習不精確一維搜尋方法

一、什麼是不精確一維搜尋方法一維搜尋方法是求函式的最小值，來得到最優步長，不精確一維搜尋方法，即保證目標函式在每次迭代有滿意的下降量的方法。到一次滿意的水平，就是可接受步長。二、幾個不精確一維搜尋方法的準則引用地址 line search（一維搜尋，或線搜尋）

聚類演算法之DBSCAN(具有噪聲的基於密度的聚類方法)

# !/usr/bin/python # -*- coding:utf-8 -*- import numpy as np import matplotlib.pyplot as plt import sklearn.datasets as ds import matpl

C語言 C語言分解質因數的演算法，以及動態一維陣列儲存分解的質因數的每一項

這裡儲存下，C語言分解質因數的演算法，以及動態一維陣列儲存分解的質因數的每一項。。。。 /** 分解質因數法求最小公倍數，最大公約數，我寫不下去了，這裡是分解質因數的方法，和返回質因數的動態陣列 */ /* 質因數分解法質因數分解質因數分解法：最大公約數:

第十四屆華中科技大學程序設計競賽 J Various Tree【數值型一維BFS/最小步數】

hust there ini amp rep targe ati 數值 set 鏈接：https://www.nowcoder.com/acm/contest/106/J 來源：牛客網題目描述 It’s universally acknowledged that th

tf.nn.pool()使用例子：TensorFlow對一維資料進行池化

tf.nn.pool()使用例子：在tensorflow中對一維訊號進行池化操作時使用，輸入資料的維度為三維[batch , in_width, in_channels]。原文連結： https://www.dotnetperls.com/pool-tensorflow

02(一維資料用vector，二維以上用matrix 用numpy庫來實現)

numpy應用# 1.一維資料用vector，二維以上用matrix 用numpy來實現# NumPy 是一個 Python 包。它代表 “Numeric Python”。它是一個由多維陣列物件和用於處理陣列的例程集合組成的庫。 Numeric，即 NumP

Opencv Canny邊緣提取,閾值自適應基於一維熵最大值

Canny 邊緣提取的最大最小值設定很麻煩，合理的高低閾值選擇是一個很重要的問題，一般做法對不同影象採取相同的預設值，但會導致對某一類影象的處理效果好，對另一些影象處理效果不好。一維最大熵的程式碼來自連線11，感謝博主的分享。幫助理解下面是一維最大熵公式：

Mybatis 只返回一條資料的解決方案之association、collection

:[StudentC{sid=14, sname='null', sage=null, saddress='null', classS=ClassS{id=345345345, className='二班', studentId=null, students=null}}, StudentC{sid=15,

LeetCode總結 -- 一維資料合併篇

合併是一維資料結構中很常見的操作，通常是排序，分散式演算法中的子操作。這篇總結主要介紹LeetCode中關於合併的幾個題目： Merge Two Sorted ListsMerge Sorted ArraySort ListMerge k Sorted Lists我們先

一維資料視覺化：累積分佈函式(Cumulative Distribution Function)

對於一維資料的視覺化，直方圖(Histogram)與核密度估計(Kernel Density Estimates)可以很好的表示各個資料值的概率分佈，但在表示資料累積分佈上這兩種方法就無能為力了。資料的累積分佈，也即小於等於當前資料值的所有資料的概率分佈，對於表示資料

TensorflowTutorial_一維資料構造簡單CNN

使用一維資料構造簡單卷積神經網路覺得有用的話,歡迎一起討論相互學習~Follow Me 神經網路對於一維資料非常重要，時序資料集、訊號處理資料集和一些文字嵌入資料集都是一維資料，會頻繁的使用到神經網路。我們在此利用一組一維資料構造卷積層-最大池化層-全

numpy 歸一化最後一維資料

import numpy as np a = np.array([[[1,1,1,1,1], [2,3,4,5,6]], [[1,1,1,1,1], [2,3,4,5,6]]]) b = np.sum(a, axis = -1) # axis: -1 代表最

jquery通過json從資料庫中返回一條資料和其對應的多條資料

最近在用jquery框架做專案,整個專案全部採用AJAX技術,用JSON做資料交換,下面的例子是一對多的關係,從資料庫中查出一條主資料,然後顯示這條主資料對應的多條其它資料,如下所示: json.jsp: <%@ page language="java" import="java.util.*" pa

mybatis一對多關聯查詢子表只返回一條資料

注意:在mybatis的部分版本中發現當兩個表的主鍵列名一致,比如都是id時,配置關聯查詢時子表只能返回1條資料,在這裡提供一種簡單的方法,避免大量修改檔案,由於我的原始碼不便公開,請大家看這裡的原始碼:http://blog.csdn.net/qinshijangshan/

COPY 一種接近最優的導航網格生成演算法以及基於導航網格的尋路演算法

提出背景：長距離尋路會出現掉幀現象，為了提高尋路速度，併為3D環境中的尋路方案提供基礎演算法實現。目前狀況：由於3D遊戲對幀率要求很高，而在遊戲中進行一次長距離的尋路可能要花費8-10幀的時間，在地圖複雜的情況下尋路時間甚至可能會更嚴重，而在這段時間，渲染迴圈會暫停

Python 一維資料的格式化和處理

1、資料組織的維度 (1)、維度：一組資料的組織形式 (2)、一維資料：由對等關係的有序或無序資料構成，採用線性方式組織 - 對應列表、陣列和集合等概念 (3)、二維資料：由多個一維資料構成，是一維資料的組合形式表格是典型的二

演算法分析與設計之多處最優服務次序問題

#include <iostream> #include <algorithm> #include <cstring> #include <cstdio> using namespace std; int main() { int i,n,j,k

演算法分析與設計之多處最優服務次序問題2

¢ 設有n個顧客同時等待一項服務，顧客i需要的服務時間為ti，1≤i≤n，共有s處可以提供此項服務。應如何安排n個顧客的服務次序才能使平均等待時間達到最小？平均等待時間是n個顧客等待服務時間的總和除以n。 ¢ 給定的n個顧客需要的服務時間和s的值，程式設計計算最優服務次序。 ¢ 輸入第一行

聚類演算法 sklearn k_means (返回一維資料的最優聚類)

相關推薦