1. 程式人生 > >Python資料探勘工具總結

Python資料探勘工具總結

      Python語言之所以很流行,廣泛用於機器學習,資料探勘等領域,因為它有強大的第三方庫,下面我們就來做一個簡單總結。

     Numpy:       提供陣列支援,向量運算,以及高效的處理函式,線性代數處理等。

                         參考連結:http://www.numpy.org

     Scipy:          封裝了numpy,提供矩陣支援,以及矩陣相關的數值計算模組,例如插值運算,優化處理,影象訊號等處理。

                         參考連結: http://www.scipy.org

     pandas:        提供了強大的資料讀寫功能,可對資料做靈活的分析與探索,只要做資料分析,離不開你的工具,可參考圖書《利用Python進行資料分析》,需要電子版的可以留言告訴我。

                         參考連結: http://pandas.pydata.org/pandas-docs/stable

     Matplotlib:    資料視覺化最常用的工具,簡單幾行程式碼可以做出各種各樣的圖表(2維為主),比如直方圖,條形圖,散點圖。

                    參考連結:http://matplotlib.org      http://blog.csdn.net/u011497262/article/details/52325705

Scikit-Learn:   功能強大的機器學習庫,提供完整的學習工具箱,包括迴歸,分類,聚類等,使用簡單,kaggle選手經常使用的學習庫。但是並沒有提供神經網路,深度學習等模型。

                     參考連結:http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030181

TensorFlow:  google開源的數值計算框架,採用資料流圖的方式,可靈活搭建深度學習模型。

                    參考連結 :http://www.tensorfly.cn/tfdoc/tutorials/overview.html