Python資料探勘工具總結
Python語言之所以很流行,廣泛用於機器學習,資料探勘等領域,因為它有強大的第三方庫,下面我們就來做一個簡單總結。
Numpy: 提供陣列支援,向量運算,以及高效的處理函式,線性代數處理等。
參考連結:http://www.numpy.org
Scipy: 封裝了numpy,提供矩陣支援,以及矩陣相關的數值計算模組,例如插值運算,優化處理,影象訊號等處理。
參考連結: http://www.scipy.org
pandas: 提供了強大的資料讀寫功能,可對資料做靈活的分析與探索,只要做資料分析,離不開你的工具,可參考圖書《利用Python進行資料分析》,需要電子版的可以留言告訴我。
參考連結: http://pandas.pydata.org/pandas-docs/stable
Matplotlib: 資料視覺化最常用的工具,簡單幾行程式碼可以做出各種各樣的圖表(2維為主),比如直方圖,條形圖,散點圖。
參考連結:http://matplotlib.org http://blog.csdn.net/u011497262/article/details/52325705
Scikit-Learn: 功能強大的機器學習庫,提供完整的學習工具箱,包括迴歸,分類,聚類等,使用簡單,kaggle選手經常使用的學習庫。但是並沒有提供神經網路,深度學習等模型。
參考連結:http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030181
TensorFlow: google開源的數值計算框架,採用資料流圖的方式,可靈活搭建深度學習模型。
參考連結 :http://www.tensorfly.cn/tfdoc/tutorials/overview.html