1. 程式人生 > >kaggle比賽相關準備內容(更新中)

kaggle比賽相關準備內容(更新中)

1.需要一點ML演算法的基礎的。
        另外就是要會用程式語言和相應的第三方庫來實現演算法.
        常用的有: Python以及對應的庫numpy、scipy、scikit-learn(實現了ML的一些演算法,可以直接用)、theano(DeepLearning的演算法包)。
         R語言、weka 如果用到深度學習的演算法,cuda、caffe也可以用 總之,使用什麼程式語言、什麼平臺、什麼第三方庫都無所謂,無論你用什麼方法,Kaggle只需要你線上提交結果,線下你如何實現演算法是沒有限制的。
        最好在linux下安裝 ,省很多麻煩!!


2.模組介紹
        numpy:NumPy系統是Python的一種開源的數值計算擴充套件。這種工具可用來儲存和處理大型矩陣,比Python自身的巢狀列表(nested list structure)結構要高效的多(該結構也可以用來表示矩陣(matrix))。
        **Pandas:**資料結構和分析
        scipy:是Python中科學計算程式的核心包,實現以下插值,積分,優化,影象處理等等,都是需要計算。
        Scikit-learn
通過定義統一的Python介面,實現了一系列有監督和無監督的學習演算法。
        **Matplotlib:**全面的2D / 3D繪圖,這個假期作社會實踐專案時用過,當時畫的直方圖。
        Theano:是一個Python庫,專門用於定義、優化、求值數學表示式,效率高,適用於多維陣列。特別適合做機器學習。一般來說,使用時需要安裝python和numpy.
資源網站:1.https://www.dataquest.io 簡直不能太貼心,太喜歡了