kaggle比賽相關準備內容(更新中)
阿新 • • 發佈:2019-01-06
1.需要一點ML演算法的基礎的。
另外就是要會用程式語言和相應的第三方庫來實現演算法.
常用的有: Python以及對應的庫numpy、scipy、scikit-learn(實現了ML的一些演算法,可以直接用)、theano(DeepLearning的演算法包)。
R語言、weka 如果用到深度學習的演算法,cuda、caffe也可以用 總之,使用什麼程式語言、什麼平臺、什麼第三方庫都無所謂,無論你用什麼方法,Kaggle只需要你線上提交結果,線下你如何實現演算法是沒有限制的。
最好在linux下安裝 ,省很多麻煩!!
2.模組介紹
numpy:NumPy系統是Python的一種開源的數值計算擴充套件。這種工具可用來儲存和處理大型矩陣,比Python自身的巢狀列表(nested list structure)結構要高效的多(該結構也可以用來表示矩陣(matrix))。
**Pandas:**資料結構和分析
scipy:是Python中科學計算程式的核心包,實現以下插值,積分,優化,影象處理等等,都是需要計算。
Scikit-learn
**Matplotlib:**全面的2D / 3D繪圖,這個假期作社會實踐專案時用過,當時畫的直方圖。
Theano:是一個Python庫,專門用於定義、優化、求值數學表示式,效率高,適用於多維陣列。特別適合做機器學習。一般來說,使用時需要安裝python和numpy.
資源網站:1.https://www.dataquest.io 簡直不能太貼心,太喜歡了