1. 程式人生 > >kaggle入門資源整理+小結

kaggle入門資源整理+小結

最近準備重新上手kaggle了,先上網找找相關套路,在這裡總結分享一下:

1.比賽篇

這裡寫圖片描述

2.經驗篇

自己慢慢積累吧

3.工具

以下總結了一些常用的工具:

Numpy | 必用的科學計算基礎包,底層由C實現,計算速度快。
Pandas | 提供了高效能、易用的資料結構及資料分析工具。
NLTK | 自然語言工具包,集成了很多自然語言相關的演算法和資源。
Stanford CoreNLP | Stanford的自然語言工具包,可以通過NLTK呼叫。
Gensim | 主題模型工具包,可用於訓練詞向量,讀取預訓練好的詞向量。
scikit-learn | 機器學習Python包 ,包含了大部分的機器學習演算法。
XGBoost/LightGBM | Gradient Boosting 演算法的兩種實現框架。
PyTorch/TensorFlow/Keras | 常用的深度學習框架。
StackNet | 準備好特徵之後,可以直接使用的Stacking工具包。
Hyperopt | 通用的優化框架,可用於調參。