機器學習入門--進階資料和流程建議
1.入門教程
1.1李航老師的《統計學習方法》 數學原理講的多
1.2周志華老師的《機器學習》
1.3斯坦福大學公開課 http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html ng的視訊
1.4 矩陣理論 《矩陣分析與應用》 張賢達 pdf 第二版 熟悉矩陣分解,特徵值、特徵向量等
1.5 最優化或者凸優化理論 看線性規劃或者凸優化相關資料
1.6資訊理論和概率論 看deep learning(中文版)的前幾章
1.7深度學習 看deep learning(中文版) 和《神經網路與深度學習》
1.8 《機器學習實戰》 python實現
2.學習軟體和庫
2.1 python ,numpy,scipy,matplotlib (安裝方式:下載python3.#,安裝。如果沒有安裝pip,則手動下載安裝pip;執行pip install numpy,pip install scipy;pip install matplotlib)
2.2 sklearn,xgboost (執行pip install sklearn,pip install xgboost) sklearn包含了大部分機器學習相關的技術 sklearn 中文網站:http://blog.csdn.net/chinachenyyx/article/details/75299043
2.3 tensorflow,keras (執行pip install tensorflow;pip install keras) tensorflow包含了大部分深度學習相關的技術,keras是高度整合的深度學習框架
2.4 jieba(安裝方式:pip install jieba) 自然語言處理的工具,主要用於分詞
2.5 gensim (安裝方式:pip install gensim) 自然語言處理的工具,包含了很多自然語言處理的技術
2.7模型結果圖示化工具graphviz 參考資料:http://blog.csdn.net/love_data_scientist/article/details/78635032
3.學習流程建議:
3.1可以先看李航老師的《統計學習方法》 和 《機器學習實戰(python實戰)》,不用貪多,比如《機器學習實戰(python實戰)》看一章,在《機器學習實戰(python實戰)》中找到相應的章節練習。走幾個演算法有感覺慢慢就好了
3.2等熟悉了機器學習處理的問題的一般流程,可以學習sklearn庫相關的資料,因為庫中幫我們實現了很多演算法
3.3前兩步完成了可以學習tensorflow(或者直接學習keras)
3.4學習完上面的,
可以學習推薦系統相關的東西,參考資料http://blog.csdn.net/love_data_scientist/article/details/77807880
可以學習自然語言相關的東西,入門為主不易入坑過深,參考資料http://blog.csdn.net/love_data_scientist/article/details/78110326;http://blog.csdn.net/love_data_scientist/article/details/78459999
關鍵是要理論和實踐相結合,否則收穫不大,而且容易忘
演算法依託資料,資料決定了模型的上限,而演算法只是逼近這個上限而已。
所以學習完機器學習相關的知識,還要補充資料處理相關的技術,比如hadoop,hive,mysql,尤其map-reduce的實現,可以使用java,python,shell等實現map-reduce,看個人喜好。參考資料:http://blog.csdn.net/love_data_scientist/article/details/78560668
如果還想深入學習,還可以學習一下資料檢索以及結果展示相關的知識,比如ES(elastic search),ELK(Elasticsearch、Logstash和Kibana)等