1. 程式人生 > >機器學習入門--進階資料和流程建議

機器學習入門--進階資料和流程建議

1.入門教程

1.1李航老師的《統計學習方法》 數學原理講的多

1.2周志華老師的《機器學習》

1.3斯坦福大學公開課  http://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html     ng的視訊

1.4 矩陣理論    《矩陣分析與應用》 張賢達 pdf 第二版     熟悉矩陣分解,特徵值、特徵向量等

1.5 最優化或者凸優化理論     看線性規劃或者凸優化相關資料

1.6資訊理論和概率論      看deep learning(中文版)的前幾章           

1.7深度學習      看deep learning(中文版) 和《神經網路與深度學習》

1.8 《機器學習實戰》 python實現


2.學習軟體和庫

2.1 python ,numpy,scipy,matplotlib (安裝方式:下載python3.#,安裝。如果沒有安裝pip,則手動下載安裝pip;執行pip install numpy,pip install scipy;pip install matplotlib)

2.2 sklearn,xgboost (執行pip install sklearn,pip install xgboost)      sklearn包含了大部分機器學習相關的技術   sklearn 中文網站:http://blog.csdn.net/chinachenyyx/article/details/75299043

2.3 tensorflow,keras (執行pip install tensorflow;pip install keras)    tensorflow包含了大部分深度學習相關的技術,keras是高度整合的深度學習框架

2.4 jieba(安裝方式:pip install jieba)  自然語言處理的工具,主要用於分詞

2.5 gensim (安裝方式:pip install gensim) 自然語言處理的工具,包含了很多自然語言處理的技術

2.7模型結果圖示化工具graphviz    參考資料:http://blog.csdn.net/love_data_scientist/article/details/78635032


 3.學習流程建議:

3.1可以先看李航老師的《統計學習方法》 和 《機器學習實戰(python實戰)》,不用貪多,比如《機器學習實戰(python實戰)》看一章,在《機器學習實戰(python實戰)》中找到相應的章節練習。走幾個演算法有感覺慢慢就好了

3.2等熟悉了機器學習處理的問題的一般流程,可以學習sklearn庫相關的資料,因為庫中幫我們實現了很多演算法

3.3前兩步完成了可以學習tensorflow(或者直接學習keras)

3.4學習完上面的,

可以學習推薦系統相關的東西,參考資料http://blog.csdn.net/love_data_scientist/article/details/77807880

可以學習自然語言相關的東西,入門為主不易入坑過深,參考資料http://blog.csdn.net/love_data_scientist/article/details/78110326;http://blog.csdn.net/love_data_scientist/article/details/78459999

關鍵是要理論和實踐相結合,否則收穫不大,而且容易忘


演算法依託資料,資料決定了模型的上限,而演算法只是逼近這個上限而已。

所以學習完機器學習相關的知識,還要補充資料處理相關的技術,比如hadoop,hive,mysql,尤其map-reduce的實現,可以使用java,python,shell等實現map-reduce,看個人喜好。參考資料:http://blog.csdn.net/love_data_scientist/article/details/78560668


如果還想深入學習,還可以學習一下資料檢索以及結果展示相關的知識,比如ES(elastic search),ELK(Elasticsearch、Logstash和Kibana)等