1. 程式人生 > >研究生初學機器學習的幾點建議

研究生初學機器學習的幾點建議

通過我自己的這大半年的接觸和了解,結合找工作需要現對於如何入門機器學習提幾點自己的看法。如果你以後要想幹演算法工程師、機器學習工程師,資料探勘工程師。那麼請你好好看一下我下面說的話。

============================================================================

總路線

     先學機器學習,再學深度學習(實驗室某大神學長的建議),至少精通深度學習的一個方向:CV和NLP。期間要插科打諢地複習好資料結構、數學基礎和強化你的程式設計能力。

---------------------------------------------------------------------------------------------------------------------------

  • 數學功底:概率論、線性代數、高數、資訊理論(主要是資訊熵那部分)。
  • 資料結構:樹、棧、連結串列、佇列、圖!慢慢琢磨吧。(要有優化演算法複雜度的意識)
  • 程式設計能力:請轉移到leetcode、賽碼陣營好好磨練。《劍指offer》這本書是需要你好好看的。

----------------------------------------------------------------------------------------------------------------------------------

      書籍的話:《統計學習方法》(李航)、《機器學習》西瓜書、《深度學習》(Yoshua Bengio & Ian GoodFellow)、

《PRML》(選看)、《利用python進行資料分析》

      吳恩達的深度學習,機器學習課程,一些其他機器學習課程都可以看。在這裡,推薦一下中國海洋大學 黃海廣 博士牽頭的將吳恩達視訊做成的中文版學習筆記:機器學習深度學習。我自己還沒有看,不清楚質量如何,但是應該比較省事了。有錢的話,推薦優達學城,不過貴,不免費。深度學習的工具tensorflow和pytorch,可以買本書看,學會看官方文件,這兩個工具掌握一個就好。可以通過打比賽(天池、京東、騰訊、kaggle等),做專案,進一步強化自己的動手能力。

      大資料的話要會,要了解並行化分散式的東西,比如hadoop,spark,Hive等,要明白底層的工作原理。

     機器學習主要模型:線性迴歸,邏輯迴歸,svm,各種樹模型。原理公式要會,會推導。(如果你要走機器學習崗的工作),現在演算法崗對深度學習用處多一些。

     經典演算法:EM,HMM,貝葉斯網路,樸素貝葉斯,聚類,PCA,LDA,高斯混合模型。

    概率論相關:各種分佈,極大似然,最大後驗,假設檢驗的過程(顯著性水平和p的區別和聯絡),卡方檢驗等等。  

--------------------- 本文來自 _Amsterdam 的CSDN 部落格 ,全文地址請點選:https://blog.csdn.net/qq_34554003/article/details/80367344?utm_source=copy