1. 程式人生 > >機器學習該怎麽入門?

機器學習該怎麽入門?

機器學習入門

在說該怎麽入門之前,咱們應該了解一下什麽是機器學習。機器學習也叫數據挖掘、模式識別,其定義很多。

簡單地說,機器學習要做的就是,現在有些數據(比如你人人網好友和他們的發言),我們要對數據進行處理,希望從數據中得到我們想要的信息(比如這些好友哪些和你投緣)。由此我們可以看出機器學習其實是對人類智能的模仿,也是實現人類和更高智能的必經之路。

機器學習這個概念認為,對於待解問題,你無需編寫任何專門的程序代碼,泛型算法(generic algorithms)能夠在數據集上為你得出有趣的答案。對於泛型算法,不用編碼,而是將數據輸入,它將在數據之上建立起它自己的邏輯。

舉個例子,有一類算法稱為分類算法,它可以將數據劃分為不同的組別。一個用來識別手寫數字的分類算法,不用修改一行代碼,就可以用來將電子郵件分為垃圾郵件和普通郵件。算法沒變,但是輸入的訓練數據變了,因此它得出了不同的分類邏輯。

好了,說了這麽多,該開始講重點了:機器學習到底該怎麽入門?

第一,找個項目或者找一門稍微具體點的關於機器學習的書。開始深入研究。機器學習應用只是一方面,要想明白透徹,還得整明白這一個個模型背後的故事。

第二,去Coursera上Andrew Ng的《機器學習》,完成所有作業,最好能全部拿滿分。這是相當入門的課程。

課程深入淺出,而且作業也非常適合入門者,都是設計好的程序框架,有作業指南,根據作業指南填寫該完成的部分就行。這門課上完了,你基本上可以開始簡單地應用各種機器學習技術了。

第三,修煉內功。話說自己發現光應用不行,還得整明白其背後的東東後,就想四處找人請教,到哪兒去學高級的內功呢?看看這份清單(微博上發現的):


技術分享



聽說這是機器學習教父級別的人物Jordan推薦的書籍,而且全部都是值得珍藏的!這些資料大多都可以在百度裏搜到。如果搜索不到大家也可以去新浪微博找那些搞機器學習的人尋求幫助,他們會很熱心的。

說完入門學習,如果你還想進行深入學習機器學習,看看應該怎麽做:

當前機器學習的最大問題是它主要活躍於學術界和商業研究組織中。對於圈外想要有個大體了解而不是想成為專家的人們,簡單易懂的學習資料不多。但是這一情況每一天都在改善。

你可以下載安裝SciKit-Learn,用它來試驗成千上萬的機器學習算法。它是一個python框架,對於所有的標準算法都有“黑盒”版本。

看看機器學習概要圖 by Yaser Abu-Mostafa (Caltech)



技術分享


差不多就是這樣了。最後說幾句心裏話,不管你學習哪一門新科目,都不是一帆風順的。還有,重要的是你的決心,你到底要不要學這門學科!你要是抱著半吊子的心態,那你可以不用看了,因為半吊子的決心學不明白任何一門學科!你要是想學,就咬緊牙,堅持看,反復看,反復查以及多動手。


本文出自 “小小千” 博客,請務必保留此出處http://xiaoxiaoqian.blog.51cto.com/9235704/1961945

機器學習該怎麽入門?