學習:深度學習公開課
在當下的機器學習熱潮,人才匱乏十分顯著。截至目前,國內開設人工智慧(AI)專業的高校不多,相當多的開發者是跨界入門,需要自學大量知識並摸索。因而優質的學習資源至關重要。因此,雷鋒網蒐集了全世界範圍內最受歡迎的機器學習課程,整理成這份“機器學習十大入門公開課”盤點,集中呈現給各位。這份推薦榜頗費心血,綜合考慮了難易、側重點、時效性等諸多因素,希望能幫助大家找到最適合自己的學習資源。
這些課程全部免費開放,但有些需翻牆,有的缺少中文字幕。
1. 吳恩達“機器學習”公開課
-
課程名稱:機器學習 Machine Learning
-
主講人:吳恩達 Andrew Ng
-
授課機構:斯坦福大學
-
釋出平臺:Coursera
-
語言:英語,漢語字幕
-
網址:https://www.coursera.org/learn/machine-learning
無論國內國外,這是最火的機器學習入門課程,沒有之一。無數新手都是通過這門課對機器學習初窺門徑。吳恩達老師用極其清楚直白的語言,對機器學習的幾種主要演算法做了初步介紹。
這門課最大的特點,是它側重於概念理解而不是數學。數學推導過程基本被略過,重點放在讓初學者理解這背後的思路。另外,它還十分重視聯絡實際和經驗總結:1. 課程中吳恩達老師列舉了許多演算法實際應用的例子 2. 他提到當年他們入門 AI 時面臨的許多問題,以及處理這些難題的經驗。
課程中程式碼教程使用的是 Octave/MATLAB,因此不需要會 Python、C 語言,適合沒有程式設計基礎的新手。
總結起來,這門課對數學、統計、IT 基礎薄弱的童鞋十分友好。其實很多機器學習入門課,都是假定學生已修完這一門,於是重點對其進行補充——講解這門課程中吳恩達老師未涉及、或是涉及不深的話題。因此,對於機器學習 “一張白紙”的童鞋,雷鋒網強烈推薦從這門課起步,然後選擇其他入門課程進階,以在腦海中建立起更全面的知識體系。另外,Coursera 上這門課的論壇十分活躍,不管丟擲什麼問題都會有人解答,算是一個額外的好處。
彩蛋:網易公開課上有吳恩達老師在斯坦福授課的實錄視訊。內容比較深入,但時間比較久了,可作為進階姊妹篇。地址:http://open.163.com/special/opencourse/machinelearning.html
2. 加州理工 “從資料中學習”
-
課程名稱:Learning from Data,網易公開課譯名為“加州理工學院公開課:機器學習與資料探勘”
-
主講人:Yaser Abu-Mostafa
-
授課機構:加州理工學院
-
釋出平臺:edX(原版),網易公開課
-
語言:英語,網易有漢語字幕
-
網址: https://www.edx.org/course/caltechx/caltechx-cs1156x-learning-data-2516,edX;
http://open.163.com/special/opencourse/learningfromdata.html,網易。
這同樣是一門機器學習的入門課,但並不簡單。該課程強調資料,是因為機器學習與各領域的大資料處理應用(比如金融、醫療)聯絡十分緊密。這門課內容涵蓋基礎理論、演算法和應用,平衡了理論與實踐,既覆蓋數學統計,也包含啟發式的概念理解。
課程結構是這樣的:
-
什麼是學習?
-
機器能學習嗎?
-
怎麼做到?
-
怎麼做好?
-
經驗教訓。
不少人評論該課程結構就像講故事,它有助於學習者形成對機器學習概念和模型深度、直覺性的理解。學習者公認它內容非常充實,但對作業模組的爭議很大:有人認為難度偏高並且缺乏反饋,有人認為它是網上能找到的、最好的機器學習練習。
彩蛋:Yaser Abu-Mostafa 出版了同名著作 《Learning From Data》,可作為該課程的教材和補充。
3. Tom Mitchell 機器學習課程
-
課程名稱:機器學習 Machine Learning
-
主講人:Tom Mitchell
-
授課機構:卡內基梅隆大學(CMU)
-
釋出平臺:CMU 官網
-
語言:英語
-
網址:http://www.cs.cmu.edu/~tom/10701_sp11/
這門課是學界人士的最愛,是入門課程之中較全面、高階的一門。課時為 15 周,遠超大多數機器學習慕課。其覆蓋的話題非常廣,按先後次序包括:代數和概率論,機器學習的基礎工具,概率圖模型,AI,神經網路,主動學習,增強學習。課程內容和練習十分簡潔明白,概念解釋清楚到位。
Tom Mitchell 是 AI 領域德高望重的老牌宗師,他的《Machine Learning》 (中文版為《電腦科學叢書:機器學習》),是最經典的機器學習教科書之一。但因為時間久遠,涉及的一些概念與今天的開發者並沒有太大關聯,更適合需要了解人工智慧來龍去脈的大學師生。這門課程與之類似,能幫助學習者理清機器學習的發展脈絡。它適合計劃進行系統性學習、投入大量時間的人。
對於初學者,建議至少聽完吳恩達的機器學習課程之後,再修這一門。
4. 臺大林軒田老師的機器學習基石
-
課程名稱:機器學習基石
-
主講人:林軒田
-
授課機構:臺灣大學
-
釋出平臺:Coursera
-
語言:漢語
這是為漢語學子量身定做的入門課,相當於臺灣大學機器學習課程前半學期的課,教給大家的是機器學習最核心的知識。林老師是教科書《Learning From Data》 的作者之一,是華人機器學習領域年輕有為的青年學者。這門課程十分用心細緻,內容比吳恩達老師的入門課程稍稍充實一些。
林老師表示,針對頂級機器學習公開課全是英語授課的現狀,不少學生反映英語教學有不易吸收之處。因此,借推出這門課程,希望幫助漢語為母語的學生減少入門難度。
針對如何讓學生接受枯燥的演算法,林老師說道:
“我們的課程設計中,大家會看到我們把對演算法與數學式的推導,以‘解決問題’的過程方式呈現。也就是說,我們對演算法的介紹是環繞著‘為什麼’出發的,當同學們腦中有‘為什麼’的時候,就有目標去理解這些演算法與數學式的內容了。”
《Learning From Data》 也可作為這門課的教科書。學習 Yaser Abu-Mostafa 的課程有不解之處,可與這門課互相印證。
目前該課程已在 Coursera 下架,何時重開尚屬未知。好在網易公開課、YouTube 倒是有全套視訊,地址是:http://c.open.163.com/coursera/courseIntro.htm?cid=938 以及 https://www.youtube.com/playlist?list=PLXVfgk9fNX2I7tB6oIINGBmW50rrmFTqf。更多課程資料可從臺大官網找到(網頁為英語)http://www.csie.ntu.edu.tw/~htlin/mooc/。
彩蛋:臺大 2015 年機器學習課程的大綱以及學習資料(PPT):https://www.csie.ntu.edu.tw/~htlin/course/ml15fall/,可作為補充。順便提一句,林老師把臺大後半學期的課程開成另一門 Coursera 課程“機器學習技巧”,作為進階。目前 Coursera 也已撤下。網易公開課地址為 http://c.open.163.com/coursera/courseIntro.htm?cid=1664。
5. 谷歌人工智慧入門
-
課程名稱:人工智慧入門 Intro to Artificial Intelligence
-
主講人:Peter Norvig,Sebastian Thrun
-
授課機構:谷歌
-
釋出平臺:優達學城 Udacity
-
語言:英語,漢語字幕
-
網址:https://cn.udacity.com/course/intro-to-artificial-intelligence--cs271
該課程久享盛名,是 AI 入門最好的公開課之一(雷鋒網注:有人認為可以去掉“之一”)。
嚴格來說,它並不是一門機器學習課程。但其中有一週的主題是機器學習,它還介紹了另外幾個 AI 主要領域:概率推理、資訊檢索、機器人學、自然語言處理等。鑑於學習機器學習的童鞋,幾乎都會對 AI 這個大學科有興趣——這門課程便是探索機器學習周邊與交叉領域的絕好機會。
兩位主講者,Peter Norvig 和 Sebastian Thrun,一個是谷歌研究總監,一個是斯坦福著名機器學習教授,均是與吳恩達、Yann Lecun 同級別的頂級 AI 專家。
需要強調的是,該課程傾向於介紹 AI 的實際應用。課程練習廣受好評。
6. UBC 本科生的機器學習課程
-
課程名稱:面向本科生的機器學習課 Machine Learning for Undergraduates
-
主講人: Nando de Freitas
-
授課機構:英屬哥倫比亞大學(UBC)
-
釋出平臺:Youtube
-
語言:英語
-
網址:https://www.youtube.com/playlist?list=PLE6Wd9FR--Ecf_5nCbnSQMHqORpiChfJf
Nando de Freitas 是機器學習領域非常傑出的學者。他的這門課很適合作為吳恩達老師“機器學習”的進階課程,因為:1. “機器學習”省略掉的一些概念,可以在這門課中找到。2. “機器學習”課 不重視數學,而數學是這門課的重點內容。Nando de Freitas 對諸如概率論、log likelihood 等基礎數學原理做了很好的講解,並以此為基礎介紹更高階的數學、統計概念。
對於機器學習新手,完全略過數學細節是很危險的,這門課會幫助你打下基礎。
但是,它錄製於 2012 年,時間也比較久了。因此,雷鋒網特意奉上彩蛋一枚。
彩蛋:Nando de Freitas 2013 年轉入牛津大學任教。這是他 2014-2015 學年在牛津的全套深度學習課程,包括視訊、PPT 以及練習:https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/ (視訊儲存在 Youtube,需翻牆)。
7. Yann Lecun 深度學習公開課
-
課程名稱:深度學習 Deep Learning
-
主講人:Yann Lecun
-
授課機構:法蘭西學院
-
釋出平臺:法蘭西學院官網
-
語言:法語,英語字幕
-
網址:https://www.college-de-france.fr/site/en-yann-lecun/course-2016-04-15-11h00.htm
Yann Lecun 在 2016 年初於法蘭西學院開課,這是其中關於深度學習的 8 堂課。當時是用法語授課,後來加入了英文字幕。
作為人工智慧領域大牛和 Facebook AI 實驗室(FAIR)的負責人,Yann Lecun 身處業內機器學習研究的最前沿。他曾經公開表示,現有的一些機器學習公開課內容已經有些過時。通過 Yann Lecun 的課程能瞭解到近幾年深度學習研究的最新進展。該系列可作為探索深度學習的進階課程。
8. Geoffrey Hinton 深度學習課程
-
課程名稱:神經網路用於機器學習 Neural Networks For Machine Learning;網易譯名“神經網路的機器學習”
-
主講人:Geoffrey Hinton
-
授課機構:多倫多大學
-
釋出平臺:Coursera、網易公開課
-
語言:英語,漢語字幕
-
網址:https://www.coursera.org/learn/neural-networks,Coursera;
http://c.open.163.com/coursera/courseIntro.htm?cid=77,網易
深度學習必修課程,講師為該領域的一代宗師 Geoffrey Hinton。
這門課程聚焦於神經網路和深度學習,是深入瞭解該領域最好的課程之一(雷鋒網注:很多人認為可以去掉“之一”)。
課程官方介紹:
“(你會在這門課)學習人工神經網路以及它們如何應用於機器學習,比方說語音、物體識別,影象分割(image segmentation),建模語言、人體運動等等。我們同時強調基礎演算法,以及對它們成功應用所需的實用技巧 。”
這門課錄製於 2013-2013,時效性上不如 Yann Lecun 的法蘭西學院公開課,建議兩者結合。另外,它要求微積分、Python 基礎,涉及許多專有名詞,對初學者難度較大,需自己查詢相關資料。
9. 哥倫比亞大學的機器學習公開課
-
課程名稱:機器學習 Machine Learning
-
主講人:John W. Paisley
-
授課機構:哥倫比亞大學
-
釋出平臺:edX
-
語言:英語
-
網址:https://www.edx.org/course/machine-learning-columbiax-csmm-102x
在這份大牛雲集的榜單中,該課程的主講者——哥倫比亞大學副教授 John Paisley,只是一名相對普通的青年學者。但是,這門課程將於兩天後,也就是 2017 年 1 月 16 日首次開課。這使它成為時下最新的機器學習入門課程。要知道,近一兩年來人工智慧和機器學習的發展完全可以用“日新月異”來形容——湧現的新方法、新理論,即便是一流專家也有目不暇接之感。換句換說,三、四年前的課程,可能現在有許多內容已經過時了。
這是 Yann LeCun 提醒大家注意學習資源時效性的原因所在。
可惜許多一流的機器學習公開課,距離錄製都有些久了。我們知道一堂公開課背後所耗費的巨大人力。因此,對於部分課程在近兩三年並沒有更新的事實,倒也不能去怪主講者和平臺。但這使得比較新、時效性較強的課程格外可貴。
這門課中,學習者會了解到機器學習的演算法、模型和方法,以及它們在現實生活中的應用。
由於是首次開課,尚沒有對該課程的反饋。但鑑於哥倫比亞大學的研究、教學實力,課程品質應當值得期待。
10. MIT 進階課程
-
課程名稱:機器學習 Machine Learning
-
主講人:Tommi Jaakkola
-
授課機構:麻省理工學院(MIT)
-
釋出平臺:MIT Opencourseware
-
語言:英語
-
網址:https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-867-machine-learning-fall-2006/index.htm
這是一門研究生水平的機器學習課程,難度較高。可惜的是,MIT 並沒有提供課程視訊,而是以參考書目和課堂筆記的形式,讓我們得以一窺該課程的內容。小編認為,這些學習資源的價值仍舊不可估量。因為如此,相比常規公開課,它不會耗費過多時間,非常適合有一定基礎的學習者印證自己所學。
小結
這就是雷鋒網為您盤點的十大最有價值的機器學習入門公開課。這些課程有淺有深,分別對機器學習不同領域、方面有所側重。各位童鞋可根據自己所需,自行選擇最適合自己的課程。不過,小編必須提醒各位,所有盤點都不可避免得摻雜了主觀因素。雖然雷鋒網已盡力按照課程質量與業內人士的評價來制定該推薦榜,但自知無法做到十足的公正客觀。比方說,該榜單傾向於機器學習的“入門”,而非開發者進階;傾向於概念、演算法學習,而非實戰技巧(比如 Python 教程);傾向於把全世界範圍內最好的課程推薦給諸君,而對英語基礎較差的學習者照顧不足。榜單之外尚有許多有價值、適應不同層次人士需求的公開課。因此,雷鋒網特意列舉了幾個比較好的系統性機器學習課程以及學習平臺,彌補該榜單不足,以供參考。
友情提醒,以下包含收費課程。
系統性課程:
-
優達學城(Udacity)提供的的 “機器學習工程師”納米學位,中文字幕,谷歌、滴滴參與授課,收費。
https://cn.udacity.com/course/machine-learning-engineer-nanodegree--nd009
-
華盛頓大學的“機器學習專業”系列課程,Coursera 平臺,收費,共六門課。
https://www.coursera.org/specializations/machine-learning
-
密歇根大學的“Python 的應用資料科學專業”系列課程,Coursera 平臺,收費,共五門課。適合需要學習 Python 實戰技巧的機器學習開發者。
https://www.coursera.org/specializations/data-science-python