1. 程式人生 > >機器學習入門路線(參考)

機器學習入門路線(參考)

這是我個人的機器學習入門清單及路線,所以沒有像很多收藏夾那樣大而全,一來學不完,二來給自己壓力。這是個人的路線。算是個人記錄,也給大家參考,如有什麼不足之處,歡迎指教。

前置知識及技能
1、線性代數基礎,如果沒的話,還是先學了這門課在研究吧,不然會哭的。
2、學會python就行了。R也可以用用。
3、英語。起碼能基本的聽和讀吧,感覺中文的資料還不夠多,很難避免要看很多英文資料。建議學習某些教程時看英文版的tutorial,YouTube可以開字幕。

做了個流程圖,來展示下我的學習路線。

除了入門課程外,其他四項其實不完全是按照流程的(但總體上是),有時實戰時需要學新模型。有時學了某些模型再選方向也未遲。但是入門課程,尤其是Coursera那個,一定要看完了才開始後面的學習。下面給出每項的學習地址:

入門課程


1.Machine Learning | Coursera
,入門首選,推薦只認識“機器學習”四個字但還不知道它是什麼的學習
這些年機器學習的大多數年輕人靠這個入門。具體提綱我就不列了,免得增加篇幅。建議是直接按順序一課課學,不要著急。在學完這個課程前,不要學後面的。

2.CS231n: Convolutional Neural Networks for Visual Recognition
Stanford最受歡迎的課之一。做影象識別的,就算不想搞影象識別,也會學到很多有用的通用的東西。

框架研究


TensorFlow。推薦一個簡單的中文入門教程。主講人是一個在美國讀大學的中國留學生,講得很有趣。(咦,youtube的沒自動轉)
youtube.com/watch?

牆內的朋友可以在bilibili看(一樣的)
嗶哩嗶哩 ( ゜- ゜)つロ 乾杯~ Bilibili

caffe
caffe是Facebook的開源框架。新的caffe2支援手機跑模型,可以說是非常先進了(當然手機效能嘛,就…..)
Caffe | Caffe Tutorial
比較好的中文教程沒有找到,望有人留言推薦。

theano
沒怎麼研究這個,但這個教程看起來不錯
youtube.com/watch?

技巧,演算法與模型


特徵工程

特徵工程到底是什麼? - 知乎
CNN:
卷積神經網路工作原理直觀的解釋? - 知乎
RNN:
迴圈神經網路RNN開啟手冊 - 知乎專欄
你有哪些deep learning(rnn、cnn)調參的經驗?

方向選擇


機器學習領域,如何選擇研究方向? - 知乎
深度學習目前主要有哪些研究方向? - 知乎

訓練實戰


阿里雲天池
天池大資料眾智平臺-資料科學家社群

kaggle:一個競賽網站,最近被谷歌收購後更火爆了。
Your Home for Data Science
很多比賽是有獎金的,能拿個獎基本大把公司主動給你工作機會。可以從Titanic這個比賽開始。Titanic: Machine Learning from Disaster
要了解kaggle,我推薦一個不錯的文章:
Kaggle入門,看這一篇就夠了 - 知乎專欄


篇幅雖然有點短,但是學起來還是很久的。
最後共享一下自己的收藏夾,會持續更新,歡迎關注:
我的機器學習參考 - 收藏夾 - 知乎

相關推薦

機器學習入門路線參考

這是我個人的機器學習入門清單及路線,所以沒有像很多收藏夾那樣大而全,一來學不完,二來給自己壓力。這是個人的路線。算是個人記錄,也給大家參考,如有什麼不足之處,歡迎指教。前置知識及技能:1、線性代數基礎,如果沒的話,還是先學了這門課在研究吧,不然會哭的。2、學會python就行了。R也可以用用。3、英語。起碼能

機器學習入門點滴待補充完整

arr intro 統計 int ica nts 機器學習算法 .com 場景 Step1-知識準備: 1. 數學:線性代數,概率論和統計,高數 2. 程序語言:Matlab R 或 Python(只用於學習入門,不是實現的最佳語言) 3. 推薦書籍:選擇一到兩本公式較少、

程式設計師的機器學習入門筆記:推薦系統入門介紹

介紹 背景 隨著網際網路行業的井噴式發展,獲取資訊的方式越來越多,人們從主動獲取資訊逐漸變成了被動接受資訊,資訊量也在以幾何倍數式爆發增長。舉一個例子,PC時代用google reader,常常有上千條未讀部落格更新;如今的微信公眾號,也有大量的紅點未閱

Tensorflow MNIST機器學習入門程式碼直接編譯執行

廢話不多說,直接上程式碼,複製到Spyder,編譯執行。 #設定程式碼如下,可以避免下載input_data.py from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.r

中國mooc北京理工大學機器學習第一周

lib odi pen 運行 numpy 聚類 準則 ++ mooc 從今天開始跟著北理工的老師走一遍sklearn,在這裏做筆記。 一、聚類 1、K-Means方法 先貼代碼,所有數據的下載地址:http://pan.baidu.com/s/1hrO5NW4

中國mooc北京理工大學機器學習第二周:分類

kmeans 方法 輸入 nump arr mod 理工大學 each orm 一、K近鄰方法(KNeighborsClassifier) 使用方法同kmeans方法,先構造分類器,再進行擬合。區別是Kmeans聚類是無監督學習,KNN是監督學習,因此需要劃分出訓練集和測試

Andrew Ng機器學習課程筆記之神經網絡

sca 優化 介紹 www 之間 output 現在 利用 href Andrew Ng機器學習課程筆記(四)之神經網絡 版權聲明:本文為博主原創文章,轉載請指明轉載地址 http://www.cnblogs.com/fydeblog/p/7365730.html 前言

機器學習實戰一kNN

.com block 個數 indices 操作 來看 空間 計算機 python3 機器學習實戰一(kNN) 跟著老師做一個項目,關於行車記錄儀識別前方車輛,並判斷車距,不太好做。本來是用OpenCV,做著做著,突然發現需要補習一下機器學習的內容。《機器學習實戰(mach

《Python 機器學習》筆記

環境 成功 設定 相關 reward 能力 學習 一定的 env 賦予計算機學習數據的能力涵蓋:1.機器學習的一般概念2.機器學習方法的三種類型和基本術語3.成功構建機器學習系統所需的模塊機器學習的三種不同方法1.監督學習2.無監督學習3.強化學習通過監督學習對未來事件進行

《Python 機器學習》筆記

構造 split logs pos 不支持 虛擬 訓練樣本 字符 cal 數據預處理——構建好的訓練數據集機器學習算法最終學習結果的優劣取決於兩個主要因素:數據的質量和數據中蘊含的有用信息的數量。缺失數據的處理在實際應用過程中,樣本由於各種原因缺少一個或多個值得情況並不少見

《Python機器學習》筆記

後者 mean 子空間 otl 計算模型 lencod pytho 兩個 show 模型評估與參數調優實戰基於流水線的工作流一個方便使用的工具:scikit-learn中的Pipline類。它使得我們可以擬合出包含任意多個處理步驟的模型,並將模型用於新數據的預測。加載威斯康

我的機器學習之旅:回歸與工程應用

多個 算法 ati function RR numpy pen 圖片 bsp 內容:線性回歸;邏輯回歸,應用場景。 一、線性回歸 有監督學習,根據學習樣本{x->y},學習一個映射f:X->Y(線性相關),輸出預測結果y_i。最簡單的例子:y=ax+b 重要組成

我的機器學習之旅:決策樹

family 分配 根據 drop chrom labels arch ntp -o 決策樹概念: 分類決策樹模型是一種描述對實例進行分類的樹形結構。決策樹由結點和有向邊組成。結點有兩種類型:內部節點和葉節點,內部節點表示一個特征或屬性,葉節點表示一個類。 分類的時候,從根

機器學習實戰教程:線性回歸基礎篇

學習 reg style spa 目標 pub auto 機器 輸入 一 什麽是回歸?   回歸的目的是預測數值型的目標值,最直接的辦法是依據輸入,寫入一個目標值的計算公式。   假如你想預測小姐姐男友汽車的功率,可能會這麽計算:               Ho

機器學習升級版VII——第1課 機器學習與數學分析

矩陣分解 變化 回歸分析 兩個 例如 處理 fff mage 我們 參考:鄒博 《機器學習升級版》 1. 機器學習概論 1. 什麽是機器學習 定義:對於某給定的任務T,在合理的性能度量方案P的前提下,某計算機程序可以自主學習任務T的經驗E;隨著提供合適、

機器學習讀書筆記樸素貝葉斯基礎篇之網站賬號分類

pan 技巧 nbsp 增強 就是 使用 分類問題 預測 結果 一、條件概率 在學習計算p1和p2概率之前,我們需要了解什麽是條件概率,就是指在事件B發生的情況下,事件A發生的概率,用P(A|B)來表示。 根據文氏圖,可以很清楚地看到在事件B發生的情況下,事件A發

機器學習讀書筆記決策樹基礎篇之從相親說起

方法 事務 家裏 分類 筆記 判斷 都是 rom tro 一、決策樹 決策樹是什麽?決策樹(decision tree)是一種基本的分類與回歸方法。舉個通俗易懂的例子,如下圖所示的流程圖就是一個決策樹,長方形代表判斷模塊(decision block),橢圓形成代

監督學習的知識參考

概率 lasso 分類器 works 針對 net 條件 貸款 樸素 基礎 目標 利用一組帶有標簽的數據,學習從輸入到輸出的映射,然後將這種映射關系應用到未知數據上,達到分類或者回歸的目標 分類:輸出離散,為分類 回歸:輸出連續,為回歸 分類 評價標準 精確率,二分類為例,

機器學習簡要筆記——常見學習任務及算法

bubuko 屬性。 src 沒有 數據 數量 類別 降維 筆記 1、分類 從標識數據中學習分類特征,利用學習的分類特征,識別某個對象屬於哪個類別。 2、回歸 預測與對象相關聯的連續性屬性。 3、聚類 從沒有標記的數據中發現類似特征的分組,即將對象自動分組。

機器學習筆記之7——聚類演算法

對於監督學習,訓練資料都是事先已知預測結果的,即訓練資料中已提供了資料的類標。無監督學習則是在事先不知道正確結果(即無類標資訊或預期輸出值)的情況下,發現數據本身所蘊含的結構等資訊。 無監督學習通過對無標記訓練樣本的學習來尋找這些資料的內在性質。 聚類的目標是發現數據中自然形成的分組,使得每