R語言學習筆記-機器學習1-3章

阿新 • • 發佈：2019-01-17

在折騰完爬蟲還有一些感興趣的內容後，我最近在看用R語言進行簡單機器學習的知識，主要參考了《機器學習-實用案例解析》這本書。

這本書是目前市面少有的，純粹以R語言為基礎講解的機器學習知識，書中涉及11個案例。分12章。作者備註以及程式碼部分都講得比較深。不過或許因為出書較早，在資料處理方面，他使用更多的是plyr包，而我用下來，dplyr包效果更好。所以許多涉及資料處理的程式碼，其實可以用更簡潔的方法重寫。但是思路卻是實打實的精華。

我之前在某長途動車上啃完了前三章，兩個案例。但越往後讀，越覺得後面案例處理方法越複雜，更加晦澀了，需要更多時間消化，因此暫停下來，先把前兩個案例給理理順，消化一下結構點。

書中案例資料及程式碼均可在官方github中下載到，地址為https://github.com/johnmyleswhite/ML_for_Hackers

案例1：美國UFO觀察

該案例用的是一個含有60,000多條不明飛行物的目擊記錄和報告的資料集。需要回答UFO出現是否有周期性規律，以及地域規律兩個問題。主要涉及資料清洗環節。

在研讀後，我繪製的流程圖如下圖：

案例2：二分法判別垃圾郵件

該案例用的是來自於SpamAssasin的郵件，它分為垃圾郵件spam，易識別的正常郵件easy ham，不易識別的正常郵件hard ham三個型別。案例目的是做一個分類器，能夠通過詞頻特徵（如html等）快速識別郵件的型別。

使用的是樸素貝葉斯分類法。

繪製的流程圖及注意事項見下：

流程圖用visio 2013繪製。很喜歡它的手繪風流程圖，之前想嘗試一下其他流程圖軟體，比較下來，還是visio最好用啊……

接下來的本月目標

1）金融時間序列

2）機器學習4-7章

R語言學習筆記-機器學習1-3章

R語言學習筆記-機器學習1-3章

學習筆記 | 機器學習-周志華 | 3

學習筆記 | 機器學習-周志華 | 1

【日常學習筆記】2019/1/3(Log4j與web安全)

機器學習基礎學習筆記——機器學習基礎介紹

[學習筆記]機器學習——演算法及模型（五）：貝葉斯演算法

學習筆記 | 機器學習-周志華 | 5

學習筆記 | 機器學習-周志華 | 4

學習筆記 | 機器學習-周志華 | 2

人工智障學習筆記——機器學習(13)LLE降維

人工智障學習筆記——機器學習(4)支援向量機

機器學習筆記——機器學習建議與誤差分析

人工智障學習筆記——機器學習(12)LDA降維

人工智障學習筆記——機器學習(11)PCA降維

Hands on Machine Learning with Sklearn and TensorFlow學習筆記——機器學習概覽

人工智障學習筆記——機器學習(7)FM/FFM

人工智障學習筆記——機器學習(15)t-SNE降維

Tensorflow學習筆記:機器學習必備API

學習筆記——機器學習--多項式分佈及Softmax迴歸模型推導

斯坦福大學機器學習筆記——機器學習系統設計（誤差分析、查全率和查準率、F1值）

R語言學習筆記-機器學習1-3章

相關推薦