吳恩達機器學習筆記 —— 18 大規模機器學習

阿新 • • 發佈：2019-01-17

本章講了梯度下降的幾種方式：batch梯度下降、mini-batch梯度下降、隨機梯度下降。也講解了如何利用mapreduce或者多cpu的思想加速模型的訓練。

有的時候資料量會影響演算法的結果，如果樣本資料量很大，使用梯度下降優化引數時，一次調整引數需要計算全量的樣本，非常耗時。

如果訓練集和驗證集的誤差像左邊的圖形這樣，就可以證明隨著資料量的增加，將會提高模型的準確度。而如果像右邊的圖，那麼增加樣本的數量就沒有什麼意義了。

因此可以考慮縮小m的使用量，可以使用隨機梯度下降。隨機梯度下降的過程是：隨機打散所有的樣本，然後從第一個樣本開始計算誤差值，優化引數；遍歷所有的樣本。這樣雖然優化的方向比較散亂，但是最終還是會趨於最優解。

還有一種方式叫做小批量梯度下降，每次使用一小部分的資料進行驗證。比批量梯度下降更快，但是比隨機梯度下降更穩定。

針對損失函式和batch的數量，可以畫出下面的圖：圖1的震盪曲線可以忽略，此時的震盪可能是由於區域性最小值造成的；圖2如果增加數量能使得曲線更平滑，那麼可以考慮增加batch的數量。圖3 可能是模型根本沒有在學習，可以考慮修改一下其他的引數。圖4可能是因為學習太高，可以使用更小的學習率。

線上學習就是隨著資料的獲取，增量的來當做每個batch進行訓練。

如果資料的樣本很大，其實也可以通過map reduce的方式來進行並行處理，比如把資料切分成很多塊，每個map執行完，統一在reduce端進行引數梯度下降學習。多CPU的情況下，也是同樣的道理。

吳恩達機器學習筆記 —— 18 大規模機器學習

吳恩達機器學習筆記 —— 18 大規模機器學習

吳恩達（Andrew Ng）《機器學習》課程筆記（1）第1周——機器學習簡介，單變數線性迴歸

吳恩達（Andrew Ng）《機器學習》課程筆記（2）第2周——多變數線性迴歸

吳恩達第一門-神經網路和深度學習第二週6-10學習筆記

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記

資源 | Hinton、LeCun、吳恩達......不容錯過的15大機器學習課程都在這兒了

吳恩達deepLearning.ai迴圈神經網路RNN學習筆記_看圖就懂了！！！(理論篇)

吳恩達deepLearning.ai迴圈神經網路RNN學習筆記_沒有複雜數學公式，看圖就懂了！！！(理論篇)

吳恩達實驗（神經網絡和深度學習）第一課第三周，代碼和數據集，親測可運行

【機器學習--學習筆記】大規模機器學習

吳恩達DeepLearning.ai筆記（5-1）-- 迴圈序列模型

吳恩達DeepLearning.ai筆記（1-4）-- 深層神經網路

吳恩達deep learning筆記第二課改善深層神經網路：超引數除錯、正則化以及優化

【吳恩達deeplearning.ai筆記二】通俗講解神經網路上

Hadoop學習筆記—18.Sqoop框架學習

吳恩達機器學習筆記18-多類別分類：一對多(Multiclass Classification_ One-vs-all)

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

吳恩達“機器學習”——學習筆記二

吳恩達“機器學習”——學習筆記八

【吳恩達機器學習】學習筆記——1.5無監督學習

吳恩達機器學習筆記 —— 18 大規模機器學習

相關推薦