1. 程式人生 > >斯坦福大學公開課機器學習:machine learning system design | data for machine learning(數據量很大時,學習算法表現比較好的原理)

斯坦福大學公開課機器學習:machine learning system design | data for machine learning(數據量很大時,學習算法表現比較好的原理)

ali 很多 好的 info 可能 斯坦福大學公開課 數據 div http

下圖為四種不同算法應用在不同大小數據量時的表現,可以看出,隨著數據量的增大,算法的表現趨於接近。即不管多麽糟糕的算法,數據量非常大的時候,算法表現也可以很好。

技術分享圖片

數據量很大時,學習算法表現比較好的原理:

使用比較大的訓練集(意味著不可能過擬合),此時方差會比較低;此時,如果在邏輯回歸或者線性回歸模型中加入很多參數以及層數的話,則偏差會很低。綜合起來,這會是一個很好的高性能的學習算法。

技術分享圖片

斯坦福大學公開課機器學習:machine learning system design | data for machine learning(數據量很大時,學習算法表現比較好的原理)