1. 程式人生 > >機器學習現狀以及目前機器學習競賽的主流框架或演算法

機器學習現狀以及目前機器學習競賽的主流框架或演算法

        Kaggle 上的競爭非常激烈(有些比賽有數千名參賽者,並提供數百萬美元的獎金),而且涵蓋了各種型別的機器學習問題,所以它提供了一種現實方法來評判哪種方法有效、哪種方法無效。那麼哪種演算法能夠可靠地贏得競賽呢?頂級參賽者都使用哪些工具?
        在 2016 年和 2017 年,Kaggle 上主要有兩大方法:梯度提升機和深度學習。具體而言,梯度提升機用於處理結構化資料的問題,而深度學習則用於影象分類等感知問題。使用前一種方法的人幾乎都使用優秀的XGBoost 庫,它同時支援資料科學最流行的兩種語言:Python 和 R。使用深度學習的 Kaggle 參賽者則大多使用 Keras 庫,因為它易於使用,非常靈活並且支援Python。
        要想在如今的應用機器學習中取得成功,你應該熟悉這兩種技術:梯度提升機,用於淺層學習問題;深度學習,用於感知問題。用術語來說,你需要熟悉 XGBoost 和 Keras,它們是目前主宰 Kaggle 競賽的兩個庫。