開源免費!谷歌用於訓練AI模型的強化學習框架!
強化學習 - 一種人工智慧(AI)技術,使用獎勵(或懲罰)來驅動代理人朝著特定目標前進 - 訓練打敗Alpha Go世界冠軍的系統並掌握Valve的Dota 2.它是Google子公司的核心部分 DeepMind的深度Q-network(DQN),可以在多個工作人員中分配學習,例如,在Atari 2600遊戲中實現“超人”效能。 麻煩的是,強化學習框架需要時間來掌握一個目標,往往不太靈活的,而且不是很穩定。
這也就是谷歌提出替代方案的原因:基於TensorFlow的開源強化框架,它是一個機器學習庫。 目前,它已經上線Github。
“受到大腦中獎勵動機行為的主要成分之一的啟發,並反映了神經科學與強化學習研究之間強烈的歷史聯絡,該平臺旨在實現可以推動激進發現的那種投機性研究,”Pablo Samuel Castro和 Google Brain Team的研究人員Marc G. Bellemare在一篇博文中寫道。 “這個版本還包括一組闡明如何使用我們框架的colabs。”
他們和Google Brain團隊開發了強化框架,其中考慮了三個原則:靈活性,穩定性和可重複性。
為此,它包括一套精心編寫的程式碼(15個Python檔案),專注於街機學習環境 - 一個用視訊遊戲評估AI技術的平臺 - 以及四種不同的機器學習模型:上述DQN;C51; Rainbow代理的簡化版本; 和隱式分位數網路。 為了重現性,程式碼在Arcade學習環境支援的60個遊戲中提供完整的測試覆蓋率和訓練資料(採用JSON和Python pickle格式),並遵循標準化經驗評估結果的最佳實踐。
除了增強框架的釋出,谷歌還推出了一個網站,允許開發人員快速視覺化多個代理的培訓執行。 它還提供經過訓練的模型,原始統計日誌和TensorFlow事件檔案,用於TensorBoard繪圖,TensorBoard是Mountain View公司的TensorFlow程式視覺化工具套件。
“我們的希望是,我們的框架的靈活性和易用性將使研究人員能夠嘗試新的思想,包括增量和激進,”Bellemare和Castro寫道。 “我們已經積極地將它用於我們的研究,發現它使我們能夠靈活地快速迭代許多想法。 我們很高興看到社群可以幫助做些更偉大的事。“
鑑於TensorFlow目前這麼流行,想要學習和實踐的程式設計師們也可以瞭解下谷歌最近的AI開源專案——AIY Projects。AIY 全稱是 Artificial Intelligence Yourself,顧名思義就是利用 AI 來進行的 DIY 功能套件。谷歌目前為 AIY Projects 推出了兩款硬體--AIY Voice Kit 和 AIY Vision Kit。其中, Vision Kit(視覺套件)附帶的軟體可執行三個基於TensorFlow的神經網路,可以處理影象識別和計算機視覺, 支援離線識別上千種常見物體(動物、植物)以及人臉、面部表情等。
谷歌為此還發布了一個TensorFlow.js的工具,有了這項工具,即使不是機器視覺領域的專家,大家也可以實現很多應用場景,比如在瀏覽器中訓練自己的寵物臉辨識系統,在自家的監視系統中使用等等。