1. 程式人生 > >學習+彭偉《揭秘深度強化學習》PDF+源代碼+資料

學習+彭偉《揭秘深度強化學習》PDF+源代碼+資料

設計 算法研究 資料 神經網絡 ref 圖片 描述 人工智能 基礎知識

深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結合,它是一種新興的通用人工智能算法技術,也是機器學習的前沿技術,DRL 算法潛力無限,AlphaGo 是目前該算法成功的使用案例。
DRL 算法以馬爾科夫決策過程為基礎,是在深度學習強大的非線性函數的擬合能力下構成的一種增強算法。深度強化學習算法主要包括基於動態規劃(DP)的算法以及基於策略優化的算法。

《揭秘深度強化學習》是要把這兩種主要的算法(及設計技巧)講解清楚,使算法研究人員能夠熟練地掌握。

學習參考:

《揭秘深度強化學習》PDF,376頁,帶目錄,文字可以復制。配套源代碼。作者:彭偉

下載: https://pan.baidu.com/s/1eVCDyse_FveXboet8w5s6A
提取碼: 78ry

技術分享圖片

《揭秘深度強化學習人工智能機器學習技術叢書》共10 章,首先以AlphaGo 在圍棋大戰的偉大事跡開始,引起對人工智能發 展和現狀的介紹,進而介紹深度強化學習的基本知識。然後分別介紹了強化學習(重點介紹蒙特卡洛算法和時序差分算法) 和深度學習的基礎知識、功能神經網絡層、卷積神經網絡(CNN)、循環神經網絡(RNN),以及深度強化學習的理論基礎和 當前主流的算法框架。介紹了深度強化學習在不同領域的幾個應用實例。引例、基礎知識和實例相結合,方便讀者理解和學習。

技術分享圖片

《揭秘深度強化學習 人工智能機器學習技術叢書》內容豐富,講解全面、語言描述通俗易懂,是深度強化學習算法入門的選擇。

技術分享圖片

學習+彭偉《揭秘深度強化學習》PDF+源代碼+資料