1. 程式人生 > >Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

Deep RL Bootcamp Lecture 4B Policy Gradients Revisited

pat https 分享 .com TP 9.png google ive hub

https://drive.google.com/file/d/0BxXI_RttTZAhTUpqUFdEZ3BXNFE/view

技術分享圖片

技術分享圖片

game of Pong is a MDP.

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

技術分享圖片

終於一睹AK真容了,很有想法,很幽默

http://karpathy.github.io/

技術分享圖片

Deep RL Bootcamp Lecture 4B Policy Gradients Revisited