OpenAI Gym 入門與提高(一) Gym環境構建與最簡單的RL agent
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow
也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!
Openai gym是一個用於開發和比較RL演算法的工具包,與其他的數值計算庫相容,如tensorflow或者theano庫。現在主要支援的是python語言,以後將支援其他語言。gym文件在https://gym.openai.com/docs。
Openai gym包含2部分:
1、gym開源庫:包含一個測試問題集,每個問題成為環境(environment),可以用於自己的RL演算法開發。這些環境有共享的介面,允許使用者設計通用的演算法。其包含了deep mind 使用的Atari遊戲測試床。
2、Openai gym服務:提供一個站點和api允許使用者對他們訓練的演算法進行效能比較。
總之,openai gym 是一個RL演算法的測試床(testbed)。
在增強學習中有2個基本概念,一個是環境(environment),稱為外部世界,另一個為智慧體agent(寫的演算法)。agent傳送action至environment,environment返回觀察和回報。
gym的核心介面是Env,作為統一的環境介面。Env包含下面幾個核心方法:
1、reset(self):重置環境的狀態,返回觀察。
2、step(self,action):推進一個時間步長,返回observation,reward,done,info
3、render(self,mode=’human’,close=False):重繪環境的一幀。預設模式一般比較友好,如彈出一個視窗。
more…..
瞭解更多內容請下載下面的pdf文件:
1-20160618-OpenAIGym入門與提高-1Gym環境構建與最簡單的RLagent.pdf