1. 程式人生 > >OpenAI Gym學習

OpenAI Gym學習

上篇部落格介紹了OpenAI Gym、OpenAI Gym與強化學習以及OpenAI Gym的安裝,接下來執行一個demo體驗一下OpenAI Gym這個平臺,以CartPole(倒立擺)為例,在工作目錄下建立一個python模組,程式碼如下:

import gym
env = gym.make('CartPole-v0')
env.reset()
for _ in range(1000):
    env.render()
    env.step(env.action_space.sample()) # take a random action

其中env.reset()重置環境的狀態,、env.render()重繪環境的一幀
這裡寫圖片描述


由動畫結果可以看出隨機控制演算法發散,系統很快失去穩定。如果想檢視其他一些環境,請嘗試用MountainCar-v0,MsPacman-v0(需要Atari依賴關係)或Hopper-v1(需要MuJoCo依賴項)替換上述CartPole-v0,這些環境都來自Env基類。