1. 程式人生 > >Gym小記(七)

Gym小記(七)

Gym wrappers(補)

        本文我們介紹如何用Gym wrappers對我們的環境進行包裝,從而將訓練過程中的資料以及視訊儲存下來,我們僅僅介紹簡單的使用,複雜的使用我暫時還用不到......

        直接上程式碼:

import gym
from gym import wrappers

env=gym.make('CartPole-v0')
env=wrappers.Monitor(env,'/tmp/cartpole-experiment-1')
for _ in range(20):
	observation=env.reset()
	for t in range(100):
		env.render()
		print observation
		action=env.action_space.sample()
		observation,reward,done,info=env.step(action)
		if done:
			print("Episode finished after {} timesteps".format(t+1))
                        break
        執行結果如下所示:


        檔案中各個檔案的意義見Gym小記(六),本文與這篇文章都是在討論Gym Wrappers,所以這裡再拓展一點點......

        上面我們已經將資料以及視訊記錄到了指定資料夾中,如果此時我們在程式碼中仍然指定同一個資料夾將會出現如下錯誤:

       

        按照錯誤中給出的說明,我們可以通過刪除掉已經生成的記錄檔案來解決這一問題,但是每次都這樣刪除可能比較麻煩,比如說,有時候我們僅僅嘗試性的執行一下程式碼,或是在修改其他地方的錯誤,然後導致生成了記錄檔案,就很煩了。所以我們需要尋求一種解決辦法,方法很簡單,就是在wrappers.Monitor()中傳入引數force=True,即可強制性地覆蓋掉前面我們生成的記錄檔案:

env=wrappers.Monitor(env,'/tmp/cartpole-experiment-1',force=True)
        就是這麼簡單~


相關推薦

Gym小記

Gym wrappers(補)         本文我們介紹如何用Gym wrappers對我們的環境進行包裝,從而將訓練過程中的資料以及視訊儲存下來,我們僅僅介紹簡單的使用,複雜的使用我暫時還用不到......         直接上程式碼: import gym fr

python3 語法小記 shape的使用

shape函式是numpy.core.fromnumeric中的函式,它的功能是檢視矩陣或者陣列的維數。 shape函式有兩種表達形式:(1)np.shape(a)                  

Gym小記

淺析Gym中的env         近期在Gym上做有關強化學習的實驗,用的是OpenAI Gym環境,但是我對於其中的state、observation、action存在疑問,到底這些量都包含什麼呢?         然後我就去官網的Forum上去找,雖然有人存在相同的

Gym小記

試用gym wrappers         gym wrappers用於將環境進行打包,我們可以使用這個模組來記錄自己的演算法在環境中的表現,並拍攝自己演算法學習的視訊,示例如下: import gym from gym import wrappers env=gym.

Gym小記

Gym Box2D         Gym為我們提供了各種各樣的環境,其中對我最有用的是MuJoCo,但是這個要收費......         所以,我就只能去用Box2D環境了,畢竟免費~現在對Gym Box2D環境進行一些簡單的說明。         首先,我們來了解

設計模式學習總結適配器模式(Adapter)

實現接口 國外 手機 額外 sed ges program ebe 通過   適配器模式主要是通過適配器來實現接口的統一,如要實現國內手機在國外充電,則需要在不同的國家采用不同的適配器來進行兼容!   一、示例展示:   以下例子主要通過給筆記本電腦添加類似手機打電話和發短

Docker網絡

docker 網絡 dns networking 容器和宿主機、容器之間以及誇主機容器如何通訊呢?這就需要使用到Docker網絡。在前面的介紹中我們在Dockerfile中通過EXPOSE參數來設置容器暴露的端口,讓在docker run中使用-p來設置宿主機端口到容器端口的映射,這只是最簡單

團隊沖刺階段

logs family 註冊 ges com 初步 宋體 登錄註冊 技術分享 站立會議:    任務進度:   目前學生登錄註冊界面已經初步完成,正在完成跳轉操作;老師網頁也在潤色中,目前初步完成。 任務面板: 燃盡圖: 團隊沖刺階段(七)

【OpenGL】Shader實例分析- 雪花飄落效果

mouse llb cto 接下來 pix lan details effect art 轉發請保持地址:http://blog.csdn.net/stalendp/article/details/40624603 研究了一個雪花飄落效果。感覺挺不錯的。分享給大家,效

下午 拓展 今天 代碼 一點 留下 之前 沒有 問題 還是上次遺留下的空指針問題 明明是對的非說有空指針 今天還出現卡死的情況 感覺越來越糟 現在回過頭看之前的代碼有點亂 明天開始重新把類 理一下 提高拓展性 今天從下午找到晚上還是沒有什麽結果 好氣 還是得總頭到尾自己

Hibernate中使用JDBC

alt work 方法 代碼 cep cti 一個 sdm admin 在hibernate中獲取connection數據庫連接有兩種方法:(操作數據庫常用這種方法) 1. session.doReturningWork 返回一個對象,適用於查詢方法 2. ses

黑盒測試用例設計-正交試驗方法

nbsp 出現 logs 因果圖 設計 步驟 引入 常用 因子和 6.正交試驗方法 第4節結尾提到,因果關系非常龐大,導致由此得到的測試用例數目多大。因而引入正交試驗法,從大量的試驗數據中挑選適量的、有代表性的點安排測試,來有效地、合理地減少測試的工時。 (1

Centos7系列邏輯卷詳解

centos7 邏輯卷 博主QQ:819594300博客地址:http://zpf666.blog.51cto.com/有什麽疑問的朋友可以聯系博主,博主會幫你們解答,謝謝支持!Centos7可以用xfs_growfs來擴大XFS文件系統,用resize2fs 來擴大ext4文件系統,註意的是 XFS

JAVA學習:方法重載與方法重寫、thiskeyword和superkeyword

格式 hello new 初始 per 而且 方法重寫 學習 方式 方法重載與方法重寫、thiskeyword和superkeyword 1、方法重載 重載可以使具有同樣名稱但不同數目和類型參數的類傳遞給方法。 註: 一是重載方法的參數列表必須與被重載的方法不同

《嵌入式系統可靠性設計技術及案例解析》讀書筆記

lcd 適合 實現 電源線 寬度 減少 狀態 面膜 平面 電磁兼容(Electro Magnetic Compatibility,EMC)是指設備或系統在電磁環境中運行時,不會因為其他設備的合理電磁幹擾而影響本機的功能和安全性,也不會對其環境中的任何設備產生不合理的電磁幹擾

Mosquito的優化——epoll優化

stat cep acc style 功能 pic 隊列 strong 使用epoll 本文由逍遙子撰寫,轉發請標註原址: http://blog.csdn.net/houjixin/article/details/46413583 或 http://houjixin

數據清洗小記2:全角數字轉換半角數字

大局觀 山東 轉載 亞洲 pop rpm包 stats mod 法律 原創作品。出自 “深藍的blog” 博客,歡迎轉載,轉載時請務必註明出處,否則有權追究版權法律責任。深藍的blog:http://blog.csdn.net/huangyanlong/article/d

linux操作系統基礎篇

多個 success centos mountd rpcbind ces 說明 目錄 發送 NFS服務(基於CentOS 7.0) NFS(Network File System),網絡文件系統,是linux與linux之間進行文件共享的服務,在NFS應用,本地NFS的客戶

mysql學習筆記—— MySQL內連接和外連接

聚集函數 信息 _id left tro 做了 學習 作用 group MySQL內連接(inner join on) MySQL的內連接使用inner join on,它的效果跟使用where是一樣的,如果聯結的是兩個表,那麽需要左右的條件或者說字段是

數據庫SQL Server2012筆記——java 程序操作sql server

jdb 統一 col select 封裝 query size api color 1、crud(增刪改查)介紹:create/retrieve/update/delete 2、JDBC介紹 1)JDBC(java database connectivi