baselines庫中atari_wrappers.py中的環境包裝器的順序問題 baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

阿新 • • 發佈：2022-04-10

如題：

在baselines中對atari遊戲環境進行包裝的程式碼在atari_wrappers.py模組中，

def make_atari(env_id, max_episode_steps=None):
    env = gym.make(env_id)
    assert 'NoFrameskip' in env.spec.id
    env = NoopResetEnv(env, noop_max=30)
    env = MaxAndSkipEnv(env, skip=4)
    if max_episode_steps is not None:
        env  
= TimeLimit(env, max_episode_steps=max_episode_steps)
    return env


def wrap_deepmind(env, episode_life=True, clip_rewards=True, frame_stack=False, scale=False):
    """Configure environment for DeepMind-style Atari.
    """
    if episode_life:
        env = EpisodicLifeEnv(env)
    if 'FIRE' in 
 env.unwrapped.get_action_meanings():
        env = FireResetEnv(env)
    env = WarpFrame(env)
    if scale:
        env = ScaledFloatFrame(env)
    if clip_rewards:
        env = ClipRewardEnv(env)
    if frame_stack:
        env = FrameStack(env, 4)
    return env

由 baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

可以知道在make_atari函式中不對observation進行處理，wrap_deepmind函式對observation進行處理。

WarpFrame, ScaledFloatFrame, FrameStack，這三個環境包裝類是對observation進行處理包裝的。

其中，WarpFrame要求observation必須是shape為（height, width, channels）的np.array。

換句話說，warp_deepmind 的observation變數應該為圖片型別的np.array 。

還有一個需要注意的是，warp_deepmind中包裝類FireResetEnv是否應該在make_atari函式中的NoopResetEnv前面，根據國外的一些相關文章所指出的，認為應該是將FireResetEnv放在NoopResetEnv前面，修改後的程式碼為：

修改後的程式碼為：

def make_atari(env_id, max_episode_steps=None):
    env = gym.make(env_id)
    assert 'NoFrameskip' in env.spec.id
    if 'FIRE' in env.unwrapped.get_action_meanings():
        env = FireResetEnv(env)
    env = NoopResetEnv(env, noop_max=30)
    env = MaxAndSkipEnv(env, skip=4)
    if max_episode_steps is not None:
        env = TimeLimit(env, max_episode_steps=max_episode_steps)
    return env


def wrap_deepmind(env, episode_life=True, clip_rewards=True, frame_stack=False, scale=False):
    """Configure environment for DeepMind-style Atari.
    """
    if episode_life:
        env = EpisodicLifeEnv(env)
    env = WarpFrame(env)
    if scale:
        env = ScaledFloatFrame(env)
    if clip_rewards:
        env = ClipRewardEnv(env)
    if frame_stack:
        env = FrameStack(env, 4)
    return env

這樣修改的邏輯是，如果一個環境需要Fire button來啟動遊戲那麼在它之前進行NoopResetEnv是沒有意義的。

也就是說，在有fire操作和noop操作同時存在的情況下，最好是先進行fire操作再進行noop操作，在reset過程中fire操作後再進行noop操作。

==================================================

baselines庫中atari_wrappers.py中的環境包裝器的順序問題 baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

如題：在baselines中對atari遊戲環境進行包裝的程式碼在atari_wrappers.py模組中，

baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

如題： cmd_util.py模組中對應的程式碼：可以看到不論是atari遊戲還是retro遊戲，在進行遊戲環境包裝的時候都是分成兩部分的，如atari遊戲，第一部分是make_atari，第二部分是wrap_deepmind，在兩者之間有一

baselines中環境包裝器EpisodicLifeEnv的分析

如題： class EpisodicLifeEnv(gym.Wrapper): def __init__(self, env): \"\"\"Make end-of-life == end-of-episode, but only reset on true game over.

詳解在Windows環境下訪問linux虛擬機器中MySQL資料庫

Linux虛擬機器：VMware +ubuntu16.04.4 windows本機：Navicat for MySQL 1、虛擬機器中下載安裝MySQL

Mac中PyCharm配置Anaconda環境的方法

在 python 開發中我們最常用的IDE就是PyCharm，有關PyCharm的優點這裡就不在贅述。在專案開發中我們經常用到許多第三方庫，用的最多的命令就是pip install 第三方庫名進行安裝。現在你可以使用一個工具來幫你解決經

Pycharm中切換pytorch的環境和配置的教程詳解

pytorch安裝注：在訓練模型的時候，有時候可能需要不同版本的 torch和torchvision，所以需要配置不同的環境。anconda和pycharm自行安裝，接下來在pycharm終端pip安裝。

Window版下在Jupyter中編寫TensorFlow的環境搭建

在疫情飄搖的2020年初，TensorFlow釋出了2.1.0版本，本Python小白在安裝過程中遇坑無數，幸得多年練就的百度功力終於解決，特記錄下來以免後人跳坑。

Ubuntu中配置TensorFlow使用環境的方法

一、TensorFlow簡介 TensorFlow™是一個基於資料流程式設計（dataflow programming）的符號數學系統，被廣泛應用於各類機器學習（machine learning）演算法的程式設計實現，其前身是谷歌的神經網路演算法庫Dist

Pycharm中安裝wordcloud等庫失敗問題及終端通過pip安裝的Python庫如何新增到Pycharm直譯器中(推薦)

這裡介紹筆者在學習wordcloud庫時安裝過程中所遇到的問題和解決方案 1.在Pycharm中安裝wordcloud出現的問題如下圖所示

在VsCode中搭建Go開發環境的配置教程

現在Go1.14都已經發布好些日子了，之前發的Go環境搭建教程早已過時，只是因為時間問題一直沒來得及更新

在Mac中配置Python虛擬環境過程解析

如何在Mac中配置Python虛擬環境 1.安裝virtualenv pip3 install virtualenv 2.安裝virtualenvwrapper

windows中MongoDB安裝和環境搭建

下載安裝包或者壓縮包新增db儲存和日誌儲存資料夾新增服務、配置環境變數、啟動Mongo案例：安裝路徑：D:Program Files/MongoDB 　　　配置檔案的路徑：D:MongoDB一、安裝，可選自定義安裝路徑二、建立配置檔案　　

在Idea2020.1中使用gitee2020.1.0建立第一個程式碼庫的實現

以前一直做C#專案，最近一個專案得用JAVA，記錄下自己遇到的坑，給大家趟趟路。

在Notepad++中配置python執行環境

1、當然首先還是需要先安裝Python軟體包的，推薦Python 3.X 2、開啟Notepad++，【執行】--【執行】，或者直接按F5快捷鍵，輸入如下命令：

ubuntu中python3與虛擬環境的安裝

一、python3的安裝終端中輸入： sudo apt-get install python3.6 二、虛擬環境的安裝 1、安裝python-virtualenv

在Ubuntu20.04 LTS中配置Java開發環境

下載Java開發工具包jdk jdk的下載地址為：http://www.oracle.com/technetwork/java/javase/downloads/index.html。點選紅色方框中的JDK Download連結。

包裝類，物件比較中注意點

包裝類結論先行：包裝類物件之前進行比較是否相等時，使用equals()，或使用的對應的拆箱進行比較

【Java】SpringCloud架構系統中如何保證叢集環境下定時任務同時只有一個例項執行工作？

問題首先說下情況，我們平常開發SpringCloud微服務的時候，若要確保高可用，同一服務都會部署多臺例項，然後註冊到Eureka上。

Python虛擬開發環境，怎樣才能在系統中建立

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

馳騁BPM恭喜簽訂，中安金路環境工程有限公司

>>> 恭喜，馳騁BPM恭喜簽訂，中安金路環境工程有限公司沒有鋪天蓋地的廣告沒有滔滔不絕的誇誇其談沒有浮誇的吹噓一份開源的程式碼一個完整的專案演示一顆單純的心對待客戶足矣~ 考慮

baselines庫中atari_wrappers.py中的環境包裝器的順序問題 baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

相關推薦