baselines演算法庫common/wrapper.py模組分析

阿新 • • 發佈：2022-03-19

common/wrapper.py模組：

import gym

class TimeLimit(gym.Wrapper):
    def __init__(self, env, max_episode_steps=None):
        super(TimeLimit, self).__init__(env)
        self._max_episode_steps = max_episode_steps
        self._elapsed_steps = 0

    def step(self, ac):
        observation, reward, done, info  
= self.env.step(ac)
        self._elapsed_steps += 1
        if self._elapsed_steps >= self._max_episode_steps:
            done = True
            info['TimeLimit.truncated'] = True
        return observation, reward, done, info

    def reset(self, **kwargs):
        self._elapsed_steps = 0
         
return self.env.reset(**kwargs)

class ClipActionsWrapper(gym.Wrapper):
    def step(self, action):
        import numpy as np
        action = np.nan_to_num(action)
        action = np.clip(action, self.action_space.low, self.action_space.high)
        return self.env.step(action)

    def reset(self, **kwargs):
         
return self.env.reset(**kwargs)

兩個對gym環境類的包裝類，TimeLimit限制環境類env的最大step數，如果到達最大step數後遊戲還沒有終止則強制返回終止狀態done=True，並設定返回資訊：info['TimeLimit.truncated'] = True 。

類ClipActionsWrapper對輸入給gym環境的動作進行包裝，如果輸入的action（action為numpy向量）中含有np.nan則置為0，

如果action中的數值大小超過action_space.low和action_space.high則進行clip操作。

============================================

baselines演算法庫common/wrapper.py模組分析

common/wrapper.py模組： import gym class TimeLimit(gym.Wrapper): def __init__(self, env, max_episode_steps=None):

baselines演算法庫common/tile_images.py模組分析

該模組只有一個函式，全部內容： import numpy as np def tile_images(img_nhwc): \"\"\" Tile N images into one big PxQ image

baselines演算法庫common/vec_env/vec_env.py模組分析

common/vec_env/vec_env.py模組內容： import contextlib import os from abc import ABC, abstractmethod

baselines演算法庫common/vec_env/util.py模組分析

util.py模組程式碼： \"\"\" Helpers for dealing with vectorized environments. \"\"\" from collections import OrderedDict

baselines演算法庫common/vec_env/dummy_vec_env.py模組分析

baselines演算法庫設計可以和多個並行環境進行互動，也就是並行取樣，實現多程序並行取樣的模組為subproc_vec_env.py，與此相對的只實現單個程序下多環境互動的模組即為本文所要講的dummy_vec_env.py模組。

baselines演算法庫common/vec_env/subproc_vec_env.py模組分析

模組程式碼： import multiprocessing as mp import numpy as np from .vec_env import VecEnv, CloudpickleWrapper, clear_mpi_env_vars

baselines演算法庫baselines/common/input.py模組分析

baselines演算法庫baselines/common/input.py模組程式碼： import numpy as np import tensorflow as tf

baselines演算法庫run.py模組分析

baselines演算法庫地址： https://gitee.com/devilmaycry812839668/baselines ========================================

baselines演算法庫baselines/bench/monitor.py模組分析

baselines演算法庫baselines/bench/monitor.py模組程式碼： __all__ = [\'Monitor\', \'get_monitor_files\', \'load_results\']

baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

如題： cmd_util.py模組中對應的程式碼：可以看到不論是atari遊戲還是retro遊戲，在進行遊戲環境包裝的時候都是分成兩部分的，如atari遊戲，第一部分是make_atari，第二部分是wrap_deepmind，在兩者之間有一

baselines庫中atari_wrappers.py中的環境包裝器的順序問題 baselines庫中cmd_util.py模組對atari遊戲的包裝為什麼要分成兩部分並在中間加入flatten操作呢？

如題：在baselines中對atari遊戲環境進行包裝的程式碼在atari_wrappers.py模組中，

Python影象處理庫PIL的ImageGrab模組介紹詳解

ImageGrab模組用於將當前螢幕的內容或者剪貼簿上的內容拷貝到PIL影象記憶體。

Python影象處理庫PIL的ImageDraw模組介紹詳解

ImageDraw模組提供了影象物件的簡單2D繪製。使用者可以使用這個模組建立新的影象，註釋或潤飾已存在影象，為web應用實時產生各種圖形。

Python影象處理庫PIL的ImageFont模組使用介紹

ImageFont模組定義了相同名稱的類，即ImageFont類。這個類的例項儲存bitmap字型，用於ImageDraw類的text()方法。

Python影象處理庫PIL的ImageEnhance模組使用介紹

ImageEnhance模組提供了一些用於影象增強的類。一、ImageEnhance模組的介面所有的增強類都實現了一個通用的介面，包括一個方法：

Python影象處理庫PIL的ImageFilter模組使用介紹

ImageFilter模組提供了濾波器相關定義；這些濾波器主要用於Image類的filter()方法。

Thinkphp 框架擴充套件之標籤庫驅動原理與用法分析

本文例項講述了Thinkphp 框架擴充套件之標籤庫驅動原理與用法。分享給大家供大家參考，具體如下：

java動態規劃演算法——硬幣找零問題例項分析

本文例項講述了java動態規劃演算法——硬幣找零問題。分享給大家供大家參考，具體如下：

使用SoundTouch演算法庫對聲音進行變速

上一篇我們使用了FFMPEG庫對視訊進行了解碼，拋開細節不談，通過使用介面IntPtr get_audio_frame(int key)，我們可以獲取到音訊的資料，也就是一堆位元組陣列，接下來，就輪到SoundTouch上場了，我們可以把SoundTouc

C++ 知識總結 P04：迭代器與演算法庫

迭代器迭代器用於遍歷容器。迭代器比較重要的一點是 end() 對應的迭代器並不指向結尾元素，而是結尾元素的後面一個，是無法解引用的。

baselines演算法庫common/wrapper.py模組分析

相關推薦