python 終端環境搭建

阿新 • • 發佈：2020-11-29

import numpy as np
import pandas as pd
import time

np.random.seed(2)  # reproducible


N_STATES = 6   # the length of the 1 dimensional world
ACTIONS = ['left', 'right']     # available actions
EPSILON = 0.9   # greedy police
ALPHA = 0.1     # learning rate
GAMMA = 0.9    # discount factor
MAX_EPISODES = 13   # maximum episodes
FRESH_TIME = 0.3    # fresh time for one move


def build_q_table(n_states, actions):
    table = pd.DataFrame(
        np.zeros((n_states, len(actions))),     # q_table initial values
        columns=actions,    # actions's name
    )
    # print(table)    # show table
    return table


def choose_action(state, q_table):
    # This is how to choose an action
    state_actions = q_table.iloc[state, :]
    if (np.random.uniform() > EPSILON) or ((state_actions == 0).all()):  # act non-greedy or state-action have no value
        action_name = np.random.choice(ACTIONS)
    else:   # act greedy
        action_name = state_actions.idxmax()    # replace argmax to idxmax as argmax means a different function in newer version of pandas
    return action_name


def get_env_feedback(S, A):
    # This is how agent will interact with the environment
    if A == 'right':    # move right
        if S == N_STATES - 2:   # terminate
            S_ = 'terminal'
            R = 1
        else:
            S_ = S + 1
            R = 0
    else:   # move left
        R = 0
        if S == 0:
            S_ = S  # reach the wall
        else:
            S_ = S - 1
    return S_, R


def update_env(S, episode, step_counter):
    # This is how environment be updated
    env_list = ['-']*(N_STATES-1) + ['T']   # '---------T' our environment
    if S == 'terminal':
        interaction = 'Episode %s: total_steps = %s' % (episode+1, step_counter)
        print('\r{}'.format(interaction), end='')
        time.sleep(2)
        print('\r                                ', end='')
    else:
        env_list[S] = 'o'
        interaction = ''.join(env_list)
        print('\r{}'.format(interaction), end='')
        time.sleep(FRESH_TIME)


def rl():
    # main part of RL loop
    q_table = build_q_table(N_STATES, ACTIONS)
    for episode in range(MAX_EPISODES):
        step_counter = 0
        S = 0
        is_terminated = False
        update_env(S, episode, step_counter)
        while not is_terminated:

            A = choose_action(S, q_table)
            S_, R = get_env_feedback(S, A)  # take action & get next state and reward
            q_predict = q_table.loc[S, A]
            if S_ != 'terminal':
                q_target = R + GAMMA * q_table.iloc[S_, :].max()   # next state is not terminal
            else:
                q_target = R     # next state is terminal
                is_terminated = True    # terminate this episode

            q_table.loc[S, A] += ALPHA * (q_target - q_predict)  # update
            S = S_  # move to next state

            update_env(S, episode, step_counter+1)
            step_counter += 1
    return q_table


if __name__ == "__main__":
    q_table = rl()
    print('\r\nQ-table:\n')
    print(q_table)

python 終端環境搭建

import numpy as np import pandas as pd import time np.random.seed(2)# reproducible N_STATES = 6# the length of the 1 dimensional world

vscode的python開發環境搭建，環境變數支援終端命令列(執行當前

vscode的python開發環境設定安裝vscode,這裡不介紹了安裝外掛在${workspaceFolder}的目錄下，新建.vscode資料夾(或者修改一下配置，也可以自動生成該資料夾)

python elasticsearch環境搭建詳解

windows下載zip linux下載tar 下載地址：https://www.elastic.co/downloads/elasticsearch 解壓後執行：bin/elasticsearch (or bin\\elasticsearch.bat on Windows)

Appium-Python-Windows環境搭建筆記

Appium服務端一、JDK 1.1 推薦版本：Java SE 8u261 1.2 下載地址：https://www.oracle.com/technetwork/cn/java/javase/downloads/index.html

MAC平臺基於Python Appium環境搭建過程圖解

前言最近筆者要為python+appium課程做準備，mac在2019年重新安裝了一次系統，這次重新在mac下搭建appium環境，剛好順帶寫個文稿給大家分享分享搭建過程。

python虛擬環境搭建

虛擬環境為什麼需要虛擬環境：到目前位置，我們所有的第三方包安裝都是直接通過pip install xx的方式進行安裝的，這樣安裝會將那個包安裝到你的系統級的Python環境中。但是這樣有一個問題，就是如果你現在用Django

Python selenium環境搭建實現過程解析

一：自動化了解知識工具安裝什麼樣的專案適合做自動化？自動化測試一般在什麼階段開始實施？

linux下安裝python_（工具）Python筆記總結 Linux下python虛擬環境搭建實測

技術標籤：linux下安裝python 平時要麼在Windows上部署python指令碼，要麼在Linux上部署python指令碼，但是個人感覺還是Windows上的pycharm會用著舒服些，所以會有在Win上開發，在Linux上部署的情況，下面介紹

程式設計（Python）實驗一 Python 執行環境搭建及使用

技術標籤：Python程式設計實驗（SWUST）python 實驗目的熟悉 Python 開發環境的使用熟悉 Python 應用程式的建立與執行掌握 Python 輸入與輸出

Python的環境搭建與語法入門_2

什麼是計算機語言計算機就是一臺用來計算的機器，人讓計算機幹什麼計算機就得幹什麼！

Python的環境搭建與語法入門_3

流程控制語句簡介 Python程式碼在執行時是按照自上向下順序執行的。通過流程控制語句，可以改變程式的執行順序，也可以讓指定的程式反覆執行多次

Python+Appium環境搭建

windows下搭建python+appium環境搭建過程步驟如下： 1、安裝jdk並配置好環境變數（jdk版本1.8以上）

Python 環境搭建

本章節我們將向大家介紹如何在本地搭建Python開發環境。 Python可應用於多平臺包括 Linux 和 Mac OS X。

boost::python開發環境搭建

本來想用mingw編譯boost::python模組，網上看了下資料太少，只有使用vs2012 操作環境：win7 x64

PyCharm使用Docker映象搭建Python開發環境

在我們平時使用PyCharm的過程中，一般都是連線本地的Python環境進行開發，但是如果是離線的環境呢？這樣就不好搭建Python開發環境，因為第三方模組的依賴複雜，不好通過離線安裝包的方式安裝。本文將介紹如何利用PyC

Python從入門到精通之環境搭建教程圖解

本章內容：一、下載python安裝包下載地址：https://www.python.org/downloads/ 二、選擇適合自己系統的檔案，進行下載

詳解如何在cmd命令視窗中搭建簡單的python開發環境

1、快捷鍵win+r輸入cmd回車調出cmd介面，在命令列輸入python回車，顯示python命令無法識別

使用python實現CGI環境搭建過程解析

本文web伺服器使用的為apache。 1. 安裝apache yum install -y httpd 2. 配置apache 修改apache配置檔案/etc/httpd/conf/httpd.conf將下面一行的註釋去掉，如果沒有則新增:

python安裝和pycharm環境搭建設定方法

一、python 開發工具的選擇 python開發工具有很多，這裡推薦使用 pycharm；因為jetbrains公司擁有眾多的開發工具以及開發擁護者。這些工具有相同的風格和各類使用案例、描述問題的部落格，可供初學者參考。

python框架flask入門之環境搭建及開啟除錯

傳說中的python web開發有2大寶器，一個是倚天劍，一個就是屠龍刀。django作為倚天劍已經被大眾所熟知，今天我們就來看看flask這把屠龍寶刀。

python 終端環境搭建

相關推薦