在機器學習和深度學習中建立屬於自己的資料集

阿新 • • 發佈：2020-12-08

import gym //匯入模組
from policynet import PolicyGradient
import matplotlib.pyplot as plt
import time
 
DISPLAY_REWARD_THRESHOLD = 1000
RENDER = False
 
#建立一個環境
env = gym.make('CartPole-v0')  //建立一個小車倒立擺模型
env.seed(1)
env = env.unwrapped
 
print(env.action_space)
print(env.observation_space)
print(env.observation_space.high)
print(env.observation_space.low)
 
RL = PolicyGradient(
    n_actions=env.action_space.n,
    n_features=env.observation_space.shape[0],
    learning_rate=0.02,
    reward_decay=0.99,
 
)
#學習過程
for i_episode in range(85):
    observation = env.reset()
    while True:
        if RENDER: env.render()
        #取樣動作，探索環境
        # action = RL.choose_action(observation)
        # observation_, reward, done, info = env.step(action)
        action = RL.choose_action(observation)
 
        observation_, reward, done, info = env.step(action)
 
        #將觀測，動作和回報儲存起來
        RL.store_transition(observation, action, reward)
        if done:
            ep_rs_sum = sum(RL.ep_rs)
            if 'running_reward' not in globals():
                running_reward = ep_rs_sum
            else:
                running_reward = running_reward * 0.99+ep_rs_sum * 0.01
            if running_reward > DISPLAY_REWARD_THRESHOLD: RENDER = True
            print("episode:", i_episode, "rewards:", int(running_reward))
            #每個episode學習一次
            vt = RL.learn()
            if i_episode == 0:
                plt.plot(vt)
                plt.xlabel('episode steps')
                plt.ylabel('normalized state-action value')
                plt.show()
            break
 
        #智慧體探索一步
        observation = observation_
# #測試過程
for i in range(10):
    observation = env.reset()
    count = 0
    while True:
        # 取樣動作，探索環境
        env.render()
        action = RL.greedy(observation)
        #action = RL.choose_action(observation)
        #action = RL.sample_action(observation)
        # print (action)
        # print(action1)
        observation_, reward, done, info = env.step(action)
        if done:
            print(count)
            break
        observation = observation_
        count+=1
        #time.sleep(0.001)
        print (count)

連線
 222

在機器學習和深度學習中建立屬於自己的資料集

技術標籤：機器學習深度學習python機器學習深度學習 def CreateDataSet(file_path): """ demo :

使用python機器學習和深度學習的5個很棒的計算機視覺專案創意

專案構想(Project Ideas) Computer Vision is a field of artificial intelligence that deals with images and pictures to solve real-life visual problems. The ability of the computer to r

人工智慧、機器學習和深度學習？

人工智慧、機器學習和深度學習？文章目錄人工智慧、機器學習和深度學習？前言一、概念：1、人工智慧2、機器學習3、深度學習

機器學習和深度學習知識路線及知識點總結

資料預處理 1、深度學習中的資料預處理有哪些方式？ 1、資料歸一化。包括高斯歸一化、最大最小值歸一化等。

AI系統——機器學習和深度學習演算法流程

現在搞傳統機器學習相關的研究論文確實佔比不太高，有的人吐槽深度學習就是個系統工程而已，沒有數學含金量。但是無可否認的是深度學習是在太好用啦，極大地簡化了傳統機器學習的整體演算法分析和學習流程，更重要

如何使用Anaconda設定機器學習和深度學習的Python環境

有一些平臺安裝Python機器學習環境可能很麻煩。首先你得安裝Python，然後安裝許多軟體包這很容易把初學者搞懵。在本教程中，你將學會如何用Anaconda設定Python機器學習開發環境。完成本教程後，你將擁有一個Python工

資料探勘、機器學習、深度學習和人工智慧概念

機器學習可以簡單解釋為使用一些演算法從資料中分析出某種規律，然後利用這一規律對未知資料進行預測，所以機器學習不是手動編寫某種程式去完成一個任務，而是使用大量的資料和演算法來“訓練”機器，讓機器通過“

深度學習“四大名著”釋出！Python、TensorFlow、機器學習、深度學習四件套！

Python 程式設計師深度學習的“四大名著”：這四本書著實很不錯！我們都知道現在機器學習、深度學習的資料太多了，面對海量資源，往往陷入到“無從下手”的困惑出境。而且並非所有的書籍都是優質資源，浪費大量的時

Python安裝TensorFlow 2、tf.keras和深度學習模型的定義

原文連結：http://tecdat.cn/?p=15826 深度學習的預測建模是現代開發人員需要了解的一項技能。

Mercari資料集——機器學習&深度學習視角

作者|Yogeeshwari S 編譯|VK 來源|Towards Data Science 我很高興與大家分享我的機器學習和深度學習經驗，同時我們將在一個Kaggle競賽得到解決方案。學習過程的分析也是非常直觀，具有娛樂性和挑戰性。希望這個部落格

深度學習未來發展的三種學習正規化：混合學習，成分學習和簡化學習

深度學習是一個很大的領域，其核心是一個神經網路的演算法，神經網路的尺寸由數百萬甚至數十億個不斷改變的引數決定。似乎每隔幾天就有大量的新方法提出。

Kerloud科研開發無人機介紹（支援ROS和深度學習）

介紹 Kerloud UAV系列作為雲訥科技（深圳）面向無人機系統整合愛好者的高性價比開發平臺，支援PX4、Dronecode、ROS、Nvidia和Ubuntu等高階軟體社群。

李巨集毅機器學習(五) 深度學習介紹與反向傳播

P13 深度學習介紹與梯度下降神經網路簡介神經網路的三個步驟 Step1：神經網路（Neural network）

機器學習與深度學習

典型的機器學習一般思路：預處理、特徵提取、特徵選擇、推理預測或者識別。深度學習能夠儘可能地使用演算法解決預處理、特徵提取、特徵選擇。

TensorFlow和深度學習入門教程

前言上月導師在組會上交我們用tensorflow寫深度學習和卷積神經網路，並把其PPT的參考學習資料給了我們，這是codelabs上的教程：《TensorFlow and deep learning,without a PhD》

基於資訊檢索和深度學習結合的單元測試用例斷言自動生成

摘要：本章節介紹基於IR的方法（包括基礎的資訊檢索技術IRar以及自動適配技術RAadapt）和結合的方法。

50步帶你在windows PC上建立屬於自己的虛擬機器(一)

一、序言：虛擬機器是指通過軟體模擬的具有完整硬體系統功能的、執行在一個完全隔離環境中的完整計算機系統。通過虛擬機器軟體你可以在一臺物理計算機上模擬出二臺或多臺虛擬的計算機，這些虛擬機器完全就

深度學習聽課 | 深度學習的介紹 | 01

目錄深度學習的概念機器學習和深度學習的區別區別1: 特徵提取區別2: 資料量常見的深度學習框架小結

深度學習發展+深度學習數學基礎

理論推導（人工智慧的誕生，1956-1980），但是計算機實現不了，這時的人工智慧，其實可以理解成人類引導的一個階段，計算機還沒有能力進行學習；安徽遴選專家指導學習（人工智慧步入產業化，1980-2000），但是計算機

監督學習、非監督學習、半監督學習和增強學習

監督學習給機器的訓練資料有“標記”或者“答案” 如MNIST資料集中指明每個數字圖案代表的數字

在機器學習和深度學習中建立屬於自己的資料集

相關推薦