1. 程式人生 > >人工智慧10 計劃、動作和學習

人工智慧10 計劃、動作和學習

計劃、動作和學習

基於搜尋的規劃方法依賴於幾個很強的假設:

  • agent必須能在圖節點中表示所有相關的環境狀態,它必須有在一對節點間如何動作的精確模型。

  • 動作必須總有其模型化的結果,即在agent的作業系統中不能有錯誤或不確定性。

  • agent感知系統必須精準的指定開始節點,並且沒有任何其他的agent或動態過程會改變環境。

如果這些假設滿足,且搜尋到目標狀態的時間允許,就能進行規劃,並執行一個完整序列的動作,不需要任何環境的資訊反饋。

感知/計劃/動作迴圈

由於以下原因,上面的那些假設通常得不到滿足:

  • 知覺過程不可能總是提供環境狀態的必須資訊,當兩種不同狀態的環境引起相同感測輸入時,我們稱這種情況為感知混淆(perceptual aliasing)

  • 動作並不總有其模型效果(模型可能不夠精準,或者受動器系統在執行動作時偶爾會產生錯誤)

  • 可能在環境中有其他物理過程或其他agent。這些過程可能會改變環境以致於干擾agent動作。

  • 外部作用的存在會引起其他問題:在構造一個計劃期間,環境可能變得與原來的計劃不相干。

  • agent可能在完成一個到達目標狀態的搜尋之前被要求動作。

  • 即使agent有充分的計算時間,但是計算要求的空間資源不允許搜尋進行到目標狀態。

有兩種方法可以用來解決這些困難,同時又保留基於搜尋的計劃的主要特徵:

  • 用概率的方法來形式化知覺、環境和受動器的不確定性。

  • 用各種附加的假設和近似來消除這些困難的影響。

在這裡暫時先不討論正式的、基於概率的方法,而是提出一個叫感知/計劃/動作的結構,在很多應用上避開了上述的一些複雜性。該結構的基本原理是即使動作偶爾產生了沒有預料的結果,或者agent有時不能決定它處於哪一種環境狀態下,但是通過保證agent從它執行環境中得到的連續的反饋,這些困難可以被充分的解決。

確保連續反饋的一個方法是計劃一個動作序列,只執行這個序列中的第一個動作,感知結果環境狀態,重新計算開始節點,然後重複上述過程。這種方式,選擇動作的agent被叫做感知/計劃/動作agent。為了使這個方法有效,計算一個計劃的時間必須比每個動作執行時間要少。

逼近搜尋

1. 孤島驅動搜尋

在孤島驅動(island-driven)搜尋中,來自問題領域的啟發知識被用於在搜尋空間中建立一個“島節點”序列,假定有好的路徑通過這個搜尋空間。例如,在計劃通過有障礙的地形時,這些島就是相應的山。假如n0是開始節點,ng是目標節點,(n1,n2,......,nk)是這些島的一個序列。我們用n0作為開始節點,n1作為目標節點開始一個啟發式搜尋,當搜尋找到了一條到n1的路徑時,再用n1作為目標點開始另一個搜尋,等等,直到我們發現了一條到達ng的路。

2. 層次搜尋

3. 建立反應過程

相關推薦

人工智慧10 計劃動作學習

計劃、動作和學習 基於搜尋的規劃方法依賴於幾個很強的假設: agent必須能在圖節點中表示所有相關的環境狀態,它必須有在一對節點間如何動作的精確模型。 動作必須總有其模型化的結果,即在agent的作業系統中不能有錯誤或不確定性。 agent感知系統必須精準的指定開始節點,並且沒

iOS超全開源框架專案學習資料彙總(1)UI篇

上下拉重新整理控制元件**1. ** --僅需一行程式碼就可以為UITableView或者CollectionView加上下拉重新整理或者上拉重新整理功能。可以自定義上下拉重新整理的文字說明。(推薦)**2. ** --下拉重新整理控制元件4500+star,值得信賴**3. ** --一個效果很酷炫的

生產訂單成本的計劃控制結算

SAP系統成本分析功能關注訂單的成本,通過對計劃成本和實際成本的比較分析,可以發現成本控制上的問題,以便及時解決問題。 1、訂單成本計劃 在基礎資料齊全的基礎上,系統可以自動滾算生產訂單的成本。生產訂單計劃成本是在生產訂單在下達時,根據當時生產訂單的BOM元件結構和工藝路線,計算出訂單的計劃成本,該計劃成本

實用機器人設計(七)-機器人自治決策學習

12.3 決策 12.3.2 反應式決策     12.3.3 混合決策     12.4 機器人學習   12.4.1 人工神經網路   啟用函式 phi      

ROS(12)機器人作業系統相關書籍資料學習路徑

ROS機器人相關書籍與資料(更新日期2017年11月)之前寫過一篇博文總結過相關書籍(流行版本和相關書籍彙總),但是並沒有具體介紹。學習ROS基礎知識以官網和書籍為主,如果需要了解ROS最新成果和進展,以論文和會議資料為主。使用ROS進行機器人設計與開發,那就需要在掌握機器人

決定要在這裡開始記錄我的工作生活學習

註冊CSDN是5年前一個不經意的下午,主要目的是為了在此下載某個東東。 一晃5年過去了,自己仍然IT圈裡打拼。 想找個地方些東西,就這了。 謹以此文,紀念我已逝去的青蔥歲月,以及5年在CSDN潛水的時光~ BY RuoCai-2011-6-16{19:27}

JAVAEE——BOS物流項目03:學習計劃messagermenubutton登陸攔截器信息校驗取派員添加功能

cts 跳轉 pre bmi 添加 管理分區 esp protected 登錄頁面 1 學習計劃 1、jQuery easyUI messager使用方式 n alert方法 n confirm方法 n show方法 2、jQuery easyUI menubutton使用

#JavaWeb移動程式設計師可以在2018年學習10個框架

在今天的文章中,我將分享一些您可以學習的最好的框架,以提高您在移動和Web開發以及大資料技術方面的知識。 在當今世界,對各種框架的瞭解是非常重要的。它們使您可以快速開發原型和實際專案。 如果有想學習java的程式設計師,可來我們的java學習扣qun:79979,2590免費送java的視訊

cocos2d-x學習筆記(10)重複動作RepeatForeverRepeat 以及動作組合SequenceSpawn

Repeat和RepeatForever Sprite* sprite=Sprite::create("sprite.png"); sprite->setPosition(Point(visibleSize.width/2,visibleSize.height/

JSP學習筆記(1)——Jsp指令動作元素內建物件

簡單來說,javaweb技術就是讓伺服器端能夠執行Java程式碼,之後返回資料給客戶端(瀏覽器)讓客戶端顯示資料 jsp頁面中可以巢狀java程式碼(java小指令碼)和巢狀Web前端(html,css,js)來顯示資料。 伺服器解析一個jsp,其實就是把jsp中的java程式碼編譯並執行,之後再返回一個St

轉Android進程間通信(IPC)機制Binder簡要介紹學習計劃

trac named 組成 get tle 能力 計劃 英文 其中 轉自:http://blog.csdn.net/luoshengyang/article/details/6618363/ 在Android系統中,每一個應用程序都是由一些Activity和Ser

深度學習綜述(LeCunBengioHinton)

想法 會有 區分 足夠 乘法 開發 訓練 repr 追蹤 原文摘要:深度學習可以讓那些擁有多個處理層的計算模型來學習具有多層次抽象的數據的表示。這些方法在很多方面都帶來了顯著的改善,包含最先進的語音識別、視覺對象識別、對象檢測和很多其他領域,比如藥物發現和基因組學等。深

JAVA學習(七):方法重載與方法重寫thiskeywordsuperkeyword

格式 hello new 初始 per 而且 方法重寫 學習 方式 方法重載與方法重寫、thiskeyword和superkeyword 1、方法重載 重載可以使具有同樣名稱但不同數目和類型參數的類傳遞給方法。 註: 一是重載方法的參數列表必須與被重載的方法不同

Oracle學習筆記—Db_nameDb_domainGlobal_nameService_nameInstance_nameOracle_SID(轉載)

安全 文件中 分布 好處 避免 名稱 detail 數據庫安全 自動 轉載自: Oracle中DB_NAME,SID,DB_DOMAIN,SERVICE_NAME等之間的區別 Db_name:對一個數據庫(Oracle database)的唯一標識。這種表示對於單個數據

Oracle學習筆記—oracle體系架構及狀態(nomountmountopen)簡介

位置 正常 處理 管理 共享服務器 體系 操作記錄 sysdba png oracle體系架構簡介 先來簡要了解一下Oracle數據庫體系架構以便於後面深入理解,Oracle Server主要由實例(instance)和數據庫(database)組成。實例(instance

ELK學習筆記(一)安裝ElasticsearchKibanaLogstashX-Pack

成功 前端 功能 靈活 日誌分析 傳統 開發人員 收集 還在 最近在學習ELK的時候踩了不少的坑,特此寫個筆記記錄下學習過程。 日誌主要包括系統日誌、應用程序日誌和安全日誌。系統運維和開發人員可以通過日誌了解服務器軟硬件信息、檢查配置過程中的錯誤及錯誤發生的原因。經常分析日

python學習筆記(模塊初識pycPyCodeObject是什麽)

hello 計算 pat 學python 語言 log pre clas 運行 一、模塊初識(一) 模塊,也叫庫。庫有標準庫第三方庫。 註意事項:文件名不能和導入的模塊名相同 1. sys模塊 import sys print(sys.path) #打印環境變量 prin

python學習-09(查找排序淺談數據結構)

使用 指定 矩陣 這樣的 重復 n) init enc nbsp 查找的方法: 排序的方法: 簡單的數據結構: 一、算計基礎 1.1、什麽是算法: 算法(Algorithm)是指解題方案的準確而完整的描述,是一系列解決問題的清晰指令,算法代表著用系統的方法描述解決問題的策略

php學習日記2(關於php中的符號->=>::的意思)

常用 如果 count left 部分 之間 大於等於 ech repl ‘- >’符號是“插入式解引用操作符”(infix dereference operator)。換句話說,它是調用由引用傳遞參數的子程序的方法(當然,還有其它的作用)。正如我們上面所提到的,在調

每天學習點--------第六天(2017-10-10) 摘要: mysqlOracle的區別

field 最大值 create ora sys 返回 sequence 系統 doc 1、自動增長數據類型的處理   Mysql有自動增長的數據類型,插入記錄時不用操作此字段,會自動獲取數據值。Oracle沒有自動增長的數據類型,需要建立一個自動增長的序列號,插入記錄時要