博弈論斯坦福game theory stanford week 4.0_

阿新 • • 發佈：2018-03-14

尋找方法得到一個人 enter body 們的 UC 分享圖片

title: 博弈論斯坦福game theory stanford week 4-0
tags: note
notebook: 6- 英文課程-15-game theory
---

博弈論斯坦福game theory stanford week 4-0

perfect information extensive form: taste 完美的信息廣泛的形式：品味

包含時間的博弈形式

一般的博弈的形式中並不包括序列的變量，比如時間變量，或者博弈者的動作序列

所以現在我們可以引入拓展形式來描述上述這些問題

這種形式分為兩種：

完美信息形式
不完美信息形式

完美信息博弈

我們這樣定義通過一個結構：

$技術分享圖片$

N 代表博弈者的集合
A 代表行為的集合
剩下的部份是選擇點和這些點的標簽
- H 代表無終端的選擇點
- x 所有的可能的行為的集合
- $技術分享圖片$ 行為的選擇
Z 終端點，終結點，與無終端點相排斥的點
收益函數， $技術分享圖片$

完美信息博弈的例子

技術分享圖片

這是一個關於分錢的博弈，兩個人分兩塊錢

第一個博弈者有三個選項，2-0，1-1，0-2這三種分錢的方式。

對於這三個選擇，博弈者二都有兩個選擇。

同意和不同意

例子中的純策略

這個例子中有多少的純策略呢？

1 有一個選擇點，但是這個點有三個分支。

2 有三個選擇點，每個選擇點有兩個分支。

但是我們的純策略有八種，這是 $技術分享圖片$ 所以是8.也就是說節點二不是選擇一個決策，而是應對1 的每一個決策選擇一個決策。

技術分享圖片

我們定義：在一個完美信息拓展決策中，一個人的純策略的個數通過上述公式確定。

一個更加復雜的例子是這樣的

技術分享圖片

玩家2 的選擇有多少種呢？

答案是4種：技術分享圖片

玩家一的呢？

同樣是四種，因為即使有的時候他的第二次決策是並沒有實際效果的，但是在決策開始前他也必須做出。技術分享圖片

在我們定義了純策略的定義後，我們就可以輕易的得到下面定義：

混合策略

最優響應

納什均衡

標準的形式和拓展的形式

對於有些的拓展形式是可以轉化成一般形式的，比如例子1.

技術分享圖片

如下圖所示。

我們可以發現，這種形式會產生冗余，比如左上角和右上角

定理：每一個完美信息博弈都有一個納什均衡

那麽這個博弈的純策略納什均衡是多少呢？

技術分享圖片

答案是我圈出的那個，具體的方法可以使用前面學到的方法進行求解。

subgame perfection 子博弈完美性

在這個博弈中

技術分享圖片

有一個納什均衡是（BH）（CE）

我們看到如果 1 有機會進行第二次選擇，對他來說，他一定不會選擇H，而是會選擇G

不過他這樣做是在威脅2，從而讓他選擇F

在這樣的情境下，我們進行這樣的兩個定義

技術分享圖片

在h的根下的子遊戲G

這個問題就表明了，有的時候子博弈的納什均衡有的時候並不是完整博弈的完整性。

下面的那個納什均衡是子博弈完美的呢？

技術分享圖片

（AG）(CF)是子博弈完美的

因為他的子博弈的納什均衡和完整博弈的納什均衡是一致的。

其他的博弈都是不可信的

Backward induction 後向誘導

在這種的情況下，我們怎麽計算子博弈的完美均衡呢？

思路就是，先從最低端開始尋找，然後一點點的向上尋找。

技術分享圖片

對於這個問題，我們可以使用上面的算法來求解。

不過對於零和問題，我們可以將問題進行簡化。我們可以很輕易的衡量每一個節點的得失，因為是零和博弈，你的獲得就是我的失去。

博弈論斯坦福game theory stanford week 4.0_

尋找方法得到一個人 enter body 們的 UC 分享圖片 title: 博弈論斯坦福game theory stanford week 4-0 tags: note notebook: 6- 英文課程-15-game theory --- 博弈論斯坦福ga

博弈論斯坦福game theory stanford week 2.0_

通過由於 note rap nas 斯坦福校驗跳過過去 title: 博弈論斯坦福game theory stanford week 2-0 tags: note notebook: 6- 英文課程-15-game theory --- 博弈論斯坦福game

博弈論斯坦福game theory stanford week 4.1_

http not 什麽原來接下來 notebook 隨機分析信息 title: 博弈論斯坦福game theory stanford week 4-1 tags: note notebook: 6- 英文課程-15-game theory --- 博弈論斯坦福

[8481302]博弈論斯坦福game theory stanford week 1

得到 inf info 使用 AD 引入等等 tag img title: [8481302]博弈論斯坦福game theory stanford week 1 tags: note notebook: 6- 英文課程-15-game theory --- game

初學博弈論又稱對策論 Game Theory

運算 pre 通過 algorithm 一個數輸入情況由於初始化博弈論真的很有趣，回想起前兩天多校一道題的題解所有不公平的遊戲都存在必勝的玩法與人鬥其樂無窮 https://vjudge.net/contest/241983#overview 博

Introduction to Mathematical Thinking - Week 4

讓我 and data- 邏輯偶數 thinking -c eas 打分否定的邏輯應該思考符號背後表示的邏輯，而不是像操作算術運算符一樣操作邏輯符號。比如對於任意的 x，x屬於自然數，那麽 x 是偶數或者奇數；這是對的如果使用“乘法分配律

Coursera - Machine Learning, Stanford: Week 10

minimal machine mini ica dataset pri text -c summary Overview Gradient Descent with Large Datasets Learning With Large Datasets

Machine Learning - week 4 - 習題

返回 cnblogs -c 乘法 image alt learning png round 1. 第一個。，是對的。第二個。結果只會認出是一類，如圖：。所以和為 1。第三個：所有基於 0，1 的邏輯方程都可以使用神經網絡來表示。真值表是有限的，所以可以。

斯坦福凸優化課程Video2.4

bubuko 2.4 所有 gpo 條件平面 alt 集合分開 title: 斯坦福凸優化課程Video2-4 tags: note notebook: 6- 英文課程-14-convex optimization --- 斯坦福凸優化課程Video2-4 超平面分離

Coursera 算法二 week 4 Boggle

單詞查找當前 get AD 深度優先 return port hashset 數組這次的作業主要用到了單詞查找樹和深度優先搜索。 1.在深度優先搜索中，在當前層的遞歸調用前，將marked數組標記為true。當遞歸調用返回到當前層時，應將marked數組標記為false

retrival and clustering : week 4 GMM & EM 筆記

精確因此 mage 多次 col 局限性一個點隨機很多華盛頓大學機器學習筆記。 k-means的局限性　　k-means 是一種硬分類（hard assignment）方法，例如對於文檔分類問題，k-means會精確地指定某一文檔歸類到某一個主題，但很多

UPenn - Robotics 1:Aerial Robotics - week 4:Advanced Topics

watch use amp material height oop open hud sig q estimate position within several mm, and updates at 200Hz Vicon Motion Capture s

LeetCode:64. Minimum Path Sum(Week 4)

64. Minimum Path Sum 題目 Given a m x n grid filled with non-negative numbers, find a path from top left to bottom right which min

LeetCode:50. Pow(x, n)(Week 4)

50. Pow(x, n) 題目 Implement pow(x, n), which calculates x raised to the power n (xn). Example 1:Input: 2.00000, 10 Output: 1024.00

UPenn - Robotics 2:Computational Motion Planning - week 4: Artificial Potential Field Methods

The basic idea here is to try to construct a smooth function over the extent of the configuration space, which has high values&nbs

tenth week(4)

Event Flow 1、可以理解為當事件發生時，響應事件的順序。這個順序就按照一個流進行的。這就是事件流。 2、事件發生時會在元素節點與根節點之間按照特定的順序傳播，路徑所經過的所有節點都會收到該事件，這個傳播過程即DOM事件流。 3、事件傳播的順序對應瀏覽器的兩種事件流模

deeplearning.ai課程作業：Course 1 Week 4

deeplearning.ai課程作業：Course 1 Week 4 含答案，不喜勿看！謝謝 Part1： Building your Deep Neural Network: Step by Step Welcome to your week 4 assignment (pa

LeetCode Week 4

94. Binary Tree Inorder Traversal Given a binary tree, return the inorder traversal of its nodes’ values. Example: Follow up: Recursive sol

[Week 4] LeetCode 743. Network Delay Time

LeetCode 743. Network Delay Time 問題描述： There are N network nodes, labelled 1 to N. Given times, a lis

斯坦福CS193P 2017-2018 第4節課筆記

以下內容為swift4.0中的特性 Struct 值型別（記憶體分配在棧上，賦值或者函式的引數傳遞時通過拷貝來實現） Copy-on-write：通過寫時複製的方式提升記憶體的使用效率。在值需要改變的時候才執行拷貝操作。 Mutating: 使用mutating來標

博弈論 斯坦福game theory stanford week 4.0_

博弈論 斯坦福game theory stanford week 4-0

perfect information extensive form: taste 完美的信息廣泛的形式：品味

包含時間的博弈形式

完美信息博弈

完美信息博弈的例子

例子中的純策略

標準的形式和拓展的形式

subgame perfection 子博弈完美性

Backward induction 後向誘導

相關推薦

博弈論斯坦福game theory stanford week 4.0_

博弈論斯坦福game theory stanford week 4-0