博弈論斯坦福game theory stanford week 4.1_

阿新 • • 發佈：2018-03-14

http not 什麽原來接下來 notebook 隨機分析信息

title: 博弈論斯坦福game theory stanford week 4-1
tags: note
notebook: 6- 英文課程-15-game theory
---

博弈論斯坦福game theory stanford week 4-1

最後通牒式議價

他的形式是這樣的，一個博弈者向另外一個博弈者提供一個價格，另一個決策者選擇是否接受，如果不接受那麽兩個人將會什麽都得不到。

如果接受，那麽1得到10-x，2得到x

技術分享圖片

在上述條件下，我們可以推論玩家2可能會接受所有的可能的x，如果玩家1讓x=0，他都有可能會接受。在這樣的條件下，玩家1會不會接受0主要取決於玩家2會不會接受0.

但是在實際的博弈中並非是這樣的，更多的人願意選擇和接受5

子遊戲的完美性也許有時候並不適應整個的現實，但是他會幫助我們深入的理解博弈的本質。

有些的情況是十分難以解決的：比如下棋。並且我們很難相信人類是完全通過邏輯來解決下期問題的。這需要經驗和靈感。

不完全信息博弈

我們考慮撲克遊戲，在玩撲克遊戲的時候，人們相互之間進行博弈，但是他們每個人都不能掌握完整的信息。

在撲克中：

我們有很多不同的手牌

有很多不同的策略

並且我們很難通過畫出樹狀圖的形式來描述這個遊戲，我們對於這種遊戲可以學習很多。

不完整信息形式--定義和策略

我們之前分析的情況是每個人都知道其他人的選擇，我們使用樹形結構來對這些情況進行描寫。但是在我們之前討論的棋牌遊戲中，我們無法知道別人可以進行的選擇。所以我們定義不完整信息博弈的情況如下。

技術分享圖片

可以看到，定義和之前的很像。

我們舉個例子：

技術分享圖片

在這樣的博弈中，我們看到博弈者1有兩個選擇節點。由於他的信息並不能提前得到，因此他在第二次選擇的時候只能選擇一種情況。l 和 r。

因此博弈者一只有四種選擇的可能分別是:

Ll,Lr,Rl,Rr

同樣的我們可以用這種形式描述任何的一般形式的博弈。

比如我們之前用過的TCP問題。

不完整信息問題的純策略

和之前的方法相同，我們可以為所有的博弈找到他們的純策略。

混合策略和純策略都可以用原來的定義進行描述，

在這樣的情況下，我們可以定義將一個深度很高的樹，轉化為一個很寬的樹，同樣的我們可以將一個很寬的樹轉化成一個深度很高的樹。

混合的和行為性的策略

我們在解決不完整信息博弈問題中有兩種主要的策略，一種是混合策略，一種是行為策略。

混合策略是隨機使用所有的純策略

行為策略，還是用這個博弈作為例子，我們來看下行為策略是什麽樣的。

行為策略這樣描述，選擇A的概率是0.5，選擇G的概率是0.3。

混合策略是這樣的：0.6選擇（AG），0.4選擇GH。

看起來這兩種策略的形式十分的相似，可以進行相互的轉化，

回顧

技術分享圖片

在這樣的一個博弈中，我們有以下幾點可以得到：

博弈者2的D是一個占優策略
LR這個博弈是一個十分的有優勢的博弈，但是在混合策略中不能得到。

那麽在行為策略中的均衡在哪裏呢？

同樣的，我們可以知道，D是占優的。如果我們使用行為策略，我們可以使用列方程的形式進行衡量。

技術分享圖片

可以接觸

非完整信息博弈的解決

在不完整信息博弈中可能沒有合適的子問題，不過我們可以進行推理。

技術分享圖片

在這樣的問題中，我們帶入如下的情景：

有一家公司想要進入某一領域和另外一家公司競爭。
第一個N節點代表他是否強於另外一家公司。
第一家公司會選擇是否進入這個領域，接下來原來這個領域的公司會選擇是否會與之競爭。

我們分析，無論公司是強是弱，他選擇進入領域，如果他的對手與之爭鬥他都會遭到損失，在這樣的情況下，他不會選擇進入這個領域，所以在這個情景內。公司不會進入這個領域。

因此均衡出現在：

技術分享圖片

這個條件下。

但是如果我們這樣考慮，考慮公司2的選擇，他選擇與之競爭一定會造成損失。那麽他如果選擇接受呢？

如果新的公司是強大的，那麽他會選擇進入，因為這有更大的收益，如果不強大，那麽他會選擇不進入。

這是另外一個納什均衡。

序列均衡和完美貝葉斯均衡

人們在很多情況是根據他們的估計和信念進行選擇的。就像前面的博弈，有兩個納什均衡，但是具體會走向那個納什均衡，要看他麽之間的估計和信念。

博弈論斯坦福game theory stanford week 4.1_

http not 什麽原來接下來 notebook 隨機分析信息 title: 博弈論斯坦福game theory stanford week 4-1 tags: note notebook: 6- 英文課程-15-game theory --- 博弈論斯坦福

博弈論斯坦福game theory stanford week 4.0_

尋找方法得到一個人 enter body 們的 UC 分享圖片 title: 博弈論斯坦福game theory stanford week 4-0 tags: note notebook: 6- 英文課程-15-game theory --- 博弈論斯坦福ga

[8481302]博弈論斯坦福game theory stanford week 1

得到 inf info 使用 AD 引入等等 tag img title: [8481302]博弈論斯坦福game theory stanford week 1 tags: note notebook: 6- 英文課程-15-game theory --- game

博弈論斯坦福game theory stanford week 2.0_

通過由於 note rap nas 斯坦福校驗跳過過去 title: 博弈論斯坦福game theory stanford week 2-0 tags: note notebook: 6- 英文課程-15-game theory --- 博弈論斯坦福game

初學博弈論又稱對策論 Game Theory

運算 pre 通過 algorithm 一個數輸入情況由於初始化博弈論真的很有趣，回想起前兩天多校一道題的題解所有不公平的遊戲都存在必勝的玩法與人鬥其樂無窮 https://vjudge.net/contest/241983#overview 博

Introduction to Mathematical Thinking - Week 4

讓我 and data- 邏輯偶數 thinking -c eas 打分否定的邏輯應該思考符號背後表示的邏輯，而不是像操作算術運算符一樣操作邏輯符號。比如對於任意的 x，x屬於自然數，那麽 x 是偶數或者奇數；這是對的如果使用“乘法分配律

Coursera - Machine Learning, Stanford: Week 10

minimal machine mini ica dataset pri text -c summary Overview Gradient Descent with Large Datasets Learning With Large Datasets

Machine Learning - week 4 - 習題

返回 cnblogs -c 乘法 image alt learning png round 1. 第一個。，是對的。第二個。結果只會認出是一類，如圖：。所以和為 1。第三個：所有基於 0，1 的邏輯方程都可以使用神經網絡來表示。真值表是有限的，所以可以。

斯坦福凸優化課程Video2.4

bubuko 2.4 所有 gpo 條件平面 alt 集合分開 title: 斯坦福凸優化課程Video2-4 tags: note notebook: 6- 英文課程-14-convex optimization --- 斯坦福凸優化課程Video2-4 超平面分離

Coursera 算法二 week 4 Boggle

單詞查找當前 get AD 深度優先 return port hashset 數組這次的作業主要用到了單詞查找樹和深度優先搜索。 1.在深度優先搜索中，在當前層的遞歸調用前，將marked數組標記為true。當遞歸調用返回到當前層時，應將marked數組標記為false

retrival and clustering : week 4 GMM & EM 筆記

精確因此 mage 多次 col 局限性一個點隨機很多華盛頓大學機器學習筆記。 k-means的局限性　　k-means 是一種硬分類（hard assignment）方法，例如對於文檔分類問題，k-means會精確地指定某一文檔歸類到某一個主題，但很多

UPenn - Robotics 1:Aerial Robotics - week 4:Advanced Topics

watch use amp material height oop open hud sig q estimate position within several mm, and updates at 200Hz Vicon Motion Capture s

LeetCode:64. Minimum Path Sum(Week 4)

64. Minimum Path Sum 題目 Given a m x n grid filled with non-negative numbers, find a path from top left to bottom right which min

LeetCode:50. Pow(x, n)(Week 4)

50. Pow(x, n) 題目 Implement pow(x, n), which calculates x raised to the power n (xn). Example 1:Input: 2.00000, 10 Output: 1024.00

UPenn - Robotics 2:Computational Motion Planning - week 4: Artificial Potential Field Methods

The basic idea here is to try to construct a smooth function over the extent of the configuration space, which has high values&nbs

tenth week(4)

Event Flow 1、可以理解為當事件發生時，響應事件的順序。這個順序就按照一個流進行的。這就是事件流。 2、事件發生時會在元素節點與根節點之間按照特定的順序傳播，路徑所經過的所有節點都會收到該事件，這個傳播過程即DOM事件流。 3、事件傳播的順序對應瀏覽器的兩種事件流模

4-1_微信開放平臺介紹

https://open.weixin.qq.com/ 認證需要錢介紹微信開放平臺帳號的開發者資質認證提供更安全、更嚴格的真實性認證、也能夠更好的保護企業及使用者的合法權益開發者資質認證通過後，微信開放平臺帳號下的應用，將獲得微信登入、智慧

deeplearning.ai課程作業：Course 1 Week 4

deeplearning.ai課程作業：Course 1 Week 4 含答案，不喜勿看！謝謝 Part1： Building your Deep Neural Network: Step by Step Welcome to your week 4 assignment (pa

LeetCode Week 4

94. Binary Tree Inorder Traversal Given a binary tree, return the inorder traversal of its nodes’ values. Example: Follow up: Recursive sol

[Week 4] LeetCode 743. Network Delay Time

LeetCode 743. Network Delay Time 問題描述： There are N network nodes, labelled 1 to N. Given times, a lis

博弈論 斯坦福game theory stanford week 4.1_

博弈論 斯坦福game theory stanford week 4-1

最後通牒式議價

不完全信息博弈

不完整信息形式--定義和策略

不完整信息問題的純策略

混合的和行為性的策略

回顧

非完整信息博弈的解決

序列均衡和完美貝葉斯均衡

相關推薦

博弈論斯坦福game theory stanford week 4.1_

博弈論斯坦福game theory stanford week 4-1