【bzoj2318】game with probability

阿新 • • 發佈：2020-07-27

題目

Description

Alice和Bob在玩一個遊戲。有n個石子在這裡，Alice和Bob輪流投擲硬幣，如果正面朝上，則從n個石子中取出一個石子，否則不做任何事。取到最後一顆石子的人勝利。Alice在投擲硬幣時有p的概率投擲出他想投的一面，同樣，Bob有q的概率投擲出他相投的一面。

現在Alice先手投擲硬幣，假設他們都想贏得遊戲，問你Alice勝利的概率為多少。

Input

第一行一個正整數t，表示資料組數。

對於每組資料，一行三個數n，p，q。

Output

對於每組資料輸出一行一個實數，表示Alice勝利的概率，保留6位小數。

題解

玄學概率dp

雖然網上已有不少題解，但有很多關鍵的地方沒講到，本題解加入了很多我自己的對一些問題的一些解答，更完整，詳細，嚴謹，覺得沒有完全懂，還有疑惑的可以來參考一下

設計狀態

$dp[i][0/1]$表示當前狀態為【在投硬幣前還剩i個石頭，且現在是Alice/Bob投硬幣】投完硬幣之後的勝率

初始狀態為$dp[0][1]=1$,即當前沒有石頭，且是bob投硬幣（即Alice是最後一個取石子的人，即贏家），此時勝率為1（已經贏了）

然後我們就從這裡一直倒推到$dp[n][0]$,即答案

轉移方程

題目有這樣一句話

Alice在投擲硬幣時有p的概率投擲出他想投的一面，同樣，Bob有q的概率投擲出他相投的一面

所以我們要分類討論當前玩家會希望取走石頭，還是維持原樣（至於最後選哪個，我們待會再講）

另請注意，玩家並不知道自己的p和q，所以不會出現Alice為了有更大的概率得到想要的結果而故意想相反的結果之類的問題

1.當前局面下，取走更好

$dp[i][0]=p*dp[i-1][1]+(1-p)*dp[i][1] $

$dp[i][1]=q*dp[i-1][0]+(1-q)*dp[i][0]$

以$dp[i][0]$的計算為例，前半部分是第一步Alice拿了，然後局面就變成了有$i-1$個石頭並且是後手，所以乘的是$dp[i-1][1]$

後半部分就是第一步Alice沒有拿，那就變成了有$i$個石頭並且是後手，所以是乘上$dp[i][1]$

但是這個轉移方程有交叉引用，但不用擔心，可以按如下方法處理（以dp[i][0]為例）

帶入$dp[i][1]$

$dp[i][0]=p*dp[i-1][1]+(1-p)*(q*dp[i-1][0]+(1-q)*dp[i][0]) $

拆括號，並將$(1-q)*dp[i][0]$移到左邊

$dp[i][0]-(1-p)*(1-q)*dp[i][0]=p*dp[i-1][1]+(1-p)*q*dp[i-1][0]$

將係數除過去

$dp[i][0]=(p*dp[i-1][1]+(1-p)*q*dp[i-1][0])/(1-(1-p)*(1-q))$

dp[i][1]同理

$dp[i][1]=(dp[i-1][0]*q+dp[i-1][1]*(1-q)*p)/(1-(1-p)*(1-q))$

2.當前局面下，不取更好

$dp[i][0]=(dp[i-1][1]*(1-p)+dp[i-1][0]*p)*(1-q))/(1-p*q)$

$dp[i][1]=(dp[i-1][0]*(1-q)+dp[i-1][1]*q)*(1-p))/(1-p*q)$

3.如何選擇

在當前剩下i個石頭的情況下，要到i-1顆石頭的狀態，無非就是Alice取了，或是Bob取了

若Alice取了，那麼接下來的勝率就是$dp[i-1][1]$,否則就是$dp[i-1][0]$

也就是說，我們只要比較這兩個勝率的大小，就可以決定Alice希望選哪個（這裡指的是希望選哪個）

那bob呢？

注意到若Bob取了，那麼接下來的勝率就是$dp[i-1][0]$,否則就是$dp[i-1][1]$

若alice 決定取，則$dp[i-1][1]>dp[i-1][0]$,那麼Bob肯定不取

也就是說，Alice和Bob的決策是相反的，那麼我們只要關注Alice選哪個即可

觀察1和2的公式，變化就是p和(1-p);q和(1-q)的位置互換了

我們可以用下面的程式碼來完成這個過程

double p1=p,q1=q;
if(dp[now][1]<dp[now][0]) p1=1-p,q1=1-q;

另外，通過打表可以發現，n到1000之後dp值基本沒有變過，即，我們只要算到1000就可以停了。

程式碼

我是用滾動陣列來實現的（雖然沒有必要）

程式碼很短

#include<iostream>
#include<cstdio>
using namespace std;
double dp[2][2];
int main()
{
	int t;
	cin>>t;
	while(t--)
	{
		int n,now=0;
		double p,q;
		cin>>n>>p>>q;
		dp[0][1]=1,dp[0][0]=0;
		n=min(n,1000);
		for(int i=1;i<=n;i++,now^=1)
		{
			double p1=p,q1=q;
			if(dp[now][1]<dp[now][0]) p1=1-p,q1=1-q;
			dp[now^1][0]=(dp[now][1]*p1+dp[now][0]*(1-p1)*q1)/(1-(1-p1)*(1-q1));
			dp[now^1][1]=(dp[now][0]*q1+dp[now][1]*(1-q1)*p1)/(1-(1-p1)*(1-q1));
			//cout<<dp[now][0]<<" "<<dp[now][1]<<endl;
		}
		printf("%.6f\n",dp[now][0]);
	}
}

【bzoj2318】game with probability

題目 Description Alice和Bob在玩一個遊戲。有n個石子在這裡，Alice和Bob輪流投擲硬幣，如果正面朝上，則從n個石子中取出一個石子，否則不做任何事。取到最後一顆石子的人勝利。Alice在投擲硬幣時有p的概率投擲出他想

【轉載】【GDB】GDB with Python

作者：薛定諤的喵連結：https://zhuanlan.zhihu.com/p/152274203來源：知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。

UOJ#26. 【IOI2014】Game 互動

演算法一：貪心，如果刪除點 $(x,y)$ 整個圖仍然聯通則刪掉 $(x,y)$，否則保留.

【CF1267G】Game Relics（貪心，期望）

題意：有 \$n\$ 種物品，你要全部獲得它們。有兩種購買方式：花費 \$c_i\$ 購買第 \$i\$ 種物品。

【題解】CF1539E Game with Cards

CF1539E Game with Cards 看到題首先想到的是dp,記\$f_{0/1,i}\$表示第i個位置選左/右手是否可行，這樣可以輕鬆轉移了，從後往前推，如果滿足以下條件則\$f_{0,i}\$=1（記轉移的位置為j）：

【題解】「CF1373B」01 Game

這題好水，就是簡單的模擬+字串。 \$\\sf Translation\$ 給定一個 \$01\$ 串，如果 \$0\$ 出現的次數和 \$1\$ 出現的次數的最小值是奇數，輸出 DA ，否則輸出 NET

Game【博弈論】-2020杭電多校7

題意在二維平面上給出 \$n\$ 個點的座標，初始時刻，有一顆石頭在第一個點，兩個人輪流移動石頭，要求當前移動的距離要比上一次的移動距離大，並且一個點只能用一次。不能移動的人輸。問先手勝還是後手勝。

轉：【MySQL】連線錯誤過多：is blocked because of many connection errors; unblock with 'mysqladmin flush-host

轉：https://blog.csdn.net/ningjiebing/article/details/102408136 錯誤原因同一個ip在短時間內產生太多（超過mysql資料庫max_connection_errors的最大值）中斷的資料庫連線而導致的阻塞；

【leetcode】1513. Number of Substrings With Only 1s

題目如下： Given a binary strings(a string consisting only of \'0\' and \'1\'s). Return the number of substrings with all characters 1\'s.

【leetcode】1524. Number of Sub-arrays With Odd Sum

題目如下： Given an array of integersarr. Returnthe number of sub-arrayswithoddsum. As the answer may grow large, the answermust becomputed modulo10^9 + 7.

【oracle】-函式：遞迴函式（start with）...

0、前言我們可能會碰到這種需求：一個表的欄位為id，pid（父id）；我們需要通過id找到他的所有父節點。

"Host 'XXXXX' is blocked because of many connection errors; unblock with 'mysqladmin flush-hosts'"【mysql8】

報錯 2020-09-24 17:10:38,630 [C3P0PooledConnectionPoolManager [identityToken->1hge0yrac1h3dzkqrkiu17|44c03695]-HelperThread-#1]

【原創】【論文閱讀】2020 Learning From Noisy Large-Scale Datasets With Minimal Supervision

論文地址：https://vision.cornell.edu/se3/wp-content/uploads/2017/04/DeepLabelCleaning_CVPR.pdf 利用大規模有噪資料訓練模型的常用方法是在有噪資料上做預訓練，在精標資料上做精調。本文提出一種利用

【2019】A Game-Theoretic Approach to Computation Offloading in Satellite Edge Computing

A Game-Theoretic Approach to Computation Offloading in Satellite Edge Computing 文獻型別文獻年份

【Lintcode】1418. Path With Maximum Minimum Value

技術標籤：# DFS、BFS與圖論演算法javaleetcode資料結構題目地址： https://www.lintcode.com/problem/path-with-maximum-minimum-value/description

【LeetCode】292. Nim Game Nim 遊戲（Easy）（JAVA）

技術標籤：Leetcode遊戲leetcodejava演算法資料結構【LeetCode】292. Nim Game Nim 遊戲（Easy）（JAVA）

【LeetCode】292 Nim Game

技術標籤：leetcode演算法原題地址：292. Nim Game。解法分析：當n屬於[1-3]時，先手勝。當n=4時，先手負。當n屬於[5-7]時，情況可以轉換為n屬於[1-3]的情況，先手勝。當n=8時，情況可以轉換為n=4的情況，先

【Leetcode】1690. Stone Game VII

技術標籤：# 貪心、動態規劃與記憶化搜尋leetcode動態規劃演算法題目地址： https://leetcode.com/problems/stone-game-vii/

【LeetCode】309. Best Time to Buy and Sell Stock with Cooldown 最佳買賣股票時機含冷凍期（Medium）（JAVA）

技術標籤：Leetcodeleetcode演算法java面試資料結構【LeetCode】309. Best Time to Buy and Sell Stock with Cooldown 最佳買賣股票時機含冷凍期（Medium）（JAVA）

【LeetCode】714. Best Time to Buy and Sell Stock with Transaction Fee 買賣股票的最佳時機含手續費（Medium）（JAVA）每日一題

技術標籤：LeetCode 每日一題leetcodejava面試動態規劃演算法【LeetCode】714. Best Time to Buy and Sell Stock with Transaction Fee 買賣股票的最佳時機含手續費（Medium）（JAVA）

【bzoj2318】game with probability

題目

Description

Input

Output

題解

設計狀態

轉移方程

1.當前局面下，取走更好

2.當前局面下，不取更好

3.如何選擇

程式碼

相關推薦