1. 程式人生 > >1076. [SCOI2008]獎勵關【狀壓DP+期望】

1076. [SCOI2008]獎勵關【狀壓DP+期望】

下一個 blog pos out 至少 處理 hellip 每次 選擇

Description

  你正在玩你最喜歡的電子遊戲,並且剛剛進入一個獎勵關。在這個獎勵關裏,系統將依次隨機拋出k次寶物,
每次你都可以選擇吃或者不吃(必須在拋出下一個寶物之前做出選擇,且現在決定不吃的寶物以後也不能再吃)。
寶物一共有n種,系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說,即使前k-1次系統都拋出寶物1(
這種情況是有可能出現的,盡管概率非常小),第k次拋出各個寶物的概率依然均為1/n。 獲取第i種寶物將得到Pi
分,但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過
一次,才能吃第i種寶物(如果系統拋出了一個目前不能吃的寶物,相當於白白的損失了一次機會)。註意,Pi可

以是負數,但如果它是很多高分寶物的前提,損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。 假設你
采取最優策略,平均情況你一共能在獎勵關得到多少分值?

Input

  第一行為兩個正整數k和n,即寶物的數量和種類。以下n行分別描述一種寶物,其中第一個整數代表分值,隨
後的整數依次代表該寶物的各個前提寶物(各寶物編號為1到n),以0結尾。

Output

  輸出一個實數,保留六位小數,即在最優策略下平均情況的得分。

Sample Input

1 2
1 0
2 0

Sample Output

1.500000

HINT

【數據規模】


1<=k<=100,1<=n<=15,分值為[-10^6,10^6]內的整數。

f[i][j]表示當前該拿第i個了,拿之前狀態為j
第一道概率DPemmm……俗話說順推概率,逆推期望。
總結裏有相關說明
這個題我們預處理一下前提集合,
然後轉移的時候判斷當前狀態是否包含前提集合再進行轉移即可。

#include<iostream>
#include<cstring>
#include<cstdio>
int N,K,v[20],pre[20],x;
double f[105][40001];
using namespace std;
int main()
{
	scanf("%d%d",&N,&K);
	double p=1.0/K;
	for (int i=1;i<=K;++i)
	{
		scanf("%d%d",&v[i],&x);
		while (x)
			pre[i]|=(1<<x-1),scanf("%d",&x);//pre記錄前提寶物 
	}
	for (int i=N;i>=1;--i)
		for (int j=0;j<=(1<<K)-1;++j)
			for (int k=1;k<=K;++k)
				if ((pre[k]&j)==pre[k])
					f[i][j]+=p*max(f[i+1][j],f[i+1][j|(1<<k-1)]+v[k]);
				else
					f[i][j]+=p*f[i+1][j];
	printf("%0.6lf",f[1][0]);
}

1076. [SCOI2008]獎勵關【狀壓DP+期望】