bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

阿新 • • 發佈：2017-11-07

多少 || 註意 log mem 1.5 tchar fine bbs

1076: [SCOI2008]獎勵關

Time Limit: 10 Sec Memory Limit: 128 MB
Submit: 2989 Solved: 1557
[Submit][Status][Discuss]

Description

　　你正在玩你最喜歡的電子遊戲，並且剛剛進入一個獎勵關。在這個獎勵關裏，系統將依次隨機拋出k次寶物，
每次你都可以選擇吃或者不吃（必須在拋出下一個寶物之前做出選擇，且現在決定不吃的寶物以後也不能再吃）。
寶物一共有n種，系統每次拋出這n種寶物的概率都相同且相互獨立。也就是說，即使前k-1次系統都拋出寶物1（
這種情況是有可能出現的，盡管概率非常小），第k次拋出各個寶物的概率依然均為1/n。獲取第i種寶物將得到Pi

分，但並不是每種寶物都是可以隨意獲取的。第i種寶物有一個前提寶物集合Si。只有當Si中所有寶物都至少吃過
一次，才能吃第i種寶物（如果系統拋出了一個目前不能吃的寶物，相當於白白的損失了一次機會）。註意，Pi可
以是負數，但如果它是很多高分寶物的前提，損失短期利益而吃掉這個負分寶物將獲得更大的長期利益。假設你
采取最優策略，平均情況你一共能在獎勵關得到多少分值？

Input

　　第一行為兩個正整數k和n，即寶物的數量和種類。以下n行分別描述一種寶物，其中第一個整數代表分值，隨
後的整數依次代表該寶物的各個前提寶物（各寶物編號為1到n），以0結尾。

Output

　　輸出一個實數，保留六位小數，即在最優策略下平均情況的得分。

Sample Input

1 2
1 0
2 0

Sample Output

1.500000

HINT

【數據規模】

1<=k<=100,1<=n<=15，分值為[-10^6,10^6]內的整數。

/*
看到n很小可以狀壓
首先第一眼可以想到f[i][sta]表示到第i輪，物品選擇狀態為sta的最大期望值。
但是這樣有個問題,可能到第i輪無法達到sta這個狀態，但是也被當做了合法往後進行轉移。
所以考慮倒退，這樣狀態就更改為f[i][sta]表示1~i-1輪能夠到達sta這個狀態,i到k輪的最大期望值。
這樣就可以倒退，枚舉下一個物品選不選進行轉移了。 
註意一點 
這裏求的是期望值，上面求的東西覆蓋了第i輪取了所有n種寶物的情況
所以在每一個狀態計算完之後，把f[i][sta]除以n即為期望平均值。
 
*/
#include<iostream>
#include<cstdio>
#include<cstring>

#define N 107

using namespace std;
int n,k,cnt,need[N];
double val[16],f[N][1<<16];

inline int read()
{
    int x=0,f=1;char c=getchar();
    while(c>‘9‘||c<‘0‘){if(c==‘-‘)f=-1;c=getchar();}
    while(c>=‘0‘&&c<=‘9‘){x=x*10+c-‘0‘;c=getchar();}
    return x*f;
}

int main()
{
    int x;
    k=read();n=read(); 
    for(int i=1;i<=n;i++)
    {
        scanf("%lf",&val[i]);x=read();
        while(x) need[i]|=(1<<x-1),x=read();
    }
    for(int i=k;i;i--)
      for(int sta=0;sta<=(1<<n)-1;sta++)
      {
            for (int j=1; j<=n; j++)
                if ((sta&need[j])==need[j])
                    f[i][sta]+=max(f[i+1][sta],f[i+1][sta|(1<<(j-1))]+val[j]);
                else
                    f[i][sta]+=f[i+1][sta];
            f[i][sta]/=(double)n;
      }
    printf("%.6lf\n",f[1][0]);
    return 0;
}

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

多少 || 註意 log mem 1.5 tchar fine bbs 1076: [SCOI2008]獎勵關 Time Limit: 10 Sec Memory Limit: 128 MBSubmit: 2989 Solved: 1557[Submit][Sta

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

1076: [SCOI2008]獎勵關

Description

Input

Output

Sample Input

Sample Output

HINT

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

2018.09.23 bzoj1076: [SCOI2008]獎勵關（期望+狀壓dp）

[BZOJ1076][SCOI2008]獎勵關[狀壓DP+概率期望]

BZOJ1076 [SCOI2008]獎勵關【狀壓dp + 數學期望】

bzoj1076 [SCOI2008]獎勵關狀壓+期望dp

【題解】 bzoj1076: [SCOI2008]獎勵關（裝壓+期望dp）

bzoj1076: [SCOI2008]獎勵關狀壓dp

bzoj 1076: [SCOI2008]獎勵關(期望DP，狀壓。)

[BZOJ1076][SCOI2008]獎勵關(概率DP)

BZOJ 1076([SCOI2008]獎勵關-期望dp-從後向前)

bzoj 1076: [SCOI2008]獎勵關期望dp+狀態壓縮

【BZOJ 1076】 [SCOI2008]獎勵關期望dp

BZOJ1076: [SCOI2008]獎勵關

bzoj1076 [SCOI2008]獎勵關

洛谷P2473||bzoj1076 [SCOI2008]獎勵關

BZOJ1076[SCOI2008] 獎勵關

BZOJ3836 [Poi2014]Tourism 【樹形dp +狀壓dp】

bzoj1808 [Ioi2007]training 訓練路徑樹形dp+狀壓dp

CodeForces1073E 數位dp+狀壓dp

BZOJ1076 || 洛谷P2473 [SCOI2008]獎勵關【狀壓&&期望DP】

bzoj1076: [SCOI2008]獎勵關(期望dp+狀壓dp)

1076: [SCOI2008]獎勵關

Description

Input

Output

Sample Input

Sample Output

HINT

相關推薦