1. 程式人生 > >第十八題:石子游戲

第十八題:石子游戲

問題描述

亞歷克斯和李用幾堆石子在做遊戲。偶數堆石子排成一行,每堆都有正整數顆石子 piles[i] 。

遊戲以誰手中的石子最多來決出勝負。石子的總數是奇數,所以沒有平局。

亞歷克斯和李輪流進行,亞歷克斯先開始。 每回合,玩家從行的開始或結束處取走整堆石頭。 這種情況一直持續到沒有更多的石子堆為止,此時手中石子最多的玩家獲勝。

假設亞歷克斯和李都發揮出最佳水平,當亞歷克斯贏得比賽時返回 true ,當李贏得比賽時返回 false 。

示例:

輸入:[5,3,4,5]
輸出:true
解釋:
亞歷克斯先開始,只能拿前 5 顆或後 5 顆石子 。
假設他取了前 5 顆,這一行就變成了 [3,4,5] 。
如果李拿走前 3 顆,那麼剩下的是 [4,5],亞歷克斯拿走後 5 顆贏得 10 分。
如果李拿走後 5 顆,那麼剩下的是 [3,4],亞歷克斯拿走後 4 顆贏得 9 分。
這表明,取前 5 顆石子對亞歷克斯來說是一個勝利的舉動,所以我們返回 true 。

提示:

2 <= piles.length <= 500
piles.length 是偶數。
1 <= piles[i] <= 500
sum(piles) 是奇數。

解決方式

動態規劃
思路

讓我們改變遊戲規則,使得每當李得分時,都會從亞歷克斯的分數中扣除。

令 dp(i, j) 為亞歷克斯可以獲得的最大分數,其中剩下的堆中的石子數是 piles[i], piles[i+1], …, piles[j]。這在比分遊戲中很自然:我們想知道遊戲中每個位置的值。

我們可以根據 dp(i + 1,j) 和 dp(i,j-1) 來制定 dp(i,j) 的遞迴,我們可以使用動態程式設計以不重複這個遞迴中的工作。(該方法可以輸出正確的答案,因為狀態形成一個DAG(有向無環圖)。)

演算法

當剩下的堆的石子數是 piles[i], piles[i+1], …, piles[j] 時,輪到的玩家最多有 2 種行為。

可以通過比較 j-i和 N modulo 2 來找出輪到的人。

如果玩家是亞歷克斯,那麼她將取走 piles[i] 或 piles[j] 顆石子,增加她的分數。之後,總分為 piles[i] + dp(i+1, j) 或 piles[j] + dp(i, j-1);我們想要其中的最大可能得分。

如果玩家是李,那麼他將取走 piles[i] 或 piles[j] 顆石子,減少亞歷克斯這一數量的分數。之後,總分為 -piles[i] + dp(i+1, j) 或 -piles[j] + dp(i, j-1);我們想要其中的最小可能得分。

Java語言:

class Solution {
    public boolean stoneGame(int[] piles) {
        int N = piles.length;

        // dp[i+1][j+1] = the value of the game [piles[i], ..., piles[j]].
        int[][] dp = new int[N+2][N+2];
        for (int size = 1; size <= N; ++size)
            for (int i = 0; i + size <= N; ++i) {
                int j = i + size - 1;
                int parity = (j + i + N) % 2;  // j - i - N; but +x = -x (mod 2)
                if (parity == 1)
                    dp[i+1][j+1] = Math.max(piles[i] + dp[i+2][j+1], piles[j] + dp[i+1][j]);
                else
                    dp[i+1][j+1] = Math.min(-piles[i] + dp[i+2][j+1], -piles[j] + dp[i+1][j]);
            }

        return dp[1][N] > 0;
    }
}

執行結果展示

在這裡插入圖片描述