1. 程式人生 > >題解【bzoj1010 [HNOI2008]玩具裝箱TOY】

題解【bzoj1010 [HNOI2008]玩具裝箱TOY】

斜率優化動態規劃可以用來解決這道題。同時這也是一道經典的斜率優化基礎題。

分析:明顯是動態規劃。令\(dp[i]\)為前\(i\)個裝箱的最小花費。
轉移方程如下:
\[dp[i]=\min\limits_{0 \leq j < i} \{ dp[j]+( \sum \limits_{k = j + 1}^{i}{C_k} + i - j - 1 - L) ^ 2\}\]

\(sum[i]\)表示前\(i\)個容器的長度之和(即\(C\)的字首和),方程簡化為:
\[dp[i]=\min\limits_{0 \leq j < i} \{ dp[j]+( sum[i]-sum[j] + i - j - 1 - L) ^ 2\}\]

又令\(f[i]\)\(sum[i]+i\),繼續簡化方程為:
\[dp[i]=\min\limits_{0 \leq j < i} \{ dp[j]+( f[i]-f[j] - 1 - L) ^ 2\}\]

暴力dp是\(O(n^2)\),考慮優化。如何優化,就是用前面所提到的斜率優化。這玩意到底是什麼?我們先來繼續對狀態轉移方程進行進一步的推導。

對於每個\(dp[i]\)可以知道都是由一個\(j0\)推過來的。這個\(j0\)對於當前的\(i\)是最優的決策。假設現在有兩個決策\(j_1,j_2 (1 \leq j_1 < j_2 < i)\),且決策\(j_2\)

優於\(j_1\),則有:
\[dp[j_1]+( f[i]-f[j_1] - 1 - L) ^ 2 \geq dp[j_2]+( f[i]-f[j_2] - 1 - L) ^ 2\]

拆開可得:
\[dp[j_1]+f[i]^2-2f[i](f[j_1]+1+L)+(f[j_1]+L+1)^2 \geq dp[j_2]+f[i]^2-2f[i](f[j_2]+1+L)+(f[j_2]+L+1)^2\]

化簡可得:
\[2f[i](f[j_2] + 1 + L)-2f[i](f[j_1] + 1 + L) \geq dp[j_2]+(f[j_2]+1+L)^2 - (dp[j_1]+(f[j_1]+1+L)^2)\]

即:
\[2f[i] \geq \frac{dp[j_2]+(f[j_2]+1+L)^2 - (dp[j_1]+(f[j_1]+1+L)^2)}{f[j_2]-f[j_1]}\]
\(g[i] = (f[i]+L+1)^2\),可得:
\[2f[i] \geq \frac{dp[j_2]+g[j_2] - (dp[j_1]+g[j_1])}{f[j_2]-f[j_1]}\]

也就是說,若\(j1,j2\)滿足上面這個式子,那麼\(j2\)一定比\(j1\)優。

為什麼叫斜率優化?因為上面這個式子可以把看作\(dp[i]+g[i]\)看做縱座標,\(f[i]\)看做橫座標,上面的等式右側就相當於\(\frac{\Delta y}{\Delta x}=k\)也就是一個一次函式的斜率。當這個斜率\(k \leq 2f[i]\)\(j_2\)優於\(j_1\)

假如我們有三個決策\(j_1,j_2,j_3\)(如下圖)

容易證明:\(j_2\)不可能是最優的。
這樣一來,每兩個決策間的斜率便是單調上升的

所以有兩種做法:

  • 對於\(dp[i]\),有了斜率單調上升這個條件,就可以去二分最優的決策點(也就是斜率小於\(2f[i]\)的)。複雜度\(O(n \log n)\)
  • 又因為\(f[i]\)是單調遞增的,可以用單調佇列來維護。具體實現就是,把決策放進一個單調佇列裡,如果隊首和當前的\(i\)間的斜率 \(<f[i]\),就把隊首刪掉(即h++)。對於隊尾,就每次把加入\(i\)後不滿足斜率單調上升的隊尾全部刪掉(即t--),最後把\(i\)放進單調佇列就好了。

注意事項:
long long.
還有 $g[0]=(L + 1) ^ 2 $而不是\(0\)!!!!(因為這個我調了很久)

給一下單調佇列做法的程式碼:

#include <iostream>
#include <cstdlib>
#include <cstdio>
#include <algorithm>

using namespace std;

#define int long long
const int MAXN = 50050;
int N, L, dp[MAXN], sum[MAXN], f[MAXN], g[MAXN], h, t, Q[MAXN];

inline double xie(int j1, int j2)
{
    return (double) (dp[j2] + g[j2] - dp[j1] - g[j1]) / (f[j2] - f[j1]);
}
#undef int
int main()
{
    scanf("%d%d", &N, &L);
    for(int i = 1; i <= N; i++)
    {
        scanf("%d", &sum[i]);
        sum[i] += sum[i - 1];
        f[i] = sum[i] + i;
        g[i] = (f[i] + L + 1) * (f[i] + L + 1);
    }
    g[0] = (L + 1) * (L + 1); //important!!!
    for(int i = 1; i <= N; i++)
    {
        while(h < t && xie(Q[h], Q[h + 1]) <= 2 * f[i]) h++;
        dp[i] = dp[Q[h]] + (f[i] - f[Q[h]] - L - 1) * (f[i] - f[Q[h]] - L - 1); //更新dp值
        while(h < t && xie(Q[t], i) < xie(Q[t - 1], Q[t])) t--;
        Q[++t] = i;
        
    }
    printf("%lld\n", dp[N]);
    return 1;//防抄
}