1. 程式人生 > >揹包九講(轉)

揹包九講(轉)

  • 轉自dd大牛的《揹包九講》

目錄

前言

本篇文章是我(dd_engi)正在進行中的一個雄心勃勃的寫作計劃的一部分,這個計劃的內容是寫作一份較為完善的NOIP難度的動態規劃總結,名為《解動態規劃題的基本思考方式》。現在你看到的是這個寫作計劃最先發布的一部分。

揹包問題是一個經典的動態規劃模型。它既簡單形象容易理解,又在某種程度上能夠揭示動態規劃的本質,故不少教材都把它作為動態規劃部分的第一道例題,我也將它放在我的寫作計劃的第一部分。

讀本文最重要的是思考。因為我的語言和寫作方式向來不以易於理解為長,思路也偶有跳躍的地方,後面更有需要大量思考才能理解的比較抽象的內容。更重要的是:不大量思考,絕對不可能學好動態規劃這一資訊學奧賽中最精緻的部分。

你現在看到的是本文的1.0正式版。我會長期維護這份文字,把大家的意見和建議融入其中,也會不斷加入我在OI學習以及將來可能的ACM-ICPC的征程中得到的新的心得。但目前本文還沒有一個固定的釋出頁面,想了解本文是否有更新版本釋出,可以在OIBH論壇中以“揹包問題九講”為關鍵字搜尋貼子,每次比較重大的版本更新都會在這裡發貼公佈。

目錄

這是最基本的揹包問題,每個物品最多隻能放一次。

第二個基本的揹包問題模型,每種物品可以放無限多次。

每種物品有一個固定的次數上限。

將前面三種簡單的問題疊加成較複雜的問題。

一個簡單的常見擴充套件。

一種題目型別,也是一個有用的模型。後兩節的基礎。

另一種給物品的選取加上限制的方法。

我自己關於揹包問題的思考成果,有一點抽象。

試圖觸類旁通、舉一反三。

揹包的搜尋

給出 USACO Training 上可供練習的揹包問題列表,及簡單的解答。

聯絡方式

如果有任何意見和建議,特別是文章的錯誤和不足,或者希望為文章新增新的材料,可以通過http://kontactr.com/user/tianyi/這個網頁聯絡我。

致謝

感謝以下名單:

阿坦

jason911

donglixp

他們每人都最先指出了本文第一個beta版中的某個並非無關緊要的錯誤。謝謝你們如此仔細地閱讀拙作並彌補我的疏漏。

感謝 XiaQ,它針對本文的第一個beta版發表了用詞嚴厲的六條建議,雖然我只認同並採納了其中的兩條。在所有讀者幾乎一邊倒的讚揚將我包圍的當時,你的貼子是我的一劑清醒劑,讓我能清醒起來並用更嚴厲的眼光審視自己的作品。

當然,還有用各種方式對我表示鼓勵和支援的幾乎無法計數的同學。不管是當面讚揚,或是在論壇上回復我的貼子,不管是發來熱情洋溢的郵件,或是在即時聊天的窗口裡豎起大拇指,你們的鼓勵和支援是支撐我的寫作計劃的強大動力,也鞭策著我不斷提高自身水平,謝謝你們!

最後,感謝 Emacs 這一世界最強大的編輯器的所有貢獻者,感謝它的外掛 EmacsMuse 的開發者們,本文的所有編輯工作都藉助這兩個卓越的自由軟體完成。謝謝你們——自由軟體社群——為社會提供瞭如此有生產力的工具。我深深欽佩你們身上體現出的自由軟體的精神,沒有你們的感召,我不能完成本文。在你們的影響下,採用自由文件的方式釋出本文件,也是我對自由社會事業的微薄努力。

  • P01: 01揹包問題

題目

有N件物品和一個容量為V的揹包。第i件物品的費用是c[i],價值是w[i]。求解將哪些物品裝入揹包可使價值總和最大。

基本思路

這是最基礎的揹包問題,特點是:每種物品僅有一件,可以選擇放或不放。

用子問題定義狀態:即f[i][v]表示前i件物品恰放入一個容量為v的揹包可以獲得的最大價值。則其狀態轉移方程便是:

f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}   

這個方程非常重要,基本上所有跟揹包相關的問題的方程都是由它衍生出來的。所以有必要將它詳細解釋一下:“將前i件物品放入容量為v的揹包中”這個子問題,若只考慮第i件物品的策略(放或不放),那麼就可以轉化為一個只牽扯前i-1件物品的問題。如果不放第i件物品,那麼問題就轉化為“前i-1件物品放入容量為v的揹包中”,價值為f[i-1][v];如果放第i件物品,那麼問題就轉化為“前i-1件物品放入剩下的容量為v-c[i]的揹包中”,此時能獲得的最大價值就是f[i-1][v-c[i]]再加上通過放入第i件物品獲得的價值w[i]。

優化空間複雜度

以上方法的時間和空間複雜度均為O(N*V),其中時間複雜度基本已經不能再優化了,但空間複雜度卻可以優化到O(V)。

先考慮上面講的基本思路如何實現,肯定是有一個主迴圈i=1..N,每次算出來二維陣列f[i][0..V]的所有值。那麼,如果只用一個數組f[0..V],能不能保證第i次迴圈結束後f[v]中表示的就是我們定義的狀態f[i][v]呢?f[i][v]是由f[i-1][v]和f[i-1][v-c[i]]兩個子問題遞推而來,能否保證在推f[i][v]時(也即在第i次主迴圈中推f[v]時)能夠得到f[i-1][v]和f[i-1][v-c[i]]的值呢?事實上,這要求在每次主迴圈中我們以v=V..0的順序推f[v],這樣才能保證推f[v]時f[v-c[i]]儲存的是狀態f[i-1][v-c[i]]的值。虛擬碼如下:

for i=1..N

    for v=V..0

        f[v]=max{f[v],f[v-c[i]]+w[i]};

其中的f[v]=max{f[v],f[v-c[i]]}一句恰就相當於我們的轉移方程f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]},因為現在的f[v-c[i]]就相當於原來的f[i-1][v-c[i]]。如果將v的迴圈順序從上面的逆序改成順序的話,那麼則成了f[i][v]由f[i][v-c[i]]推知,與本題意不符,但它卻是另一個重要的揹包問題P02最簡捷的解決方案,故學習只用一維陣列解01揹包問題是十分必要的。

事實上,使用一維陣列解01揹包的程式在後面會被多次用到,所以這裡抽象出一個處理一件01揹包中的物品過程,以後的程式碼中直接呼叫不加說明。{!背過}

我們看一下原來的方程f[i][v]=max{f[i-1][v],

f[i-1][v-c[i]]+w[i]}

不一定從1開始,那樣會浪費        

過程ZeroOnePack,表示處理一件01揹包中的物品,兩個引數cost、weight分別表明這件物品的費用和價值。

procedure ZeroOnePack(cost,weight)

    for v=V..cost

        f[v]=max{f[v],f[v-cost]+weight}

注意這個過程裡的處理與前面給出的虛擬碼有所不同。前面的示例程式寫成v=V..0是為了在程式中體現每個狀態都按照方程求解了,避免不必要的思維複雜度。而這裡既然已經抽象成看作黑箱的過程了,就可以加入優化。費用為cost的物品不會影響狀態f[0..cost-1],這是顯然的。

有了這個過程以後,01揹包問題的虛擬碼就可以這樣寫:

for i=1..N

    ZeroOnePack(c[i],w[i]);

初始化的細節問題

我們看到的求最優解的揹包問題題目中,事實上有兩種不太相同的問法。有的題目要求“恰好裝滿揹包”時的最優解,有的題目則並沒有要求必須把揹包裝滿。一種區別這兩種問法的實現方法是在初始化的時候有所不同。

如果是第一種問法,要求恰好裝滿揹包,那麼在初始化時除了f[0]為0其它f[1..V]均設為-∞,這樣就可以保證最終得到的f[N]是一種恰好裝滿揹包的最優解。

如果並沒有要求必須把揹包裝滿,而是隻希望價格儘量大,初始化時應該將f[0..V]全部設為0。

為什麼呢?可以這樣理解:初始化的f陣列事實上就是在沒有任何物品可以放入揹包時的合法狀態。如果要求揹包恰好裝滿,那麼此時只有容量為0的揹包可能被價值為0的nothing“恰好裝滿”,其它容量的揹包均沒有合法的解,屬於未定義的狀態,它們的值就都應該是-∞了。如果揹包並非必須被裝滿,那麼任何容量的揹包都有一個合法解“什麼都不裝”,這個解的價值為0,所以初始時狀態的值也就全部為0了。

這個小技巧完全可以推廣到其它型別的揹包問題,後面也就不再對進行狀態轉移之前的初始化進行講解。

小結

01揹包問題是最基本的揹包問題,它包含了揹包問題中設計狀態、方程的最基本思想,另外,別的型別的揹包問題往往也可以轉換成01揹包問題求解。故一定要仔細體會上面基本思路的得出方法,狀態轉移方程的意義,以及最後怎樣優化的空間複雜度。

  • P02: 完全揹包問題

題目

有N種物品和一個容量為V的揹包,每種物品都有無限件可用。第i種物品的費用是c[i],價值是w[i]。求解將哪些物品裝入揹包可使這些物品的費用總和不超過揹包容量,且價值總和最大。

基本思路

這個問題非常類似於01揹包問題 ,所不同的是每種物品有無限件。也就是從每種物品的角度考慮,與它相關的策略已並非取或不取兩種,而是有取0件、取1件、取2件……等很多種。如果仍然按照解01揹包時的思路,令f[i][v]表示前i種物品恰放入一個容量為v的揹包的最大權值。仍然可以按照每種物品不同的策略寫出狀態轉移方程,像這樣:

f[i][v]=max{f[i-1][v-k*c[i]]+k*w[i]|0<=k*c[i]<=v}

這跟01揹包問題一樣有O(N*V)個狀態需要求解,但求解每個狀態的時間已經不是常數了,求解狀態f[i][v]的時間是O(v/c[i]),總的複雜度是超過O(VN)的。

將01揹包問題的基本思路加以改進,得到了這樣一個清晰的方法。這說明01揹包問題的方程的確是很重要,可以推及其它型別的揹包問題。但我們還是試圖改進這個複雜度。

一個簡單有效的優化

完全揹包問題有一個很簡單有效的優化,是這樣的:若兩件物品i、j滿足c[i]<=c[j]且w[i]>=w[j],則將物品j去掉,不用考慮。這個優化的正確性顯然:任何情況下都可將價值小費用高得j換成物美價廉的i,得到至少不會更差的方案。對於隨機生成的資料,這個方法往往會大大減少物品的件數,從而加快速度。然而這個並不能改善最壞情況的複雜度,因為有可能特別設計的資料可以一件物品也去不掉。

這個優化可以簡單的O(N^2)地實現,一般都可以承受。另外,針對揹包問題而言,比較不錯的一種方法是:[顯然]首先將費用大於V的物品去掉,然後使用類似計數排序的做法,計算出費用相同的物品中價值最高的是哪個,可以O(V+N)地完成這個優化。這個不太重要的過程就不給出虛擬碼了,希望你能獨立思考寫出虛擬碼或程式。

轉化為01揹包問題求解

既然01揹包問題是最基本的揹包問題,那麼我們可以考慮把完全揹包問題轉化為01揹包問題來解。最簡單的想法是,考慮到第i種物品最多選V/c[i]件,於是可以把第i種物品轉化為V/c[i]件費用及價值均不變的物品,然後求解這個01揹包問題。這樣完全沒有改進基本思路的時間複雜度,但這畢竟給了我們將完全揹包問題轉化為01揹包問題的思路:將一種物品拆成多件物品。

更高效的轉化方法是:把第i種物品拆成費用為c[i]*2^k、價值為w[i]*2^k的若干件物品,其中k滿足c[i]*2^k<=V。這是二進位制的思想,因為不管最優策略選幾件第i種物品,總可以表示成若干個2^k件物品的和。這樣比把每種物品拆成O(log(V/c[i]))件物品,是一個很大的改進。

但我們有更優的O(VN)的演算法。

O(VN)的演算法

這個演算法使用一維陣列,先看虛擬碼:

for i=1..N

    for v=0..V

        f[v]=max{f[v],f[v-cost]+weight}

你會發現,這個虛擬碼與P01的虛擬碼只有v的迴圈次序不同而已。為什麼這樣一改就可行呢?首先想想為什麼P01中要按照v=V..0的逆序來迴圈。這是因為要保證第i次迴圈中的狀態f[i][v]是由狀態f[i-1][v-c[i]]遞推而來。換句話說,這正是為了保證每件物品只選一次,保證在考慮“選入第i件物品”這件策略時,依據的是一個絕無已經選入第i件物品的子結果f[i-1][v-c[i]]。而現在完全揹包的特點恰是每種物品可選無限件,所以在考慮“加選一件第i種物品”這種策略時,卻正需要一個可能已選入第i種物品的子結果f[i][v-c[i]],所以就可以並且必須採用v=0..V的順序迴圈。這就是這個簡單的程式為何成立的道理。

這個演算法也可以以另外的思路得出。例如,基本思路中的狀態轉移方程可以等價地變形成這種形式:

f[i][v]=max{f[i-1][v],f[i][v-c[i]]+w[i]}

將這個方程用一維陣列實現,便得到了上面的虛擬碼。

最後抽象出處理一件完全揹包類物品的過程虛擬碼,以後會用到:

procedure CompletePack(cost,weight)

    for v=cost..V

        f[v]=max{f[v],f[v-c[i]]+w[i]}

總結

完全揹包問題也是一個相當基礎的揹包問題,它有兩個狀態轉移方程,分別在“基本思路”以及“O(VN)的演算法“的小節中給出。希望你能夠對這兩個狀態轉移方程都仔細地體會,不僅記住,也要弄明白它們是怎麼得出來的,最好能夠自己想一種得到這些方程的方法。事實上,對每一道動態規劃題目都思考其方程的意義以及如何得來,是加深對動態規劃的理解、提高動態規劃功力的好方法。

  • P03: 多重揹包問題

題目

有N種物品和一個容量為V的揹包。第i種物品最多有n[i]件可用,每件費用是c[i],價值是w[i]。求解將哪些物品裝入揹包可使這些物品的費用總和不超過揹包容量,且價值總和最大。

基本演算法

這題目和完全揹包問題很類似。基本的方程只需將完全揹包問題的方程略微一改即可,因為對於第i種物品有n[i]+1種策略:取0件,取1件……取n[i]件。令f[i][v]表示前i種物品恰放入一個容量為v的揹包的最大權值,則有狀態轉移方程:

f[i][v]=max{f[i-1][v-k*c[i]]+k*w[i]|0<=k<=n[i]}

複雜度是O(V*Σn[i])。

轉化為01揹包問題

另一種好想好寫的基本方法是轉化為01揹包求解:把第i種物品換成n[i]件01揹包中的物品,則得到了物品數為Σn[i]的01揹包問題,直接求解,複雜度仍然是O(V*Σn[i])。

但是我們期望將它轉化為01揹包問題之後能夠像完全揹包一樣降低複雜度。仍然考慮二進位制的思想,我們考慮把第i種物品換成若干件物品,使得原問題中第i種物品可取的每種策略——取0..n[i]件——均能等價於取若干件代換以後的物品。另外,取超過n[i]件的策略必不能出現。

方法是:將第i種物品分成若干件物品,其中每件物品有一個係數,這件物品的費用和價值均是原來的費用和價值乘以這個係數。使這些係數分別為1,2,4,...,2^(k-1),n[i]-2^k+1,且k是滿足n[i]-2^k+1>0的最大整數。例如,如果n[i]為13,就將這種物品分成係數分別為1,2,4,6的四件物品。

分成的這幾件物品的係數和為n[i],表明不可能取多於n[i]件的第i種物品。另外這種方法也能保證對於0..n[i]間的每一個整數,均可以用若干個係數的和表示,這個證明可以分0..2^k-1和2^k..n[i]兩段來分別討論得出,並不難,希望你自己思考嘗試一下。

這樣就將第i種物品分成了O(log n[i])種物品,將原問題轉化為了複雜度為O(V*Σlog n[i])的01揹包問題,是很大的改進。

下面給出O(log amount)時間處理一件多重揹包中物品的過程,其中amount表示物品的數量:

procedure MultiplePack(cost,weight,amount)

    if cost*amount>=V

        CompletePack(cost,weight)

        return

    integer k=1

    while k<num

        ZeroOnePack(k*cost,k*weight)

        amount=amount-k

        k=k*2

    ZeroOnePack(amount*cost,amount*weight)

希望你仔細體會這個虛擬碼,如果不太理解的話,不妨翻譯成程式程式碼以後,單步執行幾次,或者頭腦加紙筆模擬一下,就會慢慢理解了。

O(VN)的演算法

多重揹包問題同樣有O(VN)的演算法。這個演算法基於基本演算法的狀態轉移方程,但應用單調佇列的方法使每個狀態的值可以以均攤O(1)的時間求解。由於用單調佇列優化的DP已超出了NOIP的範圍,故本文不再展開講解。我最初瞭解到這個方法是在樓天成的“男人八題”幻燈片上。

小結

這裡我們看到了將一個演算法的複雜度由O(V*Σn[i])改進到O(V*Σlog n[i])的過程,還知道了存在應用超出NOIP範圍的知識的O(VN)演算法。希望你特別注意“拆分物品”的思想和方法,自己證明一下它的正確性,並將完整的程式程式碼寫出來。

  • P04: 混合三種揹包問題

問題

如果將P01P02P03混合起來。也就是說,有的物品只可以取一次(01揹包),有的物品可以取無限次(完全揹包),有的物品可以取的次數有一個上限(多重揹包)。應該怎麼求解呢?

01揹包與完全揹包的混合

考慮到在P01P02中給出的虛擬碼只有一處不同,故如果只有兩類物品:一類物品只能取一次,另一類物品可以取無限次,那麼只需在對每個物品應用轉移方程時,根據物品的類別選用順序或逆序的迴圈即可,複雜度是O(VN)。虛擬碼如下:

for i=1..N

    if 第i件物品是01揹包

        for v=V..0

            f[v]=max{f[v],f[v-c[i]]+w[i]};

    else if 第i件物品是完全揹包

        for v=0..V

            f[v]=max{f[v],f[v-c[i]]+w[i]};

再加上多重揹包

如果再加上有的物品最多可以取有限次,那麼原則上也可以給出O(VN)的解法:遇到多重揹包型別的物品用單調佇列解即可。但如果不考慮超過NOIP範圍的演算法的話,用P03中將每個這類物品分成O(log n[i])個01揹包的物品的方法也已經很優了。

當然,更清晰的寫法是呼叫我們前面給出的三個相關過程。

混血兒的優勢

for i=1..N

    if 第i件物品是01揹包

        ZeroOnePack(c[i],w[i])

    else if 第i件物品是完全揹包

        CompletePack(c[i],w[i])

    else if 第i件物品是多重揹包

        MultiplePack(c[i],w[i],n[i])

在最初寫出這三個過程的時候,可能完全沒有想到它們會在這裡混合應用。我想這體現了程式設計中抽象的威力。如果你一直就是以這種“抽象出過程”的方式寫每一類揹包問題的,也非常清楚它們的實現中細微的不同,那麼在遇到混合三種揹包問題的題目時,一定能很快想到上面簡潔的解法,對嗎?

小結

有人說,困難的題目都是由簡單的題目疊加而來的。這句話是否公理暫且存之不論,但它在本講中已經得到了充分的體現。本來01揹包、完全揹包、多重揹包都不是什麼難題,但將它們簡單地組合起來以後就得到了這樣一道一定能嚇倒不少人的題目。但只要基礎紮實,領會三種基本揹包問題的思想,就可以做到把困難的題目拆分成簡單的題目來解決。

  • P05: 二維費用的揹包問題

問題

二維費用的揹包問題是指:對於每件物品,具有兩種不同的費用;選擇這件物品必須同時付出這兩種代價;對於每種代價都有一個可付出的最大值(揹包容量)。問怎樣選擇物品可以得到最大的價值。設這兩種代價分別為代價1和代價2,第i件物品所需的兩種代價分別為a[i]和b[i]。兩種代價可付出的最大值(兩種揹包容量)分別為V和U。物品的價值為w[i]。

演算法

費用加了一維,只需狀態也加一維即可。設f[i][v][u]表示前i件物品付出兩種代價分別為v和u時可獲得的最大價值。狀態轉移方程就是:

f[i][v][u]=max{f[i-1][v][u],f[i-1][v-a[i]][u-b[i]]+w[i]}

如前述方法,可以只使用二維的陣列:當每件物品只可以取一次時變數v和u採用逆序的迴圈,當物品有如完全揹包問題時採用順序的迴圈。當物品有如多重揹包問題時拆分物品。這裡就不再給出虛擬碼了,相信有了前面的基礎,你能夠自己實現出這個問題的程式。

物品總個數的限制

有時,“二維費用”的條件是以這樣一種隱含的方式給出的:最多隻能取M件物品。這事實上相當於每件物品多了一種“件數”的費用,每個物品的件數費用均為1,可以付出的最大件數費用為M。換句話說,設f[v][m]表示付出費用v、最多選m件時可得到的最大價值,則根據物品的型別(01、完全、多重)用不同的方法迴圈更新,最後在f[0..V][0..M]範圍內尋找答案。

小結

是不是可以用來解決多重揹包的問題???只不過比多重揹包複雜度高

當發現由熟悉的動態規劃題目變形得來的題目時,在原來的狀態中加一維以滿足新的限制是一種比較通用的方法。希望你能從本講中初步體會到這種方法。

  • P06: 分組的揹包問題

問題

有N件物品和一個容量為V的揹包。第i件物品的費用是c[i],價值是w[i]。這些物品被劃分為若干組,每組中的物品互相沖突,最多選一件。求解將哪些物品裝入揹包可使這些物品的費用總和不超過揹包容量,且價值總和最大。

演算法

這個問題變成了每組物品有若干種策略:是選擇本組的某一件,還是一件都不選。也就是說設f[k][v]表示前k組物品花費費用v能取得的最大權值,則有:

f[k][v]=max{f[k-1][v],f[k-1][v-c[i]]+w[i]|物品i屬於第k組}

使用一維陣列的虛擬碼如下:

for 所有的組k

    for v=V..0

        for 所有的i屬於組k

            f[v]=max{f[v],f[v-c[i]]+w[i]}

注意這裡的三層迴圈的順序,甚至在本文的beta版中我自己都寫錯了。“for v=V..0”這一層迴圈必須在“for 所有的i屬於組k”之外。這樣才能保證每一組內的物品最多隻有一個會被新增到揹包中。

另外,顯然可以對每組內的物品應用P02中“一個簡單有效的優化”。

小結

分組的揹包問題將彼此互斥的若干物品稱為一個組,這建立了一個很好的模型。不少揹包問題的變形都可以轉化為分組的揹包問題(例如P07),由分組的揹包問題進一步可定義“泛化物品”的概念,十分有利於解題。

  • P07: 有依賴的揹包問題

簡化的問題

這種揹包問題的物品間存在某種“依賴”的關係。也就是說,i依賴於j,表示若選物品i,則必須選物品j。為了簡化起見,我們先設沒有某個物品既依賴於別的物品,又被別的物品所依賴;另外,沒有某件物品同時依賴多件物品。

演算法

這個問題由NOIP2006金明的預算方案一題擴充套件而來。遵從該題的提法,將不依賴於別的物品的物品稱為“主件”,依賴於某主件的物品稱為“附件”。由這個問題的簡化條件可知所有的物品由若干主件和依賴於每個主件的一個附件集合組成。

按照揹包問題的一般思路,僅考慮一個主件和它的附件集合。可是,可用的策略非常多,包括:一個也不選,僅選擇主件,選擇主件後再選擇一個附件,選擇主件後再選擇兩個附件……無法用狀態轉移方程來表示如此多的策略。(事實上,設有n個附件,則策略有2^n+1個,為指數級。)

考慮到所有這些策略都是互斥的(也就是說,你只能選擇一種策略),所以一個主件和它的附件集合實際上對應於P06中的一個物品組,每個選擇了主件又選擇了若干個附件的策略對應於這個物品組中的一個物品,其費用和價值都是這個策略中的物品的值的和。但僅僅是這一步轉化並不能給出一個好的演算法,因為物品組中的物品還是像原問題的策略一樣多。

再考慮P06中的一句話: 可以對每組中的物品應用P02中“一個簡單有效的優化”。 這提示我們,對於一個物品組中的物品,所有費用相同的物品只留一個價值最大的,不影響結果。所以,我們可以對主件i的“附件集合”先進行一次01揹包,得到費用依次為0..V-c[i]所有這些值時相應的最大價值f'[0..V-c[i]]。那麼這個主件及它的附件集合相當於V-c[i]+1個物品的物品組,其中費用為c[i]+k的物品的價值為f'[k]+w[i]。也就是說原來指數級的策略中有很多策略都是冗餘的,通過一次01揹包後,將主件i轉化為V-c[i]+1個物品的物品組,就可以直接應用P06的演算法解決問題了。

較一般的問題

更一般的問題是:依賴關係以圖論中“森林”的形式給出(森林即多叉樹的集合),也就是說,主件的附件仍然可以具有自己的附件集合,限制只是每個物品最多隻依賴於一個物品(只有一個主件)且不出現迴圈依賴。

解決這個問題仍然可以用將每個主件及其附件集合轉化為物品組的方式。唯一不同的是,由於附件可能還有附件,就不能將每個附件都看作一個一般的01揹包中的物品了。若這個附件也有附件集合,則它必定要被先轉化為物品組,然後用分組的揹包問題解出主件及其附件集合所對應的附件組中各個費用的附件所對應的價值。

事實上,這是一種樹形DP,其特點是:每個父節點都需要對它的各個兒子的屬性進行一次DP以求得自己的相關屬性。這已經觸及到了“泛化物品”的思想。看完P08後,你會發現這個“依賴關係樹”每一個子樹都等價於一件泛化物品,求某節點為根的子樹對應的泛化物品相當於求其所有兒子的對應的泛化物品之和。

小結

NOIP2006的那道揹包問題我做得很失敗,寫了上百行的程式碼,卻一分未得。後來我通過思考發現通過引入“物品組”和“依賴”的概念可以加深對這題的理解,還可以解決它的推廣問題。用物品組的思想考慮那題中極其特殊的依賴關係:物品不能既作主件又作附件,每個主件最多有兩個附件,可以發現一個主件和它的兩個附件等價於一個由四個物品組成的物品組,這便揭示了問題的某種本質。

我想說:失敗不是什麼丟人的事情,從失敗中全無收穫才是。

  • P08: 泛化物品

定義

考慮這樣一種物品,它並沒有固定的費用和價值,而是它的價值隨著你分配給它的費用而變化。這就是泛化物品的概念。

更嚴格的定義之。在揹包容量為V的揹包問題中,泛化物品是一個定義域為0..V中的整數的函式h,當分配給它的費用為v時,能得到的價值就是h(v)。

這個定義有一點點抽象,另一種理解是一個泛化物品就是一個數組h[0..V],給它費用v,可得到價值h[V]。{fuck!這不一樣啊!}

[將所有的揹包普遍化]:1.一個費用為c價值為w的物品,如果它是01揹包中的物品,那麼把它看成泛化物品,它就是除了h(c)=w其它函式值都為0的一個函式。2.如果它是完全揹包中的物品,那麼它可以看成這樣一個函式,僅當v被c整除時有h(v)=v/c*w,其它函式值均為0。3.如果它是多重揹包中重複次數最多為n的物品,那麼它對應的泛化物品的函式有h(v)=v/c*w僅當v被c整除且v/c<=n,其它情況函式值均為0。

一個物品組可以看作一個泛化物品h。對於一個0..V中的v,若物品組中不存在費用為v的的物品,則h(v)=0,否則h(v)為所有費用為v的物品的最大價值。P07中每個主件及其附件集合等價於一個物品組,自然也可看作一個泛化物品。

泛化物品的和

如果面對兩個泛化物品h和l,要用給定的費用從這兩個泛化物品中得到最大的價值,怎麼求呢?事實上,對於一個給定的費用v,只需列舉將這個費用如何分配給兩個泛化物品就可以了。同樣的,對於0..V的每一個整數v,可以求得費用v分配到h和l中的最大價值f(v)。也即f(v)=max{h(k)+l(v-k)|0<=k<=v}。可以看到,f也是一個由泛化物品h和l決定的定義域為0..V的函式,也就是說,f是一個由泛化物品h和l決定的泛化物品。

由此可以定義泛化物品的和:h、l都是泛化物品,若泛化物品f滿足f(v)=max{h(k)+l(v-k)|0<=k<=v},則稱f是h與l的和,即f=h+l。這個運算的時間複雜度取決於揹包的容量,是O(V^2)。

泛化物品的定義表明:在一個揹包問題中,若將兩個泛化物品代以它們的和,不影響問題的答案。事實上,對於其中的物品都是泛化物品的揹包問題,求它的答案的過程也就是求所有這些泛化物品之和的過程。設此和為s,則答案就是s[0..V]中的最大值。

揹包問題的泛化物品

一個揹包問題中,可能會給出很多條件,包括每種物品的費用、價值等屬性,物品之間的分組、依賴等關係等。但肯定能將問題對應於某個泛化物品。也就是說,給定了所有條件以後,就可以對每個非負整數v求得:若揹包容量為v,將物品裝入揹包可得到的最大價值是多少,這可以認為是定義在非負整數集上的一件泛化物品。這個泛化物品——或者說問題所對應的一個定義域為非負整數的函式——包含了關於問題本身的高度濃縮的資訊。一般而言,求得這個泛化物品的一個子域(例如0..V)的值之後,就可以根據這個函式的取值得到揹包問題的最終答案。

綜上所述,一般而言,求解揹包問題,即求解這個問題所對應的一個函式,即該問題的泛化物品。而求解某個泛化物品的一種方法就是將它表示為若干泛化物品的和然後求之。

小結

本講可以說都是我自己的原創思想。具體來說,是我在學習函數語言程式設計的 Scheme 語言時,用函式程式設計的眼光審視各類揹包問題得出的理論。這一講真的很抽象,也許在“模型的抽象程度”這一方面已經超出了NOIP的要求,所以暫且看不懂也沒關係。相信隨著你的OI之路逐漸延伸,有一天你會理解的。

我想說:“思考”是一個OIer最重要的品質。簡單的問題,深入思考以後,也能發現更多。

  • P09: 揹包問題問法的變化

以上涉及的各種揹包問題都是要求在揹包容量(費用)的限制下求可以取到的最大價值,但揹包問題還有很多種靈活的問法,在這裡值得提一下。但是我認為,只要深入理解了求揹包問題最大價值的方法,即使問法變化了,也是不難想出演算法的。

例如,求解最多可以放多少件物品或者最多可以裝滿多少揹包的空間。這都可以根據具體問題利用前面的方程求出所有狀態的值(f陣列)之後得到。

很多都是這樣的

還有,如果要求的是“總價值最小”“總件數最小”,只需簡單的將上面的狀態轉移方程中的max改成min即可。

下面說一些變化更大的問法。

輸出方案

一般而言,揹包問題是要求一個最優值,如果要求輸出這個最優值的方案,可以參照一般動態規劃問題輸出方案的方法:記錄下每個狀態的最優值是由狀態轉移方程的哪一項推出來的,換句話說,記錄下它是由哪一個策略推出來的。便可根據這條策略找到上一個狀態,從上一個狀態接著向前推即可。

還是以01揹包為例,方程為f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}。再用一個數組g[i][v],設g[i][v]=0表示推出f[i][v]的值時是採用了方程的前一項(也即f[i][v]=f[i-1][v]),g[i][v]表示採用了方程的後一項。注意這兩項分別表示了兩種策略:未選第i個物品及選了第i個物品。那麼輸出方案的虛擬碼可以這樣寫(設最終狀態為f[N][V]):

i=N

v=V

while(i>0)

    if(g[i][v]==0)

        print "未選第i項物品"

    else if(g[i][v]==1)

        print "選了第i項物品"

        v=v-c[i]

另外,採用方程的前一項或後一項也可以在輸出方案的過程中根據f[i][v]的值實時地求出來,也即不須紀錄g陣列,將上述程式碼中的g[i][v]==0改成f[i][v]==f[i-1][v],g[i][v]==1改成f[i][v]==f[i-1][v-c[i]]+w[i]也可。

輸出字典序最小的最優方案

這裡“字典序最小”的意思是1..N號物品的選擇方案排列出來以後字典序最小。以輸出01揹包最小字典序的方案為例。

一般而言,求一個字典序最小的最優方案,只需要在轉移時注意策略。首先,子問題的定義要略改一些。我們注意到,如果存在一個選了物品1的最優方案,那麼答案一定包含物品1,原問題轉化為一個揹包容量為v-c[1],物品為2..N的子問題。反之,如果答案不包含物品1,則轉化成揹包容量仍為V,物品為2..N的子問題。不管答案怎樣,子問題的物品都是以i..N而非前所述的1..i的形式來定義的,所以狀態的定義和轉移方程都需要改一下。但也許更簡易的方法是先把物品逆序排列一下,以下按物品已被逆序排列來敘述。

在這種情況下,可以按照前面經典的狀態轉移方程來求值,只是輸出方案的時候要注意:從N到1輸入時,如果f[i][v]==f[i-v]及f[i][v]==f[i-1][f-c[i]]+w[i]同時成立,應該按照後者(即選擇了物品i)來輸出方案。{取I與不取I相比,取的話一定在字典前}

求方案總數

對於一個給定了揹包容量、物品費用、物品間相互關係(分組、依賴等)的揹包問題,除了再給定每個物品的價值後求可得到的最大價值外,還可以得到裝滿揹包或將揹包裝至某一指定容量的方案總數。

對於這類改變問法的問題,一般只需將狀態轉移方程中的max改成sum即可。例如若每件物品均是完全揹包中的物品,轉移方程即為

f[i][v]=sum{f[i-1][v],f[i][v-c[i]]}

初始條件f[0][0]=1。

事實上,這樣做可行的原因在於狀態轉移方程已經考察了所有可能的揹包組成方案。

最優方案的總數

這裡的最優方案是指物品總價值最大的方案。以01揹包為例。

結合求最大總價值和方案總數兩個問題的思路,最優方案的總數可以這樣求:f[i][v]意義同前述,g[i][v]表示這個子問題的最優方案的總數,則在求f[i][v]的同時求g[i][v]的虛擬碼如下:

for i=1..N

   for v=0..V           

        f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}

        g[i][v]=0

        if(f[i][v]==f[i-1][v])

            inc(g[i][v],g[i-1][v])

        if(f[i][v]==f[i-1][v-c[i]]+w[i])

            inc(g[i][v],g[i-1][v-c[i]])

如果你是第一次看到這樣的問題,請仔細體會上面的虛擬碼。

求次優解、第K優解

對於求次優解、第K優解類的問題,如果相應的最優解問題能寫出狀態轉移方程、用動態規劃解決,那麼求次優解往往可以相同的複雜度解決,第K優解則比求最優解的複雜度上多一個係數K。

其基本思想是將每個狀態都表示成有序佇列,將狀態轉移方程中的max/min轉化成有序佇列的合併。這裡仍然以01揹包為例講解一下。

首先看01揹包求最優解的狀態轉移方程:f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]+w[i]}。如果要求第K優解,那麼狀態f[i][v]就應該是一個大小為K的陣列f[i][v][1..K]。其中f[i][v][k]表示前i個物品、揹包大小為v時,第k優解的值。“f[i][v]是一個大小為K的陣列”這一句,熟悉C語言的同學可能比較好理解,或者也可以簡單地理解為在原來的方程中加了一維。顯然f[i][v][1..K]這K個數是由大到小排列的,所以我們把它認為是一個有序佇列。

然後原方程就可以解釋為:f[i][v]這個有序佇列是由f[i-1][v]和f[i-1][v-c[i]]+w[i]這兩個有序佇列合併得到的。有序佇列f[i-1][v]即f[i-1][v][1..K],f[i-1][v-c[i]]+w[i]則理解為在f[i-1][v-c[i]][1..K]的每個數上加上w[i]後得到的有序佇列。合併這兩個有序佇列並將結果(的前K項)儲存到f[i][v][1..K]中的複雜度是O(K)。最後的答案是f[N][V][K]。總的複雜度是O(NVK)。

為什麼這個方法正確呢?實際上,一個正確的狀態轉移方程的求解過程遍歷了所有可用的策略,也就覆蓋了問題的所有方案。只不過由於是求最優解,所以其它在任何一個策略上達不到最優的方案都被忽略了。如果把每個狀態表示成一個大小為K的陣列,並在這個陣列中有序的儲存該狀態可取到的前K個最優值。那麼,對於任兩個狀態的max運算等價於兩個由大到小的有序佇列的合併。

另外還要注意題目對於“第K優解”的定義,將策略不同但權值相同的兩個方案是看作同一個解還是不同的解。如果是前者,則維護有序佇列時要保證佇列裡的數沒有重複的。

小結

顯 然,這裡不可能窮盡揹包類動態規劃問題所有的問法。甚至還存在一類將揹包類動態規劃問題與其它領域(例如數論、圖論)結合起來的問題,在這篇論揹包問題的 專文中也不會論及。但只要深刻領會前述所有類別的揹包問題的思路和狀態轉移方程,遇到其它的變形問法,只要題目難度還屬於NOIP,應該也不難想出演算法。觸類旁通、舉一反三,應該也是一個OIer應有的品質吧。

  • P11: 揹包問題的搜尋解法

《揹包問題九講》的本意是將揹包問題作為動態規劃問題中的一類進行講解。但鑑於的確有一些揹包問題只能用搜索來解,所以這裡也對用搜索解揹包問題做簡單介紹。大部分以01揹包為例,其它的應該可以觸類旁通。

簡單的深搜

對於01揹包問題,簡單的深搜的複雜度是O(2^N)。就是枚舉出所有2^N種將物品放入揹包的方案,然後找最優解。基本框架如下:

procedure SearchPack(i,cur_v,cur_w)

    if(i>N)

        if(cur_w>best)

            best=cur_w

        return

    if(cur_v+v[i]<=V)

        SearchPack(i+1,cur_v+v[i],cur_w+w[i])

    SearchPack(i+1,cur_v,cur_w)

其中cur_v和cur_w表示當前解的費用和權值。主程式中呼叫SearchPack(1,0,0)即可。

搜尋的剪枝

基本的剪枝方法不外乎可行性剪枝或最優性剪枝。

可行性剪枝即判斷按照當前的搜尋路徑搜下去能否找到一個可行解,例如:若將剩下所有物品都放入揹包仍然無法將揹包充滿(設題目要求必須將揹包充滿),則剪枝。

最優性剪枝即判斷按照當前的搜尋路徑搜下去能否找到一個最優解,例如:若加上剩下所有物品的權值也無法得到比當前得到的最優解更優的解,則剪枝。

搜尋的順序

在搜尋中,可以認為順序靠前的物品會被優先考慮。所以利用貪心的思想,將更有可能出現在結果中的物品的順序提前,可以較快地得出貪心地較優解,更有利於最優性剪枝。所以,可以考慮將按照“價效比”(權值/費用)來排列搜尋順序。

另一方面,若將費用較大的物品排列在前面,可以較快地填滿揹包,有利於可行性剪枝。

最後一種可以考慮的方案是:在開始搜尋前將輸入檔案中給定的物品的順序隨機打亂。這樣可以避免命題人故意設定的陷阱。

以上三種決定搜尋順序的方法很難說哪種更好,事實上每種方法都有適用的題目和資料,也有可能將它們在某種程度上混合使用。

子集和問題

子集和問題是一個NP-Complete問題,與前述的(加權的)01揹包問題並不相同。給定一個整數的集合S和一個整數X,問是否存在S的一個子集滿足其中所有元素的和為X。

這個問題有一個時間複雜度為O(2^(N/2))的較高效的搜尋演算法,其中N是集合S的大小。

第一步思想是二分。將集合S劃分成兩個子集S1和S2,它們的大小都是N/2。對於S1和S2,分別枚舉出它們所有的2^(N/2)個子集和,儲存到某種支援查詢的資料結構中,例如hash set。

然後就要將兩部分結果合併,尋找是否有和為X的S的子集。事實上,對於S1的某個和為X1的子集,只需尋找S2是否有和為X-X1的子集。

假設採用的hash set是理想的,每次查詢和插入都僅花費O(1)的時間。兩步的時間複雜度顯然都是O(2^(N/2))。

實踐中,往往可以先將第一步得到的兩組子集和分別排序,然後再用兩個指標掃描的方法查詢是否有滿足要求的子集和。這樣的實現,在可接受的時間內可以解決的最大規模約為N=42。

搜尋還是DP?

在看到一道揹包問題時,應該用搜索還是動態規劃呢?

首先,可以從資料範圍中得到命題人意圖的線索。如果一個揹包問題可以用DP解,V一定不能很大,否則O(VN)的演算法無法承受,而一般的搜尋解法都 是僅與N有關,與V無關的。所以,V很大時(例如上百萬),命題人的意圖就應該是考察搜尋。另一方面,N較大時(例如上百),命題人的意圖就很有可能是考 察動態規劃了。

另外,當想不出合適的動態規劃演算法時,就只能用搜索了。例如看到一個從未見過的揹包中物品的限制條件,無法想出DP的方程,只好寫搜尋以謀求一定的分數了。

  • 附:USACO中的揹包問題

USACO是USA Computing Olympiad的簡稱,它組織了很多面向全球的計算機競賽活動。

USACO Trainng是一個很適合初學者的題庫,我認為它的特色是題目質量高,循序漸進,還配有不錯的課文和題目分析。其中關於揹包問題的那篇課文 (TEXT Knapsack Problems) 也值得一看。

另外,USACO Contest是USACO常年組織的面向全球的競賽系列,在此也推薦NOIP選手參加。

我整理了USACO Training中涉及揹包問題的題目,應該可以作為不錯的習題。其中標加號的是我比較推薦的,標歎號的是我認為對NOIP選手比較有挑戰性的。

題目列表

Inflate (+) (基本01揹包)

Stamps (+)(!) (對初學者有一定挑戰性)

Money

Nuggets

Subsets

Rockers (+) (另一類有趣的“二維”揹包問題)

Milk4 (!) (很怪的揹包問題問法,較難用純DP求解)

題目簡解

以下文字來自我所撰的《USACO心得》一文,該文的完整版本,包括我的程式,可在DD的USACO征程中找到。

Inflate 是加權01 揹包問題,也就是說:每種物品只有一件,只可以選擇放或者不放;而且每種物品有對應的權值,目標是使總權值最大或最小。它最樸素的狀態轉移方程是:f[k][i] = max{f[k-1][i] , f[k-1][i-v[k]]+w[k]}。f[k][i]表示前k 件物品花費代價i 可以得到的最大權值。v[k]和w[k]分別是第k 件物品的花費和權值。可以看到,f[k]的求解過程就是使用第k 件物品對f[k-1]進行更新的過程。那麼事實上就不用使用二維陣列,只需要定義f[i],然後對於每件物品k,順序地檢查f[i]與f[i-v[k]]+w[k]的大小,如果後者更大,就對前者進行更新。這是揹包問題中典型的優化方法。

題目stamps 中,每種物品的使用量沒有直接限制,但使用物品的總量有限制。求第一個不能用這有限個物品組成的揹包的大小。(可以這樣等價地認為)設f[k][i] 表示前k 件物品組成大小為i 的揹包, 最少需要物品的數量。則f[k][i]= min{f[k-1][i],f[k-1][i-j*s[k]]+j},其中j 是選擇使用第k 件物品的數目,這個方程運用時可以用和上面一樣的方法處理成一維的。求解時先設定一個粗糙的迴圈上限,即最大的物品乘最多物品數。

Money 是多重揹包問題。也就是每個物品可以使用無限多次。要求解的是構成一種揹包的不同方案總數。基本上就是把一般的多重揹包的方程中的min 改成sum 就行了。

Nuggets 的模型也是多重揹包。要求求解所給的物品不能恰好放入的揹包大小的最大值(可能不存在)。只需要根據“若i、j 互質,則關於x、y 的不定方程i*x+y*j=n 必有正整數解,其中n>i*j”這一定理得出一個迴圈的上限。Subsets 子集和問題相當於物品大小是前N 個自然數時求大小為N*(N+1)/4 的 01 揹包的方案數。

Rockers 可以利用求解揹包問題的思想設計解法。我的狀態轉移方程如下: f[i][j][t]=max{f[i][j][t-1] , f[i-1][j][t] , f[i-1][j][t-time[i]]+1 , f[i-1][j-1][T]+(t>=time[i])}。其中 f[i][j][t]表示前i 首歌用j 張完整的盤和一張錄了t 分鐘的盤可以放入的最多歌數,T 是一張光碟的最大容量,t>=time[i]是一個bool 值轉換成int 取值為0 或1。但我後來發現我當時設計的狀態和方程效率有點低,如果換成這樣:f[i][j]=(a,b)表示前i 首歌中選了j 首需要用到a 張完整的光碟以及一張錄了b 分鐘的光碟,會將時空複雜度都大大降低。這種將狀態的值設為二維的方法值得注意。

Milk4 是這些類揹包問題中難度最大的一道了。很多人無法做到將它用純DP 方法求解,而是用迭代加深搜尋列舉使用的桶,將其轉換成多重揹包問題再DP。由於 USACO 的資料弱,迭代加深的深度很小,這樣也可以AC,但我們還是可以用純DP 方法將它完美解決的。設f[k]為稱量出k 單位牛奶需要的最少的桶數。那麼可以用類似多重揹包的方法對f 陣列反覆更新以求得最小值。然而困難在於如何輸出字典序最小的方案。我們可以對每個i記錄pre_f[i]和pre_v[i]。表示得到i 單位牛奶的過程是用pre_f[i]單位牛奶加上若干個編號為pre_v[i]的桶的牛奶。這樣就可以一步步求得得到i 單位牛奶的完整方案。為了使方案的字典序最小,我們在每次找到一個耗費桶數相同的方案時對已儲存的方案和新方案進行比較再決定是否更新方案。為了使這種比較快捷,在使用各種大小的桶對f 陣列進行更新時先大後小地進行。USACO 的官方題解正是這一思路。如果認為以上文字比較難理解可以閱讀官方程式或我的程式。

Category: 資料結構與演算法 View: 6,055 閱 Author: Dong

1. 揹包問題介紹

揹包問題不單單是一個簡單的演算法問題,它本質上代表了一大類問題,這類問題實際上是01線性規劃問題,其約束條件和目標函式如下:
自從dd_engi在2007年推出《揹包問題九講》之後,揹包問題的主要精髓基本已道盡。本文沒有嘗試對揹包問題的本質進行擴充套件或深入挖掘,而只是從有限的理解(這裡指對《揹包問題九講》的理解)出發,幫助讀者更快地學習《揹包問題九講》中的提到的各種揹包問題的主要演算法思想,並通過例項解釋了相應的演算法,同時給出了幾個揹包問題的經典應用。

2. 揹包問題及應用

dd_engi在《揹包問題九講》中主要提到四種揹包問題,分別為:01揹包問題,完全揹包問題,多重揹包問題,二維費用揹包問題。本節總結了這幾種揹包問題,並給出了其典型的應用以幫助讀者理解這幾種問題的本質。

2.1 01揹包問題

(1)問題描述

有N件物品和一個容量為V的揹包。第i件物品的費用是c[i],價值是w[i]。求解將哪些物品裝入揹包可使價值總和最大。

(2)狀態轉移方程

其中,f(i,v) 表示從前i件物品選擇若干物品裝到容量為v的揹包中產生的最大價值。當v=0時,f(i,v)初始化為0,表示題目不要求揹包一定剛好裝滿,而f(i,v)=inf/-inf(正無窮或負無窮)表示題目要求揹包一定要剛好裝滿。下面幾種揹包類似,以後不再贅述。

(3) 虛擬碼

從轉移方程上可以看出,前i個物品的最優解只依賴於前i-1個物品最優解,而與前i-2,i-3,…各物品最優無直接關係,可以利用這個特點優化儲存空間,即只申請一個一維陣列即可,演算法時間複雜度(O(VN))為:

1

2

3

4

5

fori=1..N

forv=V..0

f[v]=max{f[v],f[v-c[i]]+w[i]};

注意v的遍歷順序!!!

下面幾種揹包用到類似優化,以後不再贅述。

(4) 舉例

V=10,N=3,c[]={3,4,5}, w={4,5,6}

(1)揹包不一定裝滿

計算順序是:從右往左,自上而下:

(2)揹包剛好裝滿

計算順序是:從右往左,自上而下。注意初始值,其中-inf表示負無窮

(5) 經典題型

[1] 你有一堆石頭質量分別為W1,W2,W3…WN.(W<=100000,N <30)現在需要你將石頭合併為兩堆,使兩堆質量的差為最小。

[2] 給一個整數的集合,要把它分成兩個集合,要兩個集合的數的和最接近

[3] 有一個箱子容量為V(正整數,0≤V≤20000),同時有n個物品(0小於n≤30),每個物品有一個體積(正整數)。要求從n個物品中,任取若干個裝入箱內,使箱子的剩餘空間為最小。

2.2 完全揹包問題

(1)問題描述

有N種物品和一個容量為V的揹包,每種物品都有無限件可用。第i種物品的費用是c[i],價值是w[i]。求解將哪些物品裝入揹包可使這些物品的費用總和不超過揹包容量,且價值總和最大。

(2)狀態轉移方程

或者:

(3) 虛擬碼

1

2

3

4

5

fori=1..N

forv=0..V

f[v]=max{f[v],f[v-c[i]]+w[i]};

注意v的遍歷順序!!!

注意,時間複雜度仍為:O(VN).

(4) 舉例

V=10,N=3,c[]={3,4,5}, w={4,5,6}

(1)揹包不一定裝滿

計算順序是:從左往右,自上而下:

(2)揹包剛好裝滿

計算順序是:從左往右,自上而下。注意初始值,其中-inf表示負無窮

(5) 經典題型

[1] 找零錢問題:有n種面額的硬幣,每種硬幣無限多,至少用多少枚硬幣表示給定的面值M?

2.3 多重揹包問題

(1)問題描述

有N種物品和一個容量為V的揹包。第i種物品最多有n[i]件可用,每件費用是c[i],價值是w[i]。求解將哪些物品裝入揹包可使這些物品的費用總和不超過揹包容量,且價值總和最大。

(2)狀態轉移方程

(3) 解題思想

用以下方法轉化為普通01揹包問題:將第i種物品分成若干件物品,其中每件物品有一個係數,這件物品的費用和價值均是原來的費用和價值乘以這個係數。使這些係數分別為 1,2,4,…,2^(k-1),n[i]-2^k+1,且k是滿足n[i]-2^k+1>0的最大整數。例如,如果n[i]為13,就將這種 物品分成係數分別為1,2,4,6的四件物品。這種方法能保證對於0..n[i]間的每一個整數,均可以用若干個係數的和表示。這個很容易證明,證明過程中用到以下定理:任何一個整數n均可以表示成:n=a0*2^0+a1*2^1+…+ak*2^k,其中ak=0或者1(實際上就是n的二進位制分解),

定理:一個正整數n可以被分解成1,2,4,…,2^(k-1),n-2^k+1(k是滿足n-2^k+1>0的最大整數)的形式,且1~n之內的所有整數均可以唯一表示成1,2,4,…,2^(k-1),n-2^k+1中某幾個數的和的形式。

該定理的證明如下:

(1) 數列1,2,4,…,2^(k-1),n-2^k+1中所有元素的和為n,所以若干元素的和的範圍為:[1, n];

(2)如果正整數t<= 2^k – 1,則t一定能用1,2,4,…,2^(k-1)中某幾個數的和表示,這個很容易證明:我們把t的二進位制表示寫出來,很明顯,t可以表示成n=a0*2^0+a1*2^1+…+ak*2^(k-1),其中ak=0或者1,表示t的第ak位二進位制數為0或者1.

(3)如果t>=2^k,設s=n-2^k+1,則t-s<=2^k-1,因而t-s可以表示成1,2,4,…,2^(k-1)中某幾個數的和的形式,進而t可以表示成1,2,4,…,2^(k-1),s中某幾個數的和(加數中一定含有s)的形式。

(證畢!)

該演算法的時間複雜度為:O(V*sum(logn[i])).

(4) 經典題型

[1] 找零錢問題:有n種面額的硬幣,分別為a[0], a[1],…, a[n-1],每種硬幣的個數為b[0], b[1],…, b[n-1],至少用多少枚硬幣表示給定的面值M?

2.4 二維費用揹包

(1) 問題描述

二維費用的揹包問題是指:對於每件物品,具有兩種不同的費用;選擇這件物品必須同時付出這兩種代價;對於每種代價都有一個可付出的最大值(揹包容量)。問 怎樣選擇物品可以得到最大的價值。設這兩種代價分別為代價1和代價2,第i件物品所需的兩種代價分別為a[i]和b[i]。兩種代價可付出的最大值(兩種 揹包容量)分別為V和U。物品的價值為w[i]。

(2) 狀態轉移方程

(3) 演算法思想

採用同一維情況類似的方法求解

(4) 經典題型

有2n個整數,平均分成兩組,每組n個數,使這兩組數的和最接近。

3. 揹包總結

揹包問題實際上代表的是線性規劃問題,一般要考慮以下幾個因素已決定選取什麼樣的演算法:

(1) 約束條件,有一個還是兩個或者更多個,如果是一個,可能是01揹包,完全揹包或者多重揹包問題,如果有兩個約束條件,則可能是二維揹包問題。

(2) 優化目標,求最大值,還是最小值,還是總數(只需將max換成sum)

(3) 每種物品的個數限制,如果每種物品只有一個,只是簡單的01揹包問題,如果個數無限制,則是完全揹包問題,如果每種物品的個數有限制,則是多重揹包問題。

(4) 揹包是否要求剛好塞滿,注意不塞滿和塞滿兩種情況下初始值不同。

4. 參考資料

———————————————————————————————-

更多關於資料結構和演算法的介紹,請檢視:資料結構與演算法彙總