動態規劃的思考（三）

阿新 • • 發佈：2019-01-20

from [http://blog.csdn.net/thisinnocence]

1 一個問題：換零錢方式的統計

SICP 第一章 1.2.2 樹形遞迴中，有這麼一問題：給了半美元，四分之一美元，10美分，5美分和1美分的硬幣，將1美元換成零錢，一共有多少種不同方式？更一般的問題是，給定了任意數量的現金，我們能寫一個程式，計算出所有換零錢方式的種數嗎？

2 動態規劃的基本模型

動態規劃（Dynamic programming，DP），是研究一類最優化問題的方法，通過把原問題分解為相對簡單的子問題的方式求解複雜問題。動態規劃處理的也就是是多階段決策最優化問題，這一類問題可將過程分成若干個互相聯絡的階段，在每一階段都作出決策，從而使整個過程達到最好的結果。因此各個階段決策的選取不能任意確定，它依賴於當前面臨的狀態，又影響以後的發展。當各個階段決策確定後，就組成一個決策序列，從而也就確定了整個過程的一條活動路線。這種把一個問題看做是一個前後關聯具有鏈狀結構的多階段過程稱為多階段決策過程。動態規劃著名的應用例項有：求解最短路徑問題，揹包問題，專案管理，網路流優化等。動態規劃的基本模型如下：

確定問題的決策物件
對決策過程劃分階段
對各階段確定狀態變數
根據狀態變數確定費用函式和目標函式
建立各階段狀態變數的轉移過程，確定狀態轉移方程

3 使用動態規劃的一般前提

3.1 滿足動態規劃的最優化原理

作為整個過程的最優策略具有如下性質：無論過去的狀態和決策如何，對前面的決策所形成的當前狀態而言，餘下的諸決策必須構成最優策略。

通俗理解就是子問題的區域性最優將導致整個問題的全域性最優，即問題具有最優子結構的性質，也就是說一個問題的最優解只取決於其子問題的最優解，非最優解對問題的求解沒有影響。

3.2 滿足動態規劃的無後效性原則

所謂無後效性原則，指的是這樣一種性質：某階段的狀態一旦確定，則此後過程的演變不再受此前各狀態及決策的影響。也就是說，“未來與過去無關”，當前的狀態是此前歷史的一個完整總結，此前的歷史只能通過當前的狀態去影響過程未來的演變。

具體地說，如果一個問題被劃分各個階段之後，階段 I 中的狀態只能由階段 I+1 中的狀態通過狀態轉移方程得來，與其他狀態沒有關係，特別是與未發生的狀態沒有關係，這就是無後效性。從圖論的角度去考慮，如果把這個問題中的狀態定義成圖中的頂點，兩個狀態之間的轉移定義為邊，轉移過程中的權值增量定義為邊的權值，則構成一個有向無環加權圖，因此，這個圖可以進行“拓撲排序”，至少可以按他們拓撲排序的順序去劃分階段。

4 動態規劃設計方法

4.1 一般方法

一般由初始狀態開始，通過對中間階段決策的選擇，達到結束狀態。這些決策形成了一個決策序列，同時確定了完成整個過程的一條活動路線。步驟為：

劃分階段：按照問題的時間或空間特徵，把問題分為若干個階段。在劃分階段時，注意劃分後的階段一定要是有序的或者是可排序的，否則問題就無法求解。
確定狀態和狀態變數：將問題發展到各個階段時所處於的各種客觀情況用不同的狀態表示出來。當然，狀態的選擇要滿足無後效性。
確定決策並寫出狀態轉移方程：因為決策和狀態轉移有著天然的聯絡，狀態轉移就是根據上一階段的狀態和決策來匯出本階段的狀態。所以如果確定了決策，狀態轉移方程也就可寫出。但事實上常常是反過來做，根據相鄰兩段各狀態之間的關係來確定決策。
尋找邊界條件：給出的狀態轉移方程是一個遞推式，需要一個遞推的終止條件或邊界條件。
程式設計實現：動態規劃的主要難點在於理論上的設計，一旦設計完成，實現部分就會非常簡單。

4.2 逆向推導

逆向思維法是指從問題目標狀態出發倒推回初始狀態或邊界狀態的思維方法。如果原問題可以分解成幾個本質相同、規模較小的問題，很自然就會聯想到從逆向思維的角度尋求問題的解決。動態規劃與分治法最大的不同在於分解出來的各個子問題的性質不同：

分治法要求各個子問題是獨立的(即不包含公共的子問題)，因此一旦遞迴地求出各個子問題的解後，便可自下而上地將子問題的解合併成原問題的解。如果各子問題是不獨立的，那麼分治法就要做許多不必要的工作，重複地解公共的子問題。
動態規劃與分治法的不同之處在於動態規劃允許這些子問題不獨立(即各子問題可包含公共的子問題)，它對每個子問題只解一次，並將結果儲存起來，避免每次碰到時都要重複計算。這就是動態規劃高效的一個原因。

動態規劃的逆向推導步驟：

分析最優值的結構，刻畫其結構特徵；
遞迴地定義最優值；
按自底向上或自頂向下記憶化的方式計算最優值；

4.3 正向推導

正向思維法是指從初始狀態或邊界狀態出發，利用某種規則不斷到達新的狀態，直到問題目標狀態的方法。動態規劃的正向思維法，正是從已知最優值的初始狀態或邊界狀態開始，按照一定的次序遍歷整個狀態空間，遞推出每個狀態所對應問題的最優值。
在正向思維法中，不再區分原問題和子問題，將動態規劃的過程看成是從狀態到狀態的轉移。將所有的狀態構造出一個狀態空間，並在狀態空間中設想一個狀態網路，若對兩個狀態i,j，存在決策變數di使t(i，di)=j，則向狀態網路新增有向邊。給定己知最優值的初始狀態或邊界狀態，可以沿著有向邊推廣到未知最優值的新狀態，利用狀態轉移方程得到新狀態的狀態變數的最優值。我們可以用這種方式遍歷整個狀態空間，得到每個狀態的狀態變數的最優值。
動態規劃的正向推導步驟：

構造狀態網路；
根據狀態轉移關係和狀態轉移方程建立最優值的遞推計算式：
按階段的先後次序計算每個狀態的最優值；

動態規劃需要按階段遍歷整個狀態空間，因此動態規劃的效率取決於狀態空間的大小和計算每個狀態最優值的開銷：如果狀態空間的大小是多項式的，那麼應用動態規劃的演算法就是多項式時間的；如果狀態空間的大小是指數的，那麼應用動態規劃的演算法也是指數時間的。因此，找一個好的狀態劃分對動態規劃的效率是至關重要的。

動態規劃的思考（三）

1 一個問題：換零錢方式的統計

2 動態規劃的基本模型

3 使用動態規劃的一般前提

3.1 滿足動態規劃的最優化原理

3.2 滿足動態規劃的無後效性原則

4 動態規劃設計方法

4.1 一般方法

4.2 逆向推導

4.3 正向推導

動態規劃專題（三）——數位DP

動態規劃的思考（三）

動態規劃入門（一）

spring cloud實戰與思考（三）微服務之間通過fiegn上傳一組文件（下）

動態規劃專題（五）——斜率優化DP

LeetCode-動態規劃總結（二）

LeetCode-動態規劃總結（一）

redis原始碼分析與思考（三）——字典中鍵的兩種hash演算法

動態規劃專題（二）——樹形DP

Unity動態編輯Terrain（三）自定義筆刷

百度大腦人臉識別深度驗證與思考（三）之顏值識別

動態規劃演算法---（二）

動態規劃演算法---（一）

關於大型網站技術演進的思考（三）--儲存的瓶頸（3）

關於大型網站技術演進的思考（三）：儲存的瓶頸（3）

Python開發動態網頁基礎（三）

學習動態規劃DP（一）——DAG模型

動態規劃第五講——leetcode上的題目動態規劃彙總（上）

7.21 暑假集訓——動態規劃篇（二）

動態規劃例項（八）：最小編輯距離

動態規劃的思考（三）

1 一個問題：換零錢方式的統計

2 動態規劃的基本模型

3 使用動態規劃的一般前提

3.1 滿足動態規劃的最優化原理

3.2 滿足動態規劃的無後效性原則

4 動態規劃設計方法

4.1 一般方法

4.2 逆向推導

4.3 正向推導

相關推薦