1. 程式人生 > >建立動態規劃數學模型的步驟

建立動態規劃數學模型的步驟

    “最優化原理”是動態規劃的核心,所有動態規劃問題的遞推關係都是根據這個原理建立起來的,並且根據遞推關係依次計算,最終可求得動態規劃問題的解。

一般來說,利用動態規劃求解實際問題需先建立問題的動態模型,具體步驟如下:

⒈將問題按時間或空間次序劃分成若干階段。有些問題不具有時空次序,也可以人為地引進時空次序,劃分階段。

⒉正確選擇狀態變數。這一步是形成動態模型的關鍵,狀態變數是動態規劃模型中最重要的引數。一般來說,狀態變數應具有以下三個特性:

    ⑴要能夠用來描述決策過程的演變特徵。
    ⑵要滿足無後效性。即如果某階段狀態已給定後,則以後過程的進展不受以前各狀態的影響,也就是說,過去的歷史只通過當前的狀態去影響未來的發展。
    ⑶遞推性。即由k階段的狀態變數
及決策變數uk可以計算出k+1階段的狀態變數

⒊確定決策變數及允許決策變數集合Dk()。

⒋根據狀態變數之間的遞推關係,寫出狀態轉移方程:
=T(())

⒌建立指標函式。一般用()描寫階段效應,)表示k—n階段的最優子策略函式。 

⒍建立動態規劃基本方程:
 

以上是建立動態規劃模型的過程,這個過程是正確求解動態規劃的基礎。

    在動態規劃基本方程中, (), =T()都是已知函式,最優子策略)與
)之間是遞推關係,要求出)及(),需要先求出),這就決定了應用動態規劃基本方程求最優策略總是逆著階段的順序進行的。由後向前逐步計算,最終可以算出全過程的最優策略函式值及最優策略。