数学建模算法之动态规划
數(shù)模一個(gè)大佬的博客
【動(dòng)態(tài)規(guī)劃】
1.1 動(dòng)態(tài)規(guī)劃的研究?jī)?nèi)容與學(xué)習(xí)方法
把多階段過(guò)程轉(zhuǎn)化為一系列單階段問(wèn)題再逐個(gè)求解;
一些與時(shí)間無(wú)關(guān)的靜態(tài)規(guī)劃(如線性規(guī)劃、非線性規(guī)劃),只要人為地引進(jìn)時(shí)間因素,把它視為多階段決策過(guò)程,!也可以用動(dòng)態(tài)規(guī)劃方法方便地求解,但是要必須對(duì)具體問(wèn)題進(jìn)行具體分析處理。可用于求解最短路線問(wèn)題、 生產(chǎn)計(jì)劃問(wèn)題、資源分配問(wèn)題等多階段決策的優(yōu)化問(wèn)題;
它不象線性規(guī)劃那樣有一個(gè)標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá)式和明確定義的一組規(guī)則,而必須對(duì)具體問(wèn)題進(jìn)行具體分析處理。
因此,在學(xué)習(xí) 時(shí),除了要對(duì)基本概念和方法正確理解外,應(yīng)以豐富的想象力去建立模型,用創(chuàng)造性的 技巧去求解。(巧妙!)
1.2 典型例題
根據(jù)過(guò)程的時(shí)間變量是離散的還是連續(xù)的,分為離散時(shí)間決策過(guò)程(discrete-timedecision process)和連續(xù)時(shí)間決策過(guò)程(continuous-time decision process);根據(jù)過(guò)程的演變是確定的還是隨機(jī)的,分為確定性決策過(guò)程分為確定性決策過(guò)程(deterministic decision process)和隨機(jī)性決策過(guò)程(stochastic decision process),其中應(yīng)用最廣的是確定性多階段決策過(guò)程。
例 1 最短路線問(wèn)題
例 2 生產(chǎn)計(jì)劃問(wèn)題
工廠生產(chǎn)某種產(chǎn)品,每單位(千件)的成本為 1(千元),每次開(kāi)工的固定成本為 3 (千元),工廠每季度的最大生產(chǎn)能力為 6(千件)。經(jīng)調(diào)查,市場(chǎng)對(duì)該產(chǎn)品的需求量第 一、二、三、四季度分別為 2,3,2,4(千件)。如果工廠在第一、二季度將全年的需 求都生產(chǎn)出來(lái),自然可以降低成本(少付固定成本費(fèi)),但是對(duì)于第三、四季度才能上 市的產(chǎn)品需付存儲(chǔ)費(fèi),每季每千件的存儲(chǔ)費(fèi)為 0.5(千元)。還規(guī)定年初和年末這種產(chǎn)品 均無(wú)庫(kù)存。試制定一個(gè)生產(chǎn)計(jì)劃,即安排每個(gè)季度的產(chǎn)量,使一年的總費(fèi)用(生產(chǎn)成本 和存儲(chǔ)費(fèi))最少。
2. 基本方程和計(jì)算方法
2.1 動(dòng)態(tài)規(guī)劃的基本概念和基本方程
一個(gè)多階段決策過(guò)程最優(yōu)化問(wèn)題的動(dòng)態(tài)規(guī)劃模型通常包含以下要素。
2.1.1 階段
階段(step)是對(duì)整個(gè)過(guò)程的自然劃分。通常根據(jù)時(shí)間順序或空間順序特征來(lái)劃分階段,以便按階段的次序解優(yōu)化問(wèn)題。階段變量一般用k = 1,2,…,n 表示。
在例 1 中由 A 出發(fā)為 k = 1,由 (i = 1,2) 出發(fā)為 k = 2 ,依此下去從 (i = 1,2) 出發(fā)為 k = 6 ,共 n = 6個(gè)階段。在例 2 中按照第一、二、三、四季度分為k = 1,2,3,4,共四個(gè)階段。
2.1.2 狀態(tài)
狀態(tài)(state)表示每個(gè)階段開(kāi)始時(shí)過(guò)程所處的自然狀況。它應(yīng)能描述過(guò)程的特征并 且無(wú)后效性,即當(dāng)某階段的狀態(tài)變量給定時(shí),這個(gè)階段以后過(guò)程的演變與該階段以前各 階段的狀態(tài)無(wú)關(guān)。通常還要求狀態(tài)是直接或間接可以觀測(cè)的。
根據(jù)過(guò)程演變的具體情況,狀態(tài)變量可以是離散的或連續(xù)的。為了計(jì)算的方便有時(shí) 將連續(xù)變量離散化;為了分析的方便有時(shí)又將離散變量視為連續(xù)的。 狀態(tài)變量簡(jiǎn)稱為狀態(tài)。
2.1.3 決策
當(dāng)一個(gè)階段的狀態(tài)確定后,可以作出各種選擇從而演變到下一階段的某個(gè)狀態(tài),這 種選擇手段稱為決策(decision),在最優(yōu)控制問(wèn)題中也稱為控制(control)。
決策變量簡(jiǎn)稱決策。
2.1.4 策略
2.1.5. 狀態(tài)轉(zhuǎn)移方程
在確定性過(guò)程中,一旦某階段的狀態(tài)和決策為已知,下階段的狀態(tài)便完全確定。用 狀態(tài)轉(zhuǎn)移方程(equation of state transition)表示這種演變規(guī)律,寫作
2.1.6. 指標(biāo)函數(shù)和最優(yōu)值函數(shù)
2.1.7 最優(yōu)策略和最優(yōu)軌線
2.1.8 遞歸方程
3.用 lingo 求解例 1 最短路線問(wèn)題。
本節(jié)的動(dòng)態(tài)規(guī)劃基本思想和一些經(jīng)典例題就先寫到這里。
參考文獻(xiàn)
總結(jié)
以上是生活随笔為你收集整理的数学建模算法之动态规划的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 夺命雷公狗---DEDECMS----2
- 下一篇: gitlab应用