當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

数学建模算法之动态规划

發(fā)布時(shí)間：2023/12/10 编程问答 36 豆豆

生活随笔收集整理的這篇文章主要介紹了数学建模算法之动态规划小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

數(shù)模一個(gè)大佬的博客

【動(dòng)態(tài)規(guī)劃】

1.1 動(dòng)態(tài)規(guī)劃的研究?jī)?nèi)容與學(xué)習(xí)方法

把多階段過(guò)程轉(zhuǎn)化為一系列單階段問(wèn)題再逐個(gè)求解；
一些與時(shí)間無(wú)關(guān)的靜態(tài)規(guī)劃（如線性規(guī)劃、非線性規(guī)劃），只要人為地引進(jìn)時(shí)間因素，把它視為多階段決策過(guò)程，！也可以用動(dòng)態(tài)規(guī)劃方法方便地求解，但是要必須對(duì)具體問(wèn)題進(jìn)行具體分析處理。可用于求解最短路線問(wèn)題、生產(chǎn)計(jì)劃問(wèn)題、資源分配問(wèn)題等多階段決策的優(yōu)化問(wèn)題；

它不象線性規(guī)劃那樣有一個(gè)標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá)式和明確定義的一組規(guī)則，而必須對(duì)具體問(wèn)題進(jìn)行具體分析處理。
因此，在學(xué)習(xí) 時(shí)，除了要對(duì)基本概念和方法正確理解外，應(yīng)以豐富的想象力去建立模型，用創(chuàng)造性的技巧去求解。（巧妙！）

1.2 典型例題

根據(jù)過(guò)程的時(shí)間變量是離散的還是連續(xù)的，分為離散時(shí)間決策過(guò)程（discrete-timedecision process）和連續(xù)時(shí)間決策過(guò)程（continuous-time decision process）；根據(jù)過(guò)程的演變是確定的還是隨機(jī)的，分為確定性決策過(guò)程分為確定性決策過(guò)程（deterministic decision process）和隨機(jī)性決策過(guò)程（stochastic decision process），其中應(yīng)用最廣的是確定性多階段決策過(guò)程。

例 1 最短路線問(wèn)題

例 2 生產(chǎn)計(jì)劃問(wèn)題

工廠生產(chǎn)某種產(chǎn)品，每單位（千件）的成本為 1（千元），每次開(kāi)工的固定成本為 3 （千元），工廠每季度的最大生產(chǎn)能力為 6（千件）。經(jīng)調(diào)查，市場(chǎng)對(duì)該產(chǎn)品的需求量第一、二、三、四季度分別為 2，3，2，4（千件）。如果工廠在第一、二季度將全年的需求都生產(chǎn)出來(lái)，自然可以降低成本（少付固定成本費(fèi)），但是對(duì)于第三、四季度才能上市的產(chǎn)品需付存儲(chǔ)費(fèi)，每季每千件的存儲(chǔ)費(fèi)為 0.5（千元）。還規(guī)定年初和年末這種產(chǎn)品均無(wú)庫(kù)存。試制定一個(gè)生產(chǎn)計(jì)劃，即安排每個(gè)季度的產(chǎn)量，使一年的總費(fèi)用（生產(chǎn)成本和存儲(chǔ)費(fèi)）最少。

2. 基本方程和計(jì)算方法

2.1 動(dòng)態(tài)規(guī)劃的基本概念和基本方程

一個(gè)多階段決策過(guò)程最優(yōu)化問(wèn)題的動(dòng)態(tài)規(guī)劃模型通常包含以下要素。

2.1.1 階段

階段(step)是對(duì)整個(gè)過(guò)程的自然劃分。通常根據(jù)時(shí)間順序或空間順序特征來(lái)劃分階段，以便按階段的次序解優(yōu)化問(wèn)題。階段變量一般用k = 1,2,…,n 表示。

在例 1 中由 A 出發(fā)為 k = 1，由 (i = 1,2) 出發(fā)為 k = 2 ，依此下去從 (i = 1,2) 出發(fā)為 k = 6 ，共 n = 6個(gè)階段。在例 2 中按照第一、二、三、四季度分為k = 1,2,3,4，共四個(gè)階段。

2.1.2 狀態(tài)

狀態(tài)（state）表示每個(gè)階段開(kāi)始時(shí)過(guò)程所處的自然狀況。它應(yīng)能描述過(guò)程的特征并且無(wú)后效性，即當(dāng)某階段的狀態(tài)變量給定時(shí)，這個(gè)階段以后過(guò)程的演變與該階段以前各階段的狀態(tài)無(wú)關(guān)。通常還要求狀態(tài)是直接或間接可以觀測(cè)的。

根據(jù)過(guò)程演變的具體情況，狀態(tài)變量可以是離散的或連續(xù)的。為了計(jì)算的方便有時(shí) 將連續(xù)變量離散化；為了分析的方便有時(shí)又將離散變量視為連續(xù)的。狀態(tài)變量簡(jiǎn)稱為狀態(tài)。

2.1.3 決策

當(dāng)一個(gè)階段的狀態(tài)確定后，可以作出各種選擇從而演變到下一階段的某個(gè)狀態(tài)，這種選擇手段稱為決策（decision），在最優(yōu)控制問(wèn)題中也稱為控制（control）。

決策變量簡(jiǎn)稱決策。
2.1.4 策略

2.1.5. 狀態(tài)轉(zhuǎn)移方程
在確定性過(guò)程中，一旦某階段的狀態(tài)和決策為已知，下階段的狀態(tài)便完全確定。用狀態(tài)轉(zhuǎn)移方程（equation of state transition）表示這種演變規(guī)律，寫作

2.1.6. 指標(biāo)函數(shù)和最優(yōu)值函數(shù)

2.1.7 最優(yōu)策略和最優(yōu)軌線

2.1.8 遞歸方程

3.用 lingo 求解例 1 最短路線問(wèn)題。

model: Title Dynamic Programming; sets: vertex/A,B1,B2,C1,C2,C3,C4,D1,D2,D3,E1,E2,E3,F1,F2,G/:L; road(vertex,vertex)/A B1,A B2,B1 C1,B1 C2,B1 c3,B2 C2,B2 C3,B2 C4, C1 D1,C1 D2,C2 D1,C2 D2,C3 D2,C3 D3,C4 D2,C4 D3, D1 E1,D1 E2,D2 E2,D2 E3,D3 E2,D3 E3, E1 F1,E1 F2,E2 F1,E2 F2,E3 F1,E3 F2,F1 G,F2 G/:D; endsets data: D=5 3 1 3 6 8 7 6 6 8 3 5 3 3 8 4 2 2 1 2 3 3 3 5 5 2 6 6 4 3; L=0,,,,,,,,,,,,,,,; enddata @for(vertex(i)|i#GT#1:L(i)=@min(road(j,i):L(j)+D(j,i))); end

本節(jié)的動(dòng)態(tài)規(guī)劃基本思想和一些經(jīng)典例題就先寫到這里。

參考文獻(xiàn)

總結(jié)

以上是生活随笔為你收集整理的数学建模算法之动态规划的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：夺命雷公狗---DEDECMS----2
下一篇： gitlab应用