动态规划理论基础
(采用維特根斯坦的表述方式)
1.達成目的過程可以由不同階段組成
2.階段由達成目的的條件確定
(注:規(guī)定每一次走一步,第一步就是一個階段)
3.每個階段由不同的狀態(tài)組成
4.狀態(tài)是階段中可能面臨的所有情況
(注:第一步落腳點可能有多個,每個落腳點都是一個狀態(tài))
5.在本階段狀態(tài)中選擇下階段中某一個狀態(tài),這叫決策
(注:選擇下一步落在哪)
6.通過決策可以確定下階段狀態(tài)。
7.本階段狀態(tài)可以由上階段狀態(tài)和上階段決策推出
8.狀態(tài)轉(zhuǎn)移有三要素,本階段狀態(tài),下階段狀態(tài),決策
9.狀態(tài)轉(zhuǎn)移可以通過方程的形式表示
f(i+1)=T(f(i),u(i))f(i+1)=T(f(i),u(i)) f(i+1)=T(f(i),u(i))
(注:其中f為狀態(tài),u為決策,T為根據(jù)題意產(chǎn)生的轉(zhuǎn)移函數(shù),通過這個函數(shù)可以在最優(yōu)的條件下得到題目想要的下階段狀態(tài))
10.階段的存在先于狀態(tài)和決策的存在
11.狀態(tài)和決策決定階段的個數(shù)
12.所有能達成目的的過程可能有多種
13.能達成目的的狀態(tài)和決策總體上稱為策略
14.過程可以通過策略展示出來
15.達成目的有最優(yōu)過程,因此有最優(yōu)策略。
16.從某個階段開始直到最后階段的過程稱為子過程
17.動態(tài)規(guī)劃最優(yōu)策略的子策略也是最優(yōu)的
18.動態(tài)規(guī)劃未來與過去無關(guān),這其實等價于上一條。
總結(jié)
- 上一篇: vue如何配置服务器端跨域_vue项目里
- 下一篇: (dp)数字三角形