动态规划理论基础
(采用維特根斯坦的表述方式)
1.達成目的過程可以由不同階段組成
2.階段由達成目的的條件確定
(注:規定每一次走一步,第一步就是一個階段)
3.每個階段由不同的狀態組成
4.狀態是階段中可能面臨的所有情況
(注:第一步落腳點可能有多個,每個落腳點都是一個狀態)
5.在本階段狀態中選擇下階段中某一個狀態,這叫決策
(注:選擇下一步落在哪)
6.通過決策可以確定下階段狀態。
7.本階段狀態可以由上階段狀態和上階段決策推出
8.狀態轉移有三要素,本階段狀態,下階段狀態,決策
9.狀態轉移可以通過方程的形式表示
f(i+1)=T(f(i),u(i))f(i+1)=T(f(i),u(i)) f(i+1)=T(f(i),u(i))
(注:其中f為狀態,u為決策,T為根據題意產生的轉移函數,通過這個函數可以在最優的條件下得到題目想要的下階段狀態)
10.階段的存在先于狀態和決策的存在
11.狀態和決策決定階段的個數
12.所有能達成目的的過程可能有多種
13.能達成目的的狀態和決策總體上稱為策略
14.過程可以通過策略展示出來
15.達成目的有最優過程,因此有最優策略。
16.從某個階段開始直到最后階段的過程稱為子過程
17.動態規劃最優策略的子策略也是最優的
18.動態規劃未來與過去無關,這其實等價于上一條。
總結
- 上一篇: vue如何配置服务器端跨域_vue项目里
- 下一篇: (dp)数字三角形