最优控制问题求解综述
最優(yōu)控制理論是研究和解決從一切可能的控制方案中尋找最優(yōu)解的一門,解決最優(yōu)控制問題的主要方法有古典變分法、極小值原理和動態(tài)規(guī)劃。最優(yōu)控制理論已被應(yīng)用于綜合和設(shè)計(jì)最速控制系統(tǒng)、最省燃料控制系統(tǒng)、最小能耗控制系統(tǒng)等。同時,這篇綜述也闡釋了幾種常見方法之間的關(guān)系。
1、最優(yōu)控制問題基本介紹
最優(yōu)控制是使控制系統(tǒng)的性能指標(biāo)實(shí)現(xiàn)最優(yōu)化的基本條件和綜合方法,是現(xiàn)代控制理論的核心之一,是從大量實(shí)際問題中提煉出來的。它所研究的問題可以概括為:對一個受控的動力學(xué)系統(tǒng)或運(yùn)動過程,從一類允許的控制方案中找出一個最優(yōu)的控制方案,使系統(tǒng)的運(yùn)動在由某個初始狀態(tài)轉(zhuǎn)移到指定的目標(biāo)狀態(tài)的同時,其性能指標(biāo)最優(yōu)。最優(yōu)控制是最優(yōu)化方法的一個應(yīng)用。從數(shù)學(xué)意義上說,最優(yōu)化方法是一種求極值的方法,即在一組約束為等式或不等式的條件下,使系統(tǒng)的目標(biāo)函數(shù)達(dá)到極值,即最大值或最小值。從經(jīng)濟(jì)意義上說,是在一定的人力、物力和財(cái)力資源條件下,是經(jīng)濟(jì)效果達(dá)到最大(如產(chǎn)值、利潤),或者在完成規(guī)定的生產(chǎn)或經(jīng)濟(jì)任務(wù)下,使投入的人力、物力和財(cái)力等資源為最少。
控制理論發(fā)展到今天,經(jīng)歷了古典控制理論和現(xiàn)代控制理論兩個重要發(fā)展階段,現(xiàn)已進(jìn)入了以大系統(tǒng)理論和理論為核心的第三個階段。對于確定性系統(tǒng)的最優(yōu)控制理論,實(shí)際是從20世紀(jì)50年代才開始真正發(fā)展起來的,它以1956年原蘇聯(lián)龐特里亞金(Pontryagin)提出的極大值原理和1957年貝爾曼提出的動態(tài)規(guī)劃法為標(biāo)志。時至今日,隨著數(shù)字技術(shù)和電子計(jì)算機(jī)的快速發(fā)展,最優(yōu)控制的應(yīng)用已不僅僅局限于高端的航空航天領(lǐng)域,而更加滲入到生產(chǎn)過程、軍事行動、經(jīng)濟(jì)活動以及人類的其他有目的的活動中,對于國民經(jīng)濟(jì)和國防事業(yè)起著非常重要的作用。
對于靜態(tài)優(yōu)化的方法,解決的主要是如何求解函數(shù)的極值問題;變分法則被用來求解泛函的極值問題;極小值原理的方法,適用于類似最短時間控制、最少燃料控制的問題。另外,還有線性系統(tǒng)二次型指標(biāo)的最優(yōu)控制,即線性二次型問題。與解析法相比,用最優(yōu)控制理論設(shè)計(jì)系統(tǒng)有如下的特點(diǎn):
(1)適用于多變量、非線性、時變系統(tǒng)的設(shè)計(jì)。
(2)初始條件可以任意。
(3)可以滿足多個目標(biāo)函數(shù)的要求,并可用于多個約束的情況。
2、最優(yōu)控制的求解方法
2.1 變分法
變分法是求解泛函極值的一種經(jīng)典方法,可以確定容許控制為開集的最優(yōu)控制函數(shù),也是最優(yōu)控制問題的一種重要工具。掌握變分法的基本原理,還有助于理解以最小值原理和動態(tài)規(guī)劃等最優(yōu)控制理論的思想和內(nèi)容。
但是,變分法作為一種古典的求解最優(yōu)控制的方法,只有當(dāng)控制向量u(t)不受任何約束,其容許控制集合充滿整個m維控制空間,用古典變分法來處理等式約束條件下的最優(yōu)控制問題才是行之有效的。在許多實(shí)際控制問題中,控制函數(shù)的取值常常受到封閉性的邊界限制,如方向舵只能在兩個極限值范圍內(nèi)轉(zhuǎn)動,電動機(jī)的只能在正負(fù)的最大值范圍內(nèi)產(chǎn)生等。因此,古典變分法不適于解決許多重要的實(shí)際最優(yōu)控制問題。
2.2 最小值原理
極小值原理是對經(jīng)典變分法的擴(kuò)展,可以解決經(jīng)典變分法無法解決的最優(yōu)控制問題。也就是當(dāng)控制有約束,哈密頓函數(shù)H對U不可微時,要用極小值原理。所得出的最優(yōu)控制必要條件與變分法所得的條件的差別,僅在于用哈密頓函數(shù)在最優(yōu)控制上取值的條件代替,可以看出,后者可以作為前者的特殊情況。其他條件包括正則方程,橫截條件,邊界條件等都一樣。需要注意的是,極小值原理解決最短時間控制問題時,最短時間的控制量只能取約束的邊界值+1或-1;而最少燃料控制的控制量可取邊界值+1、-1、0。
用極小值原理解非線性系統(tǒng)的最優(yōu)控制將導(dǎo)致非線性兩點(diǎn)邊值問題,這類問題求解是很困難的。即使系統(tǒng)是線性的,但當(dāng)指標(biāo)函數(shù)是最短時間、最少燃料這種形式,要求得到最優(yōu)控制的解析表達(dá)式,并構(gòu)成反饋控制(即把U(t)表示為X(t)的函數(shù))也是非常困難的。 若系統(tǒng)是線性的,指標(biāo)函數(shù)是二次型的,可以求得線性最優(yōu)反饋控制律。
2.3 動態(tài)規(guī)劃
動態(tài)規(guī)劃又稱為多級決策理論,是貝爾曼提出的一種非線性規(guī)劃方法。它將一個多級決策問題化為一系列單極決策問題,從最后一級狀態(tài)開始到初始狀態(tài)為止,逆向遞推求解最優(yōu)決策。動態(tài)規(guī)劃法原理簡明,適用于計(jì)算機(jī)求解,在許多理論問題的中,都應(yīng)用到動態(tài)規(guī)劃的思路。
動態(tài)規(guī)劃是求解最優(yōu)化問題的重要方法,在應(yīng)用動態(tài)規(guī)劃時,有一個前提條件是系統(tǒng)的狀態(tài)變量必須滿足“無后效性”。所謂無后效性的概念是:在任一時刻,系統(tǒng)狀態(tài)為x(t),以后的狀態(tài)僅決定于x(t)以及x(t)到達(dá)終點(diǎn)時刻的控制策略,而與以前的狀態(tài)和以前的控制策略無關(guān)。因此,在應(yīng)用動態(tài)規(guī)劃方法時,要注意狀態(tài)變量的選取,使之滿足“無后效性”的條件。例如,討論物體在空間運(yùn)動時,不僅選用物體的空間位置座位狀態(tài)變量,而且要將速度變量也包括在狀態(tài)變量之內(nèi),以便滿足“無后效性”的條件。動態(tài)規(guī)劃法的局限性還表現(xiàn)在所謂的“維數(shù)災(zāi)難”問題:當(dāng)狀態(tài)變量的維數(shù)增加,要求計(jì)算機(jī)內(nèi)存成指數(shù)倍增長,計(jì)算工作量也大大增加。此外,求解連續(xù)決策過程采用的動態(tài)規(guī)劃法得到的HJB方程是偏微分方程,求解HJB方程也是相當(dāng)困難的。動態(tài)規(guī)劃雖然提供的是充分條件,但是,由于連續(xù)型系統(tǒng)的HJB方程難于求解而不能滿足實(shí)際需要。
2.4 線性二次型最優(yōu)控制
線性二次型問題的實(shí)用意義在于:把它所得到的最優(yōu)反饋控制與非線性系統(tǒng)的開環(huán)最優(yōu)控制結(jié)合起來,可減少開環(huán)控制的誤差,達(dá)到更精確的控制的目的。
與經(jīng)典控制問題相比,線性二次型問題有兩個顯著的特點(diǎn):第一,它是多輸入多輸出動態(tài)系統(tǒng)的控制問題,其中包括了作為特例的單輸入單輸出情形;第二,它的性能指標(biāo)是綜合性的,既包含有誤差的成分,又包含有控制能量的成分。根據(jù)線性的最優(yōu)反饋控制律,即控制量正比與狀態(tài)變量。把這種線性二次型問題的最優(yōu)控制與非線性系統(tǒng)的開環(huán)控制結(jié)合起來,還可減少開環(huán)控制的誤差。線性二次型問題的最優(yōu)控制一般可分狀態(tài)調(diào)節(jié)器問題和伺服跟蹤問題兩大類。
對于終端時刻tft_ftf?有限的連續(xù)系統(tǒng)狀態(tài)問題,要求加權(quán)陣P、Q為對稱半正定,R為對稱正定。
3、三種方法之間的相互關(guān)系
動態(tài)規(guī)劃法、極小值原理和變分法,都是求解最優(yōu)控制問題的重要方法。由動態(tài)規(guī)劃的HJB方程,可以推得變分法中的歐拉方程和橫截條件:也可以推得極小值原理的必要條件。
變分法對解決開集約束的最優(yōu)控制問題十分有效,但對于處理閉集性約束就無能為力了。變分法與極小值原理都可以解微分方程所描述的變分問題作為目標(biāo),結(jié)果得出了一組常微分方程所表示的必要條件。這三種方法要求的條件不同,其中屬動態(tài)規(guī)劃要求最高。在所要求的條件都滿足的情況下,使用這三種方法所得結(jié)論相同。
參考文獻(xiàn):
[1] 胡壽松-最優(yōu)控制理論與系統(tǒng)[M].(第二版)北京:科學(xué)出版社,2005.
[2] 張蓮-現(xiàn)代控制理論.北京:清華大學(xué)出版社,2008.1.
[3] 于長官-現(xiàn)代控制理論及應(yīng)用.哈爾冰工業(yè)大學(xué)出版社,2005.1.
[4] 舒欣梅-現(xiàn)代控制理論基礎(chǔ).西安:西安電子科技大學(xué)出版社,2008.2.
[5] 劉豹-現(xiàn)代控制理論.(3版)北京:機(jī)械工業(yè)出版社,2006.7.
總結(jié)
以上是生活随笔為你收集整理的最优控制问题求解综述的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度强化学习第2课|马尔可夫决策过程
- 下一篇: 收藏we-hjb的BLOG