當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

最优控制问题求解综述

發(fā)布時間：2023/12/8 编程问答 80 豆豆

生活随笔收集整理的這篇文章主要介紹了最优控制问题求解综述小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

最優(yōu)控制理論是研究和解決從一切可能的控制方案中尋找最優(yōu)解的一門，解決最優(yōu)控制問題的主要方法有古典變分法、極小值原理和動態(tài)規(guī)劃。最優(yōu)控制理論已被應(yīng)用于綜合和設(shè)計(jì)最速控制系統(tǒng)、最省燃料控制系統(tǒng)、最小能耗控制系統(tǒng)等。同時，這篇綜述也闡釋了幾種常見方法之間的關(guān)系。

1、最優(yōu)控制問題基本介紹
　　最優(yōu)控制是使控制系統(tǒng)的性能指標(biāo)實(shí)現(xiàn)最優(yōu)化的基本條件和綜合方法，是現(xiàn)代控制理論的核心之一，是從大量實(shí)際問題中提煉出來的。它所研究的問題可以概括為：對一個受控的動力學(xué)系統(tǒng)或運(yùn)動過程，從一類允許的控制方案中找出一個最優(yōu)的控制方案，使系統(tǒng)的運(yùn)動在由某個初始狀態(tài)轉(zhuǎn)移到指定的目標(biāo)狀態(tài)的同時，其性能指標(biāo)最優(yōu)。最優(yōu)控制是最優(yōu)化方法的一個應(yīng)用。從數(shù)學(xué)意義上說，最優(yōu)化方法是一種求極值的方法，即在一組約束為等式或不等式的條件下，使系統(tǒng)的目標(biāo)函數(shù)達(dá)到極值，即最大值或最小值。從經(jīng)濟(jì)意義上說，是在一定的人力、物力和財(cái)力資源條件下，是經(jīng)濟(jì)效果達(dá)到最大（如產(chǎn)值、利潤），或者在完成規(guī)定的生產(chǎn)或經(jīng)濟(jì)任務(wù)下，使投入的人力、物力和財(cái)力等資源為最少。
　　控制理論發(fā)展到今天，經(jīng)歷了古典控制理論和現(xiàn)代控制理論兩個重要發(fā)展階段，現(xiàn)已進(jìn)入了以大系統(tǒng)理論和理論為核心的第三個階段。對于確定性系統(tǒng)的最優(yōu)控制理論，實(shí)際是從20世紀(jì)50年代才開始真正發(fā)展起來的，它以1956年原蘇聯(lián)龐特里亞金（Pontryagin）提出的極大值原理和1957年貝爾曼提出的動態(tài)規(guī)劃法為標(biāo)志。時至今日，隨著數(shù)字技術(shù)和電子計(jì)算機(jī)的快速發(fā)展，最優(yōu)控制的應(yīng)用已不僅僅局限于高端的航空航天領(lǐng)域，而更加滲入到生產(chǎn)過程、軍事行動、經(jīng)濟(jì)活動以及人類的其他有目的的活動中，對于國民經(jīng)濟(jì)和國防事業(yè)起著非常重要的作用。
　　對于靜態(tài)優(yōu)化的方法，解決的主要是如何求解函數(shù)的極值問題；變分法則被用來求解泛函的極值問題；極小值原理的方法，適用于類似最短時間控制、最少燃料控制的問題。另外，還有線性系統(tǒng)二次型指標(biāo)的最優(yōu)控制，即線性二次型問題。與解析法相比，用最優(yōu)控制理論設(shè)計(jì)系統(tǒng)有如下的特點(diǎn)：
　　（1）適用于多變量、非線性、時變系統(tǒng)的設(shè)計(jì)。
　　（2）初始條件可以任意。
　　（3）可以滿足多個目標(biāo)函數(shù)的要求，并可用于多個約束的情況。
　　2、最優(yōu)控制的求解方法
　　2.1 變分法
　　變分法是求解泛函極值的一種經(jīng)典方法，可以確定容許控制為開集的最優(yōu)控制函數(shù)，也是最優(yōu)控制問題的一種重要工具。掌握變分法的基本原理，還有助于理解以最小值原理和動態(tài)規(guī)劃等最優(yōu)控制理論的思想和內(nèi)容。
　　但是，變分法作為一種古典的求解最優(yōu)控制的方法，只有當(dāng)控制向量u（t）不受任何約束，其容許控制集合充滿整個m維控制空間，用古典變分法來處理等式約束條件下的最優(yōu)控制問題才是行之有效的。在許多實(shí)際控制問題中，控制函數(shù)的取值常常受到封閉性的邊界限制，如方向舵只能在兩個極限值范圍內(nèi)轉(zhuǎn)動，電動機(jī)的只能在正負(fù)的最大值范圍內(nèi)產(chǎn)生等。因此，古典變分法不適于解決許多重要的實(shí)際最優(yōu)控制問題。
　　2.2 最小值原理
　　極小值原理是對經(jīng)典變分法的擴(kuò)展，可以解決經(jīng)典變分法無法解決的最優(yōu)控制問題。也就是當(dāng)控制有約束，哈密頓函數(shù)H對U不可微時，要用極小值原理。所得出的最優(yōu)控制必要條件與變分法所得的條件的差別，僅在于用哈密頓函數(shù)在最優(yōu)控制上取值的條件代替，可以看出，后者可以作為前者的特殊情況。其他條件包括正則方程，橫截條件，邊界條件等都一樣。需要注意的是，極小值原理解決最短時間控制問題時，最短時間的控制量只能取約束的邊界值+1或-1；而最少燃料控制的控制量可取邊界值+1、-1、0。
　　用極小值原理解非線性系統(tǒng)的最優(yōu)控制將導(dǎo)致非線性兩點(diǎn)邊值問題，這類問題求解是很困難的。即使系統(tǒng)是線性的，但當(dāng)指標(biāo)函數(shù)是最短時間、最少燃料這種形式，要求得到最優(yōu)控制的解析表達(dá)式，并構(gòu)成反饋控制（即把U（t）表示為X（t）的函數(shù)）也是非常困難的。若系統(tǒng)是線性的，指標(biāo)函數(shù)是二次型的，可以求得線性最優(yōu)反饋控制律。
　　2.3 動態(tài)規(guī)劃
　　動態(tài)規(guī)劃又稱為多級決策理論，是貝爾曼提出的一種非線性規(guī)劃方法。它將一個多級決策問題化為一系列單極決策問題，從最后一級狀態(tài)開始到初始狀態(tài)為止，逆向遞推求解最優(yōu)決策。動態(tài)規(guī)劃法原理簡明，適用于計(jì)算機(jī)求解，在許多理論問題的中，都應(yīng)用到動態(tài)規(guī)劃的思路。
　　動態(tài)規(guī)劃是求解最優(yōu)化問題的重要方法，在應(yīng)用動態(tài)規(guī)劃時，有一個前提條件是系統(tǒng)的狀態(tài)變量必須滿足“無后效性”。所謂無后效性的概念是：在任一時刻，系統(tǒng)狀態(tài)為x(t)，以后的狀態(tài)僅決定于x(t)以及x(t)到達(dá)終點(diǎn)時刻的控制策略，而與以前的狀態(tài)和以前的控制策略無關(guān)。因此，在應(yīng)用動態(tài)規(guī)劃方法時，要注意狀態(tài)變量的選取，使之滿足“無后效性”的條件。例如，討論物體在空間運(yùn)動時，不僅選用物體的空間位置座位狀態(tài)變量，而且要將速度變量也包括在狀態(tài)變量之內(nèi)，以便滿足“無后效性”的條件。動態(tài)規(guī)劃法的局限性還表現(xiàn)在所謂的“維數(shù)災(zāi)難”問題：當(dāng)狀態(tài)變量的維數(shù)增加，要求計(jì)算機(jī)內(nèi)存成指數(shù)倍增長，計(jì)算工作量也大大增加。此外，求解連續(xù)決策過程采用的動態(tài)規(guī)劃法得到的HJB方程是偏微分方程，求解HJB方程也是相當(dāng)困難的。動態(tài)規(guī)劃雖然提供的是充分條件，但是，由于連續(xù)型系統(tǒng)的HJB方程難于求解而不能滿足實(shí)際需要。
　　2.4 線性二次型最優(yōu)控制
　　線性二次型問題的實(shí)用意義在于：把它所得到的最優(yōu)反饋控制與非線性系統(tǒng)的開環(huán)最優(yōu)控制結(jié)合起來，可減少開環(huán)控制的誤差，達(dá)到更精確的控制的目的。
　　與經(jīng)典控制問題相比，線性二次型問題有兩個顯著的特點(diǎn)：第一，它是多輸入多輸出動態(tài)系統(tǒng)的控制問題，其中包括了作為特例的單輸入單輸出情形；第二，它的性能指標(biāo)是綜合性的，既包含有誤差的成分，又包含有控制能量的成分。根據(jù)線性的最優(yōu)反饋控制律，即控制量正比與狀態(tài)變量。把這種線性二次型問題的最優(yōu)控制與非線性系統(tǒng)的開環(huán)控制結(jié)合起來，還可減少開環(huán)控制的誤差。線性二次型問題的最優(yōu)控制一般可分狀態(tài)調(diào)節(jié)器問題和伺服跟蹤問題兩大類。
　　對于終端時刻 $t_f$ 有限的連續(xù)系統(tǒng)狀態(tài)問題，要求加權(quán)陣P、Q為對稱半正定，R為對稱正定。
　　3、三種方法之間的相互關(guān)系
　　動態(tài)規(guī)劃法、極小值原理和變分法，都是求解最優(yōu)控制問題的重要方法。由動態(tài)規(guī)劃的HJB方程，可以推得變分法中的歐拉方程和橫截條件：也可以推得極小值原理的必要條件。
　　變分法對解決開集約束的最優(yōu)控制問題十分有效，但對于處理閉集性約束就無能為力了。變分法與極小值原理都可以解微分方程所描述的變分問題作為目標(biāo)，結(jié)果得出了一組常微分方程所表示的必要條件。這三種方法要求的條件不同，其中屬動態(tài)規(guī)劃要求最高。在所要求的條件都滿足的情況下，使用這三種方法所得結(jié)論相同。
　　
參考文獻(xiàn)：
　　[1] 胡壽松-最優(yōu)控制理論與系統(tǒng)[M].（第二版）北京：科學(xué)出版社，2005.
　　[2] 張蓮-現(xiàn)代控制理論.北京：清華大學(xué)出版社，2008.1.
　　[3] 于長官-現(xiàn)代控制理論及應(yīng)用.哈爾冰工業(yè)大學(xué)出版社，2005.1.
　　[4] 舒欣梅-現(xiàn)代控制理論基礎(chǔ).西安：西安電子科技大學(xué)出版社，2008.2.
　　[5] 劉豹-現(xiàn)代控制理論.（3版）北京：機(jī)械工業(yè)出版社，2006.7.

總結(jié)

以上是生活随笔為你收集整理的最优控制问题求解综述的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

最优

上一篇：深度强化学习第2课｜马尔可夫决策过程
下一篇：收藏we-hjb的BLOG

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

编程问答

最优控制问题求解综述

總結(jié)