非确定性算法_使用最坏情况提高基于MPC的避障算法对参数不确定性的鲁棒性
本文摘自?Vehicle System Dynamics?
原文題目:
"Improving the robustness of an MPC-based obstacle avoidance algorithm to parametric uncertainty using worst-case scenarios"
原作者:
Jiechao Liu, Paramsothy Jayakumar, Jeffrey L. Stein & Tulga Ersal?
作者單位:
Department of Mechanical Engineering, University of Michigan, Ann Arbor, MI, USA
摘要:作者以前的工作重點(diǎn)是在未知和非結(jié)構(gòu)化環(huán)境中的大型高速自主地面車輛中避障。這項(xiàng)工作提出了一種基于非線性模型預(yù)測(cè)控制的算法,同時(shí)優(yōu)化了速度和轉(zhuǎn)向命令。該算法可以利用車輛的動(dòng)態(tài)極限盡可能快地將其導(dǎo)航到目標(biāo)位置而不損害安全性。在該算法中,車輛的模型被顯式地用于預(yù)測(cè)和優(yōu)化未來(lái)的動(dòng)作,但是在實(shí)踐中,模型參數(shù)值并不準(zhǔn)確。因此,本文評(píng)估了算法對(duì)參數(shù)不確定性的魯棒性。在考慮參數(shù)不確定性分布24%的評(píng)估場(chǎng)景中,首次證明了在算法中使用標(biāo)稱參數(shù)值會(huì)導(dǎo)致安全問(wèn)題。為了提高算法的魯棒性,提出了一種新的雙重最壞情況公式,同時(shí)滿足高速避障的無(wú)碰撞和無(wú)車輪提升兩種安全要求。對(duì)分層隨機(jī)和最壞情況的仿真結(jié)果表明,雙最壞情況公式使算法對(duì)所有測(cè)試的不確定性實(shí)現(xiàn)具有魯棒性。本文還量化了魯棒性和任務(wù)完成性能之間的權(quán)衡。關(guān)鍵詞:?自主地面車輛;碰撞避免;車輛動(dòng)力學(xué);模型預(yù)測(cè)控制;參數(shù)不確定性;魯棒性
1
前言
自動(dòng)地面車輛(AGV)不僅能有效減少事故和改善民用應(yīng)用的機(jī)動(dòng)性,而且在軍事應(yīng)用中也能提高人員安全和任務(wù)完成性能。實(shí)現(xiàn)AGV的全部潛力依賴于許多算法的開發(fā)和成功部署,包括避障。
障礙避免是指基于傳感器測(cè)量和/或環(huán)境的先驗(yàn)地圖生成控制命令以安全地圍繞障礙物導(dǎo)航車輛的任務(wù)。在文獻(xiàn)中已經(jīng)針對(duì)不同的AGV平臺(tái)和應(yīng)用開發(fā)了許多避障算法,例如[1-8]。
與大多數(shù)先前的工作不同,本文感興趣的背景是在未知和非結(jié)構(gòu)化環(huán)境中的大型高速AGV中避免障礙。這種背景是由軍事應(yīng)用推動(dòng)的,其中高速機(jī)動(dòng)是安全和任務(wù)完成性能方面的關(guān)鍵需求。然而,對(duì)于高速大型車輛,避障操縱可以引起穩(wěn)定性或操縱問(wèn)題,例如過(guò)度的側(cè)滑,車輪抬起或甚至翻車。請(qǐng)注意,術(shù)語(yǔ)“高速”用于地面機(jī)器人的操作速度,地面機(jī)器人的操作速度約為2米/秒 。特別是,如果速度高于5米/秒(11英里/小時(shí)),在這項(xiàng)工作中被認(rèn)為是高速。超越這種速度,車輛動(dòng)力學(xué)開始在車輛的機(jī)動(dòng)性中發(fā)揮重要作用,將這些動(dòng)態(tài)納入路徑規(guī)劃是我們背景下的關(guān)鍵要求之一。為此,需要避障算法,該算法可以利用車輛動(dòng)力學(xué)來(lái)最大化任務(wù)完成性能,同時(shí)保證AGV的安全性[9]。
具體而言,在這項(xiàng)工作中,平坦地形上的典型軍用卡車被視為代表性的大型AGV。它的任務(wù)是盡可能安全地從初始位置移動(dòng)到給定目標(biāo)位置。因此,如果需要,希望AGV高速運(yùn)行并接近其動(dòng)態(tài)極限。環(huán)境是非結(jié)構(gòu)化的,這意味著沒(méi)有要遵循的通道或交通規(guī)則。另外,在初始位置和目標(biāo)位置之間存在障礙。它們的位置,大小和形狀是先驗(yàn)未知的,但是當(dāng)它們處于平面光檢測(cè)和測(cè)距(LIDAR)傳感器的范圍內(nèi)時(shí)被檢測(cè)到。
作者以前的工作考慮了這個(gè)問(wèn)題,并描述了未知和非結(jié)構(gòu)化環(huán)境中AGV的避障算法[10-12]。該算法基于非線性模型預(yù)測(cè)控制(MPC)公式。該算法的新穎之處在于其能夠控制車輛以避免靜止障礙物并盡可能快地導(dǎo)航到目標(biāo)位置,同時(shí)考慮動(dòng)態(tài)安全約束。參考縱向速度和轉(zhuǎn)向控制命令被同時(shí)優(yōu)化,而沒(méi)有關(guān)于環(huán)境的先驗(yàn)知識(shí)并且沒(méi)有要遵循的參考軌跡。在算法中,AGV的模型被顯式地用于預(yù)測(cè)和優(yōu)化未來(lái)的動(dòng)作。該模型依賴于多個(gè)車輛和輪胎參數(shù)值。仿真結(jié)果表明,當(dāng)MPC中使用的參數(shù)值為準(zhǔn)確的時(shí),該算法能夠安全利用車輛在不同大小和數(shù)量的感測(cè)障礙物周圍行駛時(shí)的動(dòng)態(tài)極限[11]。
本文的目的是研究參數(shù)不確定性對(duì)上述避障算法的影響,提高算法的魯棒性。[11]中使用的參數(shù)值被認(rèn)為是準(zhǔn)確的,但實(shí)際上,它們是不確定的。這種不確定性會(huì)影響避障算法的有效性和任務(wù)完成性能。更具體地說(shuō),參數(shù)不確定性表示參數(shù)的值是恒定但未知的。然而,參數(shù)值的概率分布或界限是先驗(yàn)已知的[13]。這種避障算法對(duì)參數(shù)不確定性的魯棒性以及如何改進(jìn)它是文獻(xiàn)中尚未解決的研究問(wèn)題。因此,它們是本文的重點(diǎn)。
文獻(xiàn)[14-16]提出了許多方法來(lái)通過(guò)考慮魯棒性或隨機(jī)MPC公式中給定的不確定性分布來(lái)提高M(jìn)PC算法的魯棒性。這些方法已應(yīng)用于自動(dòng)駕駛和車輛主動(dòng)安全[17]。也有處理一般加法不確定性的算法,可將其近似為加法不確定性應(yīng)用于參數(shù)不確定性。這些算法分為以下三種通用方法:(i)基于開環(huán)最小 - 最大優(yōu)化的方法,其中考慮了對(duì)所有可能的不確定性實(shí)現(xiàn)的約束的滿足,例如[18];(ii)基于輔助控制器的方法,其中使用強(qiáng)制反饋控制動(dòng)作來(lái)確保實(shí)際狀態(tài)軌跡不會(huì)偏離超出指定界限的前饋軌跡,例如[19,20];(iii)基于情景的方法,通過(guò)在大量不確定性樣本中對(duì)機(jī)會(huì)約束進(jìn)行評(píng)估,將機(jī)會(huì)約束轉(zhuǎn)化為確定性對(duì)應(yīng)物,例如[21];在該方法中,場(chǎng)景表示不確定性分布的特定實(shí)現(xiàn)或樣本。本文也采用了相同的術(shù)語(yǔ)。
來(lái)自前兩種方法的大多數(shù)算法(分析魯棒或隨機(jī)MPC算法)僅限于線性系統(tǒng)和高斯分布。這種限制是為了便于在預(yù)測(cè)范圍內(nèi)傳播不確定系統(tǒng)狀態(tài)和/或計(jì)算不變管和輔助控制器增益。然而,作者以前的工作已經(jīng)得出結(jié)論,模型非線性對(duì)于應(yīng)用興趣至關(guān)重要[10,12]。雖然模型非線性的迭代在線線性化是可能的[22],線性化模型只有在一個(gè)小的區(qū)域周圍的參考狀態(tài)和輸入向量的線性化是良好的近似。因?yàn)椴淮嬖趨⒖架壽E,為了避免在非結(jié)構(gòu)化環(huán)境中避免障礙,找到最佳路徑也是除了避開障礙物之外的任務(wù)的一部分。這需要相對(duì)較長(zhǎng)的預(yù)測(cè)范圍來(lái)實(shí)現(xiàn)在可能明顯偏離“當(dāng)前”方向的方向上成功導(dǎo)航[11]。因此,小區(qū)域假設(shè)可能不成立。
與前兩個(gè)類別相比,基于場(chǎng)景的方法可以應(yīng)用于任何類型的模型和不確定性分布,只要評(píng)估足夠數(shù)量的隨機(jī)樣本即可。然而,主要缺點(diǎn)是問(wèn)題規(guī)模隨著不確定參數(shù)的數(shù)量和這些參數(shù)可能采用的值范圍呈指數(shù)增長(zhǎng)[23]。
除了考慮一般加性不確定性的文獻(xiàn)外,一些研究工作特別關(guān)注參數(shù)不確定性。例如,Walton[13]將不確定參數(shù)視為優(yōu)化變量。然后,她使用成本函數(shù),將原始成本乘以參數(shù)范圍內(nèi)的概率密度函數(shù),以說(shuō)明不確定性。然而,該應(yīng)用僅限于最優(yōu)控制問(wèn)題(OCP)的成本函數(shù)和動(dòng)態(tài)模型約束中的參數(shù)不確定性,包括路徑約束中的參數(shù)不確定性。Xiong[24]等人通過(guò)多項(xiàng)式混沌展開法將原始隨機(jī)軌跡優(yōu)化問(wèn)題轉(zhuǎn)換為擴(kuò)展的高維狀態(tài)空間中的等效確定性問(wèn)題。可以使用此方法處理路徑約束。但是,擴(kuò)展確定性狀態(tài)方程中的狀態(tài)數(shù)ns 等于原始狀態(tài)數(shù)nr,此外,狀態(tài)擴(kuò)展系數(shù)的總數(shù)是,ne?是未知參數(shù)的數(shù)量,np?是多項(xiàng)式混沌擴(kuò)展的階數(shù)[25]。該數(shù)字隨著多項(xiàng)式階數(shù)和位置參數(shù)的數(shù)量迅速增長(zhǎng)。因此,由于大量參數(shù),該方法不適用于本文的問(wèn)題。因此,處理參數(shù)不確定性的現(xiàn)有方法不容易適用于我們感興趣的問(wèn)題,其包括非線性動(dòng)力學(xué)模型,非線性路徑約束和大量參數(shù)。
因此,本文提出了一種新的方法來(lái)提高避障算法對(duì)參數(shù)不確定性的魯棒性。特別是,給出一種雙重最壞情況公式,可以滿足AGV中高速避障的兩個(gè)安全要求:無(wú)碰撞和無(wú)車輪提升。與基于場(chǎng)景的方法類似,所提出的方法還使得MPC算法中的OCP公式中的約束在所有考慮的場(chǎng)景中都是安全的。但是,不考慮使用數(shù)百個(gè)隨機(jī)生成的場(chǎng)景,而是僅考慮兩個(gè)場(chǎng)景,這兩個(gè)場(chǎng)景是與此工作中確定的兩種類型的不安全場(chǎng)景相對(duì)應(yīng)的兩種最可能的最壞情況場(chǎng)景。此外,不是應(yīng)用所有場(chǎng)景來(lái)檢查所有約束,每種最可能的最壞情況僅用于檢查與該場(chǎng)景相關(guān)的約束的滿足度。這種改進(jìn)有助于最小化改進(jìn)的OCP策略中的約束數(shù)量以確保魯棒性。結(jié)果表明,盡管不能保證參數(shù)不確定性分布的所有可能實(shí)現(xiàn),由于最壞情況的非唯一性和本工作中使用的近似,所提出的公式提高了算法的魯棒性。本文還量化了基于MPC的避障算法的魯棒性和任務(wù)完成性能之間的權(quán)衡。
本文的其余部分安排如下。第2節(jié)概述了開發(fā)的基于MPC的避障算法,并列出了所有考慮參數(shù)的標(biāo)稱值和相關(guān)的不確定性水平。第3節(jié)介紹了對(duì)參數(shù)不確定性的魯棒性評(píng)估結(jié)果。第4節(jié)介紹了通過(guò)考慮最壞情況來(lái)提高穩(wěn)健性的新策略。第5節(jié)顯示并討論了模擬結(jié)果。結(jié)論見(jiàn)第6節(jié)。
2
基于MPC的避障算法
圖1顯示了AGV處于閉環(huán)狀態(tài)的非線性MPC算法的示意圖。在這個(gè)基于模擬的研究中,AGV使用14自由度(DoF)車輛動(dòng)力學(xué)模型來(lái)表示[26]。在基于MPC的避障算法中,多相OCP被制定為在LIDAR傳感器的檢測(cè)范圍內(nèi)優(yōu)化參考縱向速度和轉(zhuǎn)向控制命令。該算法可以通過(guò)受到各種約束的平滑控制命令盡可能快地導(dǎo)航車輛,例如加速度限制,轉(zhuǎn)向限制和安全操縱區(qū)域。
圖1 基于MPC的避障算法的示意圖
在MPC的每個(gè)步驟,建立并求解一個(gè)或多個(gè)多相OCP以同時(shí)優(yōu)化轉(zhuǎn)向角和參考速度曲線。一般形式的避障的最優(yōu)控制問(wèn)題的公式由公式(1)-(10)給出。
通過(guò)最小化等式(1)中指定的成本函數(shù),受制于所有階段的等式(2)-(8)中定義的約束,以及等式(9)-(10)中針對(duì)預(yù)測(cè)的初始點(diǎn)和結(jié)束點(diǎn)定義的約束,最佳狀態(tài)軌跡,最優(yōu)控制軌跡,時(shí)間T?i? 包含從一個(gè)子區(qū)域到下一個(gè)子區(qū)域的轉(zhuǎn)換,其中N是階段的總數(shù); 即給定序列中的子區(qū)域的數(shù)量。特別地,成本函數(shù)等式(1)包括兩個(gè)部分,即終端成本和被積函數(shù)的積分成本。等式(2)是車輛動(dòng)力學(xué)模型。等式(3)和(4)分別指定狀態(tài)和控制變量的界限。等式(5)定義了動(dòng)態(tài)安全約束,等式(6)規(guī)定了避免障礙物的位置約束。等式(7)和(8)分別確保狀態(tài)變量的連續(xù)性和不同階段之間的時(shí)間。等式(9)稱為終端約束,它限制狀態(tài)變量的初始值和最終值。等式(10)指定預(yù)測(cè)時(shí)間的范圍,預(yù)測(cè)時(shí)間也是要優(yōu)化的變量。該配方的詳細(xì)說(shuō)明見(jiàn)[ 11 ]由于篇幅考慮而在本文中省略。
AGV的模型包含在OCP公式中,以預(yù)測(cè)和優(yōu)化其在預(yù)測(cè)范圍內(nèi)的行為。特別地,使用三個(gè)DoF單軌非線性車輛模型,其考慮縱向載荷傳遞和輪胎非線性[11]。Pacejka Magic Formula輪胎模型[27] 用于預(yù)測(cè)橫向力作為相應(yīng)輪胎垂直載荷和側(cè)偏角的函數(shù)。在這項(xiàng)工作中,通過(guò)將所有四個(gè)輪胎上的載荷限制在總是高于正的最小閾值,直接考慮無(wú)輪提升要求。具有經(jīng)驗(yàn)估計(jì)的載荷傳遞系數(shù)的方程用于通過(guò)考慮車輛的縱向和橫向載荷傳遞來(lái)預(yù)測(cè)輪胎垂直載荷[28]。
表1總結(jié)了非線性MPC模型中使用的參數(shù)列表和相關(guān)的不確定性水平。假設(shè)不確定性分布是獨(dú)立的,并且遵循給定上限和下限的均勻分布。特別地,假設(shè)質(zhì)量和慣性項(xiàng)具有±10%的不確定性,重心(CoG)位置測(cè)量有±20%的不確定性,并且輪胎參數(shù)有±30%的不確定性。基于測(cè)量參數(shù)值的難度估計(jì)不確定性水平。通常,輪胎模型中使用的參數(shù)值比車輛參數(shù)更不確定,尤其是在非結(jié)構(gòu)化環(huán)境中,其通常是越野的。與質(zhì)量和慣性測(cè)量相比,車輛重心位置測(cè)量具有更大的不確定性,因?yàn)橹匦奈恢每梢匀菀椎匾苿?dòng)。假設(shè)與兩個(gè)軸之間的距離相關(guān)的不確定性LV?,和輪胎半徑Rt可以忽略不計(jì),因?yàn)樗鼈兛梢暂p松直接地測(cè)量。質(zhì)量和慣性的不確定性范圍可能包括由于燃料消耗引起的微小變化,但不考慮大的變化(例如由于額外的有效載荷)。以下部分中給出的結(jié)果基于參數(shù)標(biāo)稱值和不確定性水平的這些假設(shè)。當(dāng)做出不同的假設(shè)時(shí),特定的數(shù)值結(jié)果(例如,失效情景的百分比)可能不成立,但仍然可以應(yīng)用相同的方法。
表1? MPC模型中使用的參數(shù)列表
3
評(píng)估參數(shù)不確定性的魯棒性
在我們之前的工作中,假設(shè)沒(méi)有參數(shù)不確定性。因此,MPC模型中使用的參數(shù)值是表1中列出的標(biāo)稱值 。這些標(biāo)稱值也用于14DoF模型,然后用于證明避障算法在閉環(huán)模擬中的有效性。當(dāng)存在參數(shù)不確定性時(shí),有必要在使用標(biāo)稱參數(shù)值時(shí)首先評(píng)估算法的魯棒性。MPC框架由于反饋和重新規(guī)劃而具有固有的魯棒性。因此,MPC算法可能已經(jīng)對(duì)上面考慮的參數(shù)不確定性具有魯棒性,并且不需要額外的策略。為了執(zhí)行該任務(wù),進(jìn)行閉環(huán)仿真,其中每個(gè)仿真使用從參數(shù)不確定性分布采樣的車輛模型中的不同參數(shù)值集。另一方面,MPC模型參數(shù)在模擬中都保存在標(biāo)稱值中。
由于有12個(gè)具有不確定性的參數(shù),因此需要對(duì)參數(shù)值進(jìn)行適當(dāng)?shù)牟蓸?#xff0c;以便用有限數(shù)量的模擬來(lái)覆蓋大部分參數(shù)不確定性域。特別是,拉丁超立方體設(shè)計(jì)(LHD)用于從多維分布中生成易處理的參數(shù)值近似隨機(jī)樣本集合[29]。LHD是這樣執(zhí)行的,每一個(gè)nd維度被劃分為nl?等水平,在每個(gè)水平只有一個(gè)樣本。隨機(jī)過(guò)程用于確定樣本位置。具體地說(shuō),對(duì)于這個(gè)問(wèn)題,有12個(gè)維度,每個(gè)維度被分成50個(gè)相等的級(jí)別。本文中使用的LHD經(jīng)過(guò)優(yōu)化,具有良好的空間填充質(zhì)量和樣品之間的低相關(guān)性[30]。因此,獲得50組參數(shù)值,換句話說(shuō),50個(gè)場(chǎng)景。
由于避障的安全要求有兩個(gè),即無(wú)碰撞和無(wú)車輪提升,兩個(gè)明顯的安全問(wèn)題是碰撞和車輪提升,這些都是嚴(yán)重違反安全要求的。此外,安全邊際包含在OCP的約束公式中。違反這些限制的場(chǎng)景,即在沒(méi)有碰撞或車輪升空的情況下進(jìn)入安全邊緣,是違規(guī)行為。在基于仿真的魯棒性研究中,硬性和軟性違規(guī)都被認(rèn)為是不可接受的。換句話說(shuō),當(dāng)?shù)秸系K物或輪胎垂直載荷的距離小于相應(yīng)的安全裕度時(shí),AGV被認(rèn)為是不安全的。AGV在這些模擬中的任務(wù)是從其起始位置移動(dòng)并從指定方向穿過(guò)給定目標(biāo)位置。從而,任務(wù)完成定義為在最終目標(biāo)位置移動(dòng)并沿指定方向前進(jìn)。因此,安全和任務(wù)完成都很重要。當(dāng)AGV從與指定值相比具有大于或等于10度差異的不同方向穿過(guò)目標(biāo)位置時(shí),即使沒(méi)有任何安全違規(guī),也將其視為失敗。
圖2顯示了50個(gè)場(chǎng)景的模擬結(jié)果,其中障礙物圖由兩個(gè)障礙物組成。在該測(cè)試中,最終航向角必須與初始航向方向相同。總之,50個(gè)場(chǎng)景中的38個(gè)場(chǎng)景中的AGV成功完成任務(wù),沒(méi)有任何軟或硬違規(guī)安全要求,如圖 2(a,b)所示。其余12個(gè)情景導(dǎo)致硬性或軟性違規(guī)。如圖2(c,d)所示,在10種情況下觀察到軟違規(guī)。所有軟違規(guī)都違反了最小垂直負(fù)載閾值,沒(méi)有觀察到違反到障礙物閾值的最小距離。這10種情況中的一種會(huì)導(dǎo)致軌跡非常接近障礙物,然后減速以避免碰撞,這將導(dǎo)致明顯不同的、更長(zhǎng)的路徑。此外,由于沒(méi)有滿足最終的航向角要求,此場(chǎng)景無(wú)法成功完成任務(wù)。在兩個(gè)場(chǎng)景中觀察到硬違規(guī)。由于觀察到如圖2(e,f)所示的車輪提升,這些模擬在AGV到達(dá)目標(biāo)位置之前就終止了。因此,該算法對(duì)假設(shè)的參數(shù)不確定性分布不具有很強(qiáng)的魯棒性。24%的測(cè)試場(chǎng)景違反了安全要求。
圖2 使用具有標(biāo)稱參數(shù)值的避障算法的LHD場(chǎng)景的閉環(huán)仿真結(jié)果。(a)38個(gè)沒(méi)有安全問(wèn)題的情景的軌跡剖面; (b)38個(gè)情景的最小垂直載荷剖面圖,沒(méi)有安全問(wèn)題; (c)違反垂直載荷閾值的10種情景的軌跡剖面; (d)違反垂直載荷閾值的10種情景的最小垂直載荷剖面; (e)單輪提升的兩種情況的軌跡輪廓。(f)兩個(gè)方案的最小垂直載荷曲線,單輪提升。
4
提高參數(shù)不確定性的魯棒性
本文提出了一種新的方法來(lái)提高避障算法對(duì)參數(shù)不確定性的魯棒性。如第1節(jié)所述,基于場(chǎng)景的方法可以應(yīng)用于非線性動(dòng)力學(xué)模型所考慮的問(wèn)題。然而,因?yàn)镸PC模型具有大量參數(shù),所以需要數(shù)百個(gè)隨機(jī)生成的場(chǎng)景來(lái)提供機(jī)會(huì)約束的相對(duì)高置信水平,這在計(jì)算上是難以處理的。為了克服這一挑戰(zhàn),開發(fā)了一種雙重最壞情況的策略。執(zhí)行具有各種場(chǎng)景的系統(tǒng)離線模擬以識(shí)別將導(dǎo)致主動(dòng)約束的場(chǎng)景。因此,計(jì)算負(fù)擔(dān)被離線轉(zhuǎn)移。因此,在提出的魯棒性公式中僅考慮兩種情況。它們是兩種最可能的最壞情況,與AGV中的高速避障的兩個(gè)安全要求相對(duì)應(yīng):無(wú)碰撞和無(wú)車輪提升。每個(gè)場(chǎng)景僅用于檢查相應(yīng)約束的滿足,而不是應(yīng)用兩個(gè)場(chǎng)景來(lái)檢查所有約束。這種改進(jìn)用于減少增強(qiáng)OCP配方中的約束數(shù)量以確保魯棒性。
在4.1節(jié)中,確定了兩種類型的不安全情景。使用度量來(lái)定性地表征它們中的每一個(gè),度量是AGV狀態(tài)變量的函數(shù)。第4.2節(jié)介紹了獲得兩種最可能出現(xiàn)的最壞情況的過(guò)程。為了驗(yàn)證獲得的最可能的最壞情況并且識(shí)別與最可能的最壞情況場(chǎng)景明顯不同的最不可能的最壞情況場(chǎng)景,進(jìn)行進(jìn)一步的開環(huán)仿真。結(jié)果見(jiàn)4.3節(jié)。通過(guò)獲得最可能的最壞情況和不太可能的最壞情況,第4.4節(jié)介紹了兩種雙重最壞情況的公式。
4.1不安全的情況
為了給出最壞情況的定義,首先定義了不安全的場(chǎng)景。如果具有特定情景的閉環(huán)結(jié)果揭示安全問(wèn)題,即軟違規(guī)或硬違規(guī),則該情景被認(rèn)為是不安全的。然而,場(chǎng)景是否不安全的理由取決于障礙場(chǎng)以及MPC算法中使用的車輛模型和參數(shù)值。這是因?yàn)榫哂性搱?chǎng)景的AGV的控制命令是由算法響應(yīng)于給定的障礙場(chǎng)而生成的。然而,由于無(wú)限多種可能性,試圖列舉所有可能的障礙場(chǎng)將是徒勞的。因此,為了使最壞情況的分析易于處理,我們使用恒定轉(zhuǎn)向恒定加速度運(yùn)動(dòng)產(chǎn)生的開環(huán)仿真結(jié)果。這些操作可被視為更一般控制命令的主題。換句話說(shuō),對(duì)于任何障礙場(chǎng),由算法在給定步驟產(chǎn)生的控制命令可以通過(guò)該組中的一個(gè)操縱來(lái)近似。因此,這種開環(huán)方法從分析中消除了策略和障礙場(chǎng)的特殊性。因此,減少了分析中要考慮的相互依賴性的數(shù)量。換句話說(shuō),開環(huán)分析使我們只關(guān)注與本文目標(biāo)一致的參數(shù)不確定性。這種開環(huán)方法從分析中消除了配方和障礙場(chǎng)的特殊性。因此,減少了分析中要考慮的相互依賴性的數(shù)量。
對(duì)應(yīng)于圖2(c-f)中所示的閉環(huán)仿真結(jié)果的場(chǎng)景是所考慮的障礙場(chǎng)和使用標(biāo)稱參數(shù)值的MPC算法的不安全場(chǎng)景。使用這些不安全情況的兩個(gè)典型恒定轉(zhuǎn)向恒定加速運(yùn)動(dòng)的開環(huán)仿真結(jié)果如圖3所示。這些結(jié)果有助于根據(jù)車輛響應(yīng)分析不安全情景的特征。圖 3(a-c)是具有恒定加速度的結(jié)果; 和圖3(d-f)是具有恒定減速度的結(jié)果。選擇這兩個(gè)操縱是因?yàn)榭v向加速度顯著影響縱向載荷傳遞和車輛對(duì)轉(zhuǎn)向的靈敏度。? ? ? ? ?
? ? ?
圖3.相應(yīng)的開環(huán)仿真結(jié)果,其中閉環(huán)仿真中的不安全情景與標(biāo)稱情景的結(jié)果進(jìn)行了比較。(a)輪胎垂直載荷剖面:加速度; (b)軌跡輪廓:加速度; (c)軌跡輪廓(放大視圖):加速度;(d)輪胎垂直載荷輪廓:減速; (e)軌跡輪廓:減速; (f)軌跡輪廓(放大視圖):減速。
如圖3所示(a,d),在12個(gè)開環(huán)結(jié)果中有11個(gè)出現(xiàn)不安全情景時(shí),預(yù)測(cè)的輪胎垂直載荷值幾乎總是小于預(yù)測(cè)范圍內(nèi)標(biāo)稱情景預(yù)測(cè)的值。由于垂直載荷值預(yù)測(cè)之間的差異,即使MPC算法生成的標(biāo)稱參數(shù)值的控制命令滿足OCP公式中的動(dòng)態(tài)安全約束,具有這些情形的AGV仍會(huì)遇到違反最小輪胎垂直的情況執(zhí)行控制命令后,加載閾值或甚至車輪提升。因此,第一類不安全情景的特征在于輪胎垂直載荷值。由于垂直載荷曲線是定時(shí)的數(shù)據(jù)序列,因此最小輪胎垂直載荷值用作評(píng)估度量。值越小意味著不安全的可能性越大。作為示例,具有用于輪胎垂直載荷預(yù)測(cè)的給定控制命令的標(biāo)稱方案的度量值是,這是圖4(a)中圓圈所示的值。
圖4.使用名義場(chǎng)景和控制命令舉例說(shuō)明的評(píng)估指標(biāo)的定義:。?(a)最小輪胎垂直載荷是用于評(píng)估輪胎垂直載荷預(yù)測(cè)的度量; (b)軌跡下的面積是用于表征軌跡“剛度”的度量。
對(duì)于不屬于前一種類型的一種情況,其軌跡是12種情景中的“最硬”,如圖3所示(b,e)。換句話說(shuō),具有這種情況的AGV不能像使用相同控制命令的標(biāo)稱情況一樣變得尖銳。因此,由MPC模型產(chǎn)生的具有標(biāo)稱參數(shù)值的轉(zhuǎn)向命令不足以使AGV遠(yuǎn)離障礙物足夠早地駕駛AGV。因此,由于缺乏足夠的轉(zhuǎn)彎,AGV非常接近障礙物,這導(dǎo)致需要大的校正努力和顯著的迂回,并導(dǎo)致不能完成任務(wù)。對(duì)于不同的障礙場(chǎng),可能違反最小距離到障礙物閾值甚至碰撞。因此,第二類不安全情景的特征在于軌跡“剛度”,其定義為軌跡輪廓下的面積。度量值越小,軌跡越“僵硬”。舉個(gè)例子, 這是圖4(b)中陰影區(qū)域。
總之,所識(shí)別的兩種類型的不安全場(chǎng)景被命名為小型垂直載荷類型和“剛性”軌跡類型。請(qǐng)注意,這兩種類型的不安全場(chǎng)景是截然不同的; 如圖3中的結(jié)果所示,小的垂直載荷場(chǎng)景不是“硬的”軌跡場(chǎng)景,反之亦然。
4.2 最可能是最壞的情況
對(duì)于每種類型的不安全場(chǎng)景,導(dǎo)致最小度量值的場(chǎng)景是特定運(yùn)動(dòng)的最壞情況。確定最壞情況是至關(guān)重要的,因?yàn)槿绻顗那闆r可以保證安全,那么所有其他方案也是安全的。由于模型非線性,很難(如果不是不可能的話)分析地獲得最可能的最壞情況; 因此,使用數(shù)值方法。本節(jié)介紹了用于獲取每種不安全情景的最可能最壞情況的統(tǒng)計(jì)方法。
因?yàn)橛?2個(gè)參數(shù),所以由于大量組合,參數(shù)之間的相互作用被忽略。有關(guān)此假設(shè)的更多討論可在本節(jié)后面部分找到。使用離線開環(huán)仿真結(jié)果獨(dú)立地研究每個(gè)參數(shù)值對(duì)度量的影響。一組恒定轉(zhuǎn)向恒定加速度操縱用于評(píng)估。考慮轉(zhuǎn)向角,加速度和初始速度值的不同組合。
因此,該選擇的方案基于車輛控制命令的固定網(wǎng)格采樣。使用這種方案的主要原因是它是系統(tǒng)的和計(jì)算上易處理的。這是系統(tǒng)性的,因?yàn)樵摻M操縱以詳盡的方式覆蓋AGV的整個(gè)操作空間,直到所考慮的網(wǎng)格的分辨率。就計(jì)算負(fù)荷而言,需要這種方法以便于調(diào)整網(wǎng)格間隔以在精度和計(jì)算需求之間達(dá)到平衡。這種確定性方法的替代方案是隨機(jī)方案。一種選擇是生成隨機(jī)障礙場(chǎng)并執(zhí)行閉環(huán)仿真。然而,這需要大量的計(jì)算資源才能得出任何統(tǒng)計(jì)上有意義的結(jié)論并且是不可行的。另一種選擇是隨機(jī)生成開環(huán)機(jī)動(dòng)。使用該方案的困難在于確定確保滿意地覆蓋整個(gè)操作空間所需的模擬次數(shù)。
在這種情況下,術(shù)語(yǔ)最可能是最壞情況用于指代導(dǎo)致大多數(shù)考慮的操作的最小度量值的場(chǎng)景,這是我們對(duì)基于有限集的實(shí)際最壞情況場(chǎng)景的最佳猜測(cè)。請(qǐng)注意,這個(gè)術(shù)語(yǔ)的使用并不意味著所獲得的場(chǎng)景是所有可能場(chǎng)景中最有可能的一個(gè)。相反,它是在考慮的場(chǎng)景中最有可能的一個(gè),并從統(tǒng)計(jì)上得到。
表2列出了為每個(gè)命令考慮的值序列。使用圖5中所示的初始速度和加速度對(duì),其中在2秒的模擬中消除了產(chǎn)生小于5m/s或大于29m/s的速度對(duì)。使用這兩種限速是因?yàn)樗俣鹊陀?m/s不構(gòu)成任何挑戰(zhàn),車輛的最高速度為29m/s。對(duì)于每一對(duì),考慮表2中指定的轉(zhuǎn)向角值序列。
圖5 用于獲得最壞情況的參數(shù)化評(píng)估操作中使用的成對(duì)縱向速度和加速度命令
表2 參數(shù)化評(píng)估操作中使用的命令的值
對(duì)每一個(gè)Np,考慮Nv?的值在不確定范圍[vmin,I ,?vmax,i ]之內(nèi),其中i是參數(shù)的索引。換句話說(shuō),評(píng)估場(chǎng)景Nv?,其中只有一個(gè)參數(shù)值是變化的,其他參數(shù)值保持在它們的參考值。初始參考值是標(biāo)稱參數(shù)值。對(duì)于每種類型的不安全場(chǎng)景,在使用初始參考值獲得最可能出現(xiàn)的最壞情況后,重復(fù)算法1將最可能出現(xiàn)的最壞情況更新為最可能出現(xiàn)的最壞情況,而之前最可能出現(xiàn)的最壞情況則更新為新的參考值。如果更新的最可能最壞的情況與前一個(gè)相同,那么最可能最壞的情況就確定下來(lái)了。否則,算法1將再次重復(fù),以更新的最壞情況作為新的參考值,直到收斂為止。
在算法1中,對(duì)于每個(gè)考慮的參數(shù),針對(duì)模擬車輛模型為Nv?場(chǎng)景和Nm?操縱的所有組合生成兩個(gè)矩陣。第一個(gè)Isafe?記錄所考慮場(chǎng)景中的操作是否安全。第二個(gè)記錄根據(jù)車輛響應(yīng)計(jì)算的度量值。這兩個(gè)矩陣的大小都是Nm?×Nv 。只有當(dāng)操縱對(duì)所有考慮的情況都是安全的時(shí),才使用相應(yīng)的度量值來(lái)確定最可能出現(xiàn)的最壞情況。例如,圖6(a)說(shuō)明了參數(shù)hCG 在1127個(gè)操縱下彈道軌跡度量值的影響,其中關(guān)系都是單調(diào)的,近似線性。每條線對(duì)應(yīng)一個(gè)動(dòng)作。將顯示標(biāo)準(zhǔn)化度量,其中每一行的中值設(shè)置為0。利用這些結(jié)果,得到了產(chǎn)生最小度量值的參數(shù)的值。然而,這一價(jià)值并不獨(dú)特,因?yàn)樗Q于操作。在本例中,在1127次機(jī)動(dòng)中,有333次(約30%)使用hCG?的下界值來(lái)獲得最小的度量值。對(duì)于剩余的794個(gè)操作,它是通過(guò)上限值實(shí)現(xiàn)的。圖6(b)顯示了操作空間的投影視圖所對(duì)應(yīng)的操作。一般來(lái)說(shuō),當(dāng)AGV加速時(shí),較大的hCG?值會(huì)導(dǎo)致更硬的軌跡。此外,還觀察到,度量值的變化范圍也取決于操縱。當(dāng)hCG?值較大時(shí),更硬軌跡的最大變化范圍為18.9,hCG?值較小時(shí),最硬軌跡的最大變化范圍為6.3。在考慮機(jī)動(dòng)次數(shù)和最大偏差范圍的基礎(chǔ)上,得出hCG?的上界值在最可能最硬軌跡的參數(shù)值集中。
圖6 ?評(píng)價(jià)hCG?值和其它參數(shù)對(duì)彈道剛度度量值的影響。(a)在各種評(píng)估機(jī)動(dòng)情況下,正規(guī)化軌道剛度度量值與hCG值的變化;(b)控制命令對(duì)彈道剛度度量值與hCG值關(guān)系的影響
對(duì)于所考慮的車輛模型和參數(shù)不確定性分布,在重復(fù)算法1 兩到三次后,每種類型的最壞情況最可能收斂。圖7總結(jié)了算法最后一次運(yùn)行時(shí)各參數(shù)對(duì)軌跡剛度和垂直荷載指標(biāo)的影響。在每個(gè)圖中,頂部的子圖顯示了導(dǎo)致參數(shù)值和度量值之間的單調(diào)遞增關(guān)系(Nin/Nin + Nde + Not)、單調(diào)遞減關(guān)系(Nde/Nin + Nde +Not)和非單調(diào)關(guān)系(Not/Nin + Nde + Not)的機(jī)動(dòng)百分比。每個(gè)關(guān)系(Rin、Rde和Rot)的度量值的最大偏差范圍總結(jié)在第二個(gè)子圖中。最后一個(gè)子圖通過(guò)引入投票度量N·R并將其標(biāo)準(zhǔn)化,從而將上述信息組合在一起,使每個(gè)參數(shù)的最大投票度量為1。然后使用投票度量值來(lái)確定每種類型中最可能出現(xiàn)的最壞情況。對(duì)于每個(gè)參數(shù),如果單調(diào)增加關(guān)系的投票度量是最大的,則參數(shù)下限值在最可能最壞情況的參數(shù)值集合中,而如果單調(diào)遞減關(guān)系的投票度量是最大的,參數(shù)上限值在集合中。然而,如果非單調(diào)關(guān)系具有最大的投票度量值,則需要對(duì)結(jié)果進(jìn)行更詳細(xì)的討論,如下所示。
圖7.使用條形圖對(duì)所有參數(shù)對(duì)預(yù)測(cè)指標(biāo)的影響摘要。(a)軌跡預(yù)測(cè); (b)垂直載荷預(yù)測(cè)。
對(duì)于軌跡預(yù)測(cè),如圖? 7(a)所示,除了參數(shù)hCG?已經(jīng)在上面詳細(xì)討論過(guò),其他參數(shù)對(duì)軌跡剛度度量的影響幾乎與操作無(wú)關(guān)。因此,可以直接根據(jù)結(jié)果匯總最“可能”最壞情況的“最強(qiáng)”軌跡,如表 3所示。
表3.名義場(chǎng)景的參數(shù)值和最可能的最壞情況場(chǎng)景
對(duì)于垂直載荷預(yù)測(cè),操作的影響較大,但仍存在主要趨勢(shì),如圖7(b)所示。需要更詳細(xì)討論的兩個(gè)參數(shù)是Lf? 和Pd。對(duì)于超過(guò)一半的操作,垂直負(fù)荷指標(biāo)不會(huì)隨著兩個(gè)參數(shù)的參數(shù)值單調(diào)變化。然而,在356次操縱中有309次(約87%),Lf??的下界值導(dǎo)致垂直載荷最小。在355次操縱中有308次(約87%),Pd 的上限值越高,垂直載荷測(cè)量值越小。因此,確定Lf??的下界值和Pd?的上界值都在最可能出現(xiàn)最小垂直荷載情況的參數(shù)集中。通過(guò)投票度量值和對(duì)算法1的詳細(xì)結(jié)果的進(jìn)一步分析,確定了垂直荷載最小時(shí)最可能出現(xiàn)的最壞情況,如表3所示。
此過(guò)程的目標(biāo)是使用系統(tǒng)方法來(lái)獲得對(duì)最壞情況的最佳猜測(cè)。由于參數(shù)眾多,在精度和計(jì)算量之間存在權(quán)衡。因此,我們選擇了固定網(wǎng)格采樣方法,每次只考慮一個(gè)參數(shù)。用這種方法,計(jì)算時(shí)間是有限的。因此,盡管問(wèn)題的維數(shù)很大,分析的優(yōu)點(diǎn)是它在計(jì)算上是容易處理的。分析的不足之處在于缺少對(duì)參數(shù)共變的考慮,而參數(shù)共變對(duì)結(jié)論的影響可能是顯著的,也可能是不顯著的。探索這種共變的重要性仍然是一個(gè)有待研究的問(wèn)題。一個(gè)可選的方案是使用蒙特卡羅方法,它隨機(jī)地探索搜索空間,如果確定足夠數(shù)量的模擬的挑戰(zhàn)可以解決,并且結(jié)果的數(shù)量在計(jì)算上是可行的。
此外,還發(fā)現(xiàn)轉(zhuǎn)向角命令對(duì)軌跡預(yù)測(cè)和垂直負(fù)荷預(yù)測(cè)的度量值沒(méi)有顯著影響。對(duì)于軌跡預(yù)測(cè),由于hCG?只在加速度過(guò)程中呈單調(diào)遞減,因此最可能出現(xiàn)的最壞情況是只有正加速度指令的實(shí)際最壞情況。對(duì)于垂直負(fù)荷預(yù)測(cè),確定最可能出現(xiàn)的最壞情況是實(shí)際的最壞情況,這要復(fù)雜得多。除Lf??外,?Pk??和Pk,z 是兩個(gè)最重要的偏差范圍參數(shù)。垂直荷載度量值相對(duì)于控制命令的參數(shù)值的單調(diào)性如圖8所示。據(jù)觀察,最可能出現(xiàn)的最壞情況并不是從高初始速度開始的高減速操縱的實(shí)際最壞情況。因此,以下三組控制命令用于以下開環(huán)仿真,包括加速、中減速和硬減速動(dòng)作。這三次演習(xí)的初始速度是相同的。選擇轉(zhuǎn)向命令使最小的垂直載荷大致相同。
圖8 垂直負(fù)載度量值相對(duì)于作為控制命令函數(shù)的參數(shù)值的單調(diào)性
4.3?開環(huán)仿真結(jié)果,不太可能出現(xiàn)的最壞情況
使用算法1,不考慮參數(shù)之間的交互效果。雖然算法重復(fù)多次以考慮交互效果,但它僅在有限的意義上這樣做。因此,為了驗(yàn)證獲得的最可能的最壞情況場(chǎng)景,使用第3節(jié)中使用的LHD場(chǎng)景以及包含所有參數(shù)的上限或下限的所有場(chǎng)景來(lái)執(zhí)行開環(huán)模擬。后一組結(jié)果也可用于識(shí)別與最可能的最壞情況明顯不同的最不可能的最壞情況。
在圖 9和 10中,使用表3中列出的情景? 的開環(huán)仿真結(jié)果繪制在具有LHD情景的開環(huán)仿真結(jié)果之上。來(lái)自LHD場(chǎng)景的所有軌跡比最可能的“最強(qiáng)”軌跡場(chǎng)景中的軌跡更“靈活”。來(lái)自所有LHD場(chǎng)景的最小垂直載荷也大于最可能的最小垂直載荷場(chǎng)景中的值。然而,當(dāng)使用不同的初始狀態(tài)值組時(shí),如圖10(c)所示,最小的垂直負(fù)載情況可能并不總是最壞的,具有硬減速。
? ? ?
圖9.開放式仿真結(jié)果的軌跡曲線與標(biāo)稱情景,獲得的最可能的最壞情況和LHD情景。(a)操作A; (b)操作B; (c)操作C.
圖10 對(duì)垂直荷載分布的開環(huán)仿真結(jié)果與標(biāo)稱方案、得到的最可能最壞情況和LHD方案進(jìn)行了比較(a)操作A; (b)操作B; (c)操作C.
如圖7所示,參數(shù)值和度量值之間的大多數(shù)關(guān)系是單調(diào)的。即使它們不是,最小的度量值幾乎總是用參數(shù)值的上限或下限來(lái)實(shí)現(xiàn)。為了利用這種觀察,然后通過(guò)假設(shè)每個(gè)參數(shù)只能采用兩個(gè)值(上限值和下限值)來(lái)執(zhí)行另一組開環(huán)模擬。因此,考慮212=4096種方案,結(jié)果顯示在圖11和12中。
圖11 開環(huán)仿真結(jié)果的軌跡曲線,包括標(biāo)稱情景,最可能獲得的最壞情況,以及參數(shù)下限值和上限值的所有組合。(a)操作A; (b)操作B; (c)操作C.
圖12 開環(huán)仿真結(jié)果的垂直負(fù)載曲線,其中包括標(biāo)稱情景,獲得的最可能的最壞情況,以及參數(shù)下限值和上限值的所有組合。(a)操作A; (b)操作B; (c)操作C.
據(jù)觀察,當(dāng)AGV加速時(shí),這兩種最可能的最壞情況是所有考慮的情景中的實(shí)際最壞情況。然而,當(dāng)AGV減速時(shí),它們不一定是實(shí)際的最壞情況,并且隨著減速度的增加,差異變大。對(duì)于軌跡預(yù)測(cè),使用下限值實(shí)現(xiàn)最小度量值用于減速機(jī)動(dòng)。但是,hCG?上限值用于最可能的最壞情況。因此,存在更糟糕的情況,如圖? 11(c)所示。因?yàn)樾Ч鐖D7(a)的第二子圖所示,在軌跡預(yù)測(cè)僅排在第6位,??從最可能的最壞情況場(chǎng)景和實(shí)際最壞情況場(chǎng)景的軌跡之間的差異很小并且可以忽略。為了證實(shí)這種推斷,表4列出了軌跡預(yù)測(cè)的最壞情況不太可能,??并在下一節(jié)中用于閉環(huán)仿真。
表4 不太可能的最壞情況的參數(shù)值(粗體字表示與表3中列出的相應(yīng)方案的差異)
對(duì)于垂直載荷預(yù)測(cè),加速度和適度減速度,最可能的最壞情況是實(shí)際最壞情況,如圖 12(a,b)所示。但是,它沒(méi)有硬減速,如圖 12(c)所示。如果由導(dǎo)致最小度量值的場(chǎng)景生成的垂直負(fù)載分布是沿整個(gè)模擬范圍的垂直負(fù)載的下限,則將是有益的。然而,這種情況并非如此; 下限由多個(gè)場(chǎng)景的結(jié)果組成,如圖 13(b,c)所示。這些情景被認(rèn)為是垂直負(fù)荷預(yù)測(cè)的最不可能的最壞情況,并列于表4中。
圖13 開環(huán)仿真結(jié)果的垂直負(fù)載曲線,其中垂直負(fù)載預(yù)測(cè)的最可能和最不可能的最壞情況以及參數(shù)下限值和上限值的所有組合。(a)操作A; (b)操作B; (c)操作C.
4.4?魯棒性的最優(yōu)控制問(wèn)題公式
為了提高避障算法的魯棒性,考慮了兩種方法。第一種方法使策略保持原樣,并使用MPC公式中兩種最可能的最壞情況中的任何一種。第二種方法同時(shí)考慮兩種類型的最壞情況,稱為雙重最壞情況公式。在本文中,提出了兩種雙重最壞情況的配方。第一種情況僅考慮兩種最可能的最壞情況,并且每種情況都用于僅檢查相關(guān)約束。第二個(gè)也考慮了最不可能出現(xiàn)的最壞情況場(chǎng)景,除了兩個(gè)最可能的最壞情況之外,在策略中沒(méi)有引入額外的場(chǎng)景。
4.4.1?原始公式
由于MPC框架固有的魯棒性,具有名義情景的原始公式(稱為MPC0)可以在一定程度上容忍參數(shù)不確定性。圖2中顯示的結(jié)果? 用作評(píng)估有效性的基準(zhǔn),并研究在提高參數(shù)不確定性的魯棒性方面的權(quán)衡。
另外兩個(gè)也被考慮的MPC實(shí)現(xiàn)是具有最可能“最強(qiáng)”軌跡情景(MPC1)的原始公式,或者具有最可能最小垂直負(fù)載情形(MPC2)的原始公式。這兩種實(shí)現(xiàn)不會(huì)增加OCP公式的復(fù)雜性,只會(huì)改變MPC模型中使用的參數(shù)值。術(shù)語(yǔ)“最強(qiáng)”的軌跡場(chǎng)景用于指出基于軌跡“剛度”的最可能的最壞情況。類似地使用術(shù)語(yǔ)最可能的最小垂直載荷場(chǎng)景。
4.4.2 雙重最壞情況配方
第一個(gè)雙重最壞情況公式(MPC3)同時(shí)考慮兩個(gè)最可能的最壞情況,并且每個(gè)都用于僅檢查相關(guān)約束,這需要增加原始OCP公式。增強(qiáng)的MPC模型由等式(11)-(22)指定。要優(yōu)化的控制命令是縱向加加速度Jx?和轉(zhuǎn)向加速度?ηf,?用于提供對(duì)車輛的平穩(wěn)控制。
其中,U 是縱向速度,ax?是縱向加速度,δf ?是轉(zhuǎn)向角,γf? 是轉(zhuǎn)向角變化率。
分別用兩種最壞情況下的參數(shù)值,同時(shí)計(jì)算了兩組橫向動(dòng)力學(xué)和橫擺動(dòng)力學(xué)。第一組動(dòng)力學(xué)方程使用最可能發(fā)生的剛性最大軌跡場(chǎng)景的參數(shù)值ptraj,下標(biāo)traj表示相應(yīng)的參數(shù)和變量。
其中vtraj?是車輛坐標(biāo)系中的縱向速度,wz,traj?是橫擺角速度,Fy,f,traj ,Fy,r,traj?使輪胎前后軸的側(cè)向力,采用純滑移式Pacejka Magic Formula輪胎模型P作為車輛狀態(tài)和控制變量的函數(shù)計(jì)算橫向力。下標(biāo)f和r分別表示前橋和后橋。
第二組動(dòng)態(tài)方程使用最可能最小的垂直載荷場(chǎng)景的參數(shù)值pload???。
這組方程(19)(22)與(15)(18)相同,只是下標(biāo)load用來(lái)表示參數(shù)值來(lái)自最可能最小的垂直載荷場(chǎng)景,并且使用這些參數(shù)值計(jì)算變量。
由此,得到了兩組具有兩組參數(shù)值的車輛動(dòng)力學(xué)模型的狀態(tài)預(yù)測(cè)。每個(gè)集合只用于檢查相關(guān)約束的滿足程度。利用最可能發(fā)生的最硬軌跡情況的參數(shù)值和狀態(tài)預(yù)測(cè),計(jì)算了車輛的航向角和軌跡剖面。然后在成本函數(shù)中使用它們將車輛驅(qū)動(dòng)到指定的目標(biāo)位置,并在位置約束中使用它們將車輛保持在使用激光雷達(dá)數(shù)據(jù)建立的安全區(qū)域內(nèi)。
(x,y)是全球坐標(biāo)系中車輛的前中心位置,ψ是偏航角。
用于防止車輪提升的約束條件由下式給出:
Fz,threshold?是最小垂直載荷閾值。Fz,rl,load?和Fz,rr,load?為后左后輪和后右后輪的垂直載荷,計(jì)算為最可能最小垂直載荷情況下的參數(shù)值和狀態(tài)預(yù)測(cè)的函數(shù)。
Fz,r0,load?是靜態(tài)后軸負(fù)載;ΔFz,x,load?是由于縱向加速度在前后軸之間傳遞的載荷;?ΔFz,yr,load?是由于橫向加速度在兩個(gè)后輪之間傳遞的載荷;Kx,load?是縱向載荷傳遞系數(shù);?Kz,yr,load是后軸的橫向載荷傳遞系數(shù)。
面介紹的兩個(gè)限制的細(xì)節(jié)以及OCP策略的其余部分在此省略,因?yàn)樗鼈儽3窒嗤⒃赱11]中進(jìn)行了詳細(xì)討論。
第二個(gè)雙重最壞情況公式(MPC4)也考慮了最不可能出現(xiàn)的最壞情況,其方式除了兩個(gè)最可能的最壞情況之外,沒(méi)有在公式中引入其他方案。如第4.2節(jié)所述,并在第4.3節(jié)中進(jìn)行了說(shuō)明 ,對(duì)于垂直載荷預(yù)測(cè),最可能的最壞情況和實(shí)際最壞情況之間的差異隨著減速度的增加而變大。獲得三種不太可能的最壞情況,其中簧載質(zhì)量值處于其上限,并且輪胎參數(shù)值除了與場(chǎng)景2相比的兩個(gè)剛度相關(guān)參數(shù)之外處于相反的邊界。可以考慮所有三個(gè)較少的情況。通過(guò)進(jìn)一步增加狀態(tài)向量和增加約束數(shù)量,可能出現(xiàn)最糟糕的情況。然而,這種增加會(huì)增加解決OCP的計(jì)算負(fù)荷,這是不希望的。
如下開發(fā)了另一種方法。如圖? 13(b,c)所示,觀察到場(chǎng)景2和場(chǎng)景4的結(jié)果彼此非常接近,場(chǎng)景5的結(jié)果位于場(chǎng)景4的結(jié)果和場(chǎng)景6的結(jié)果之間。因此,如果只考慮一個(gè)不太可能的最壞情況,那就是情景6.此外,情景6和情景1除了三個(gè)質(zhì)量和慣性相關(guān)項(xiàng)之外是相同的,它們對(duì)度量值的影響較小。如圖7的第二子圖(b)所示。因此,情景6可以通過(guò)情景1來(lái)近似。因此,為了進(jìn)一步提高算法的魯棒性,可以通過(guò)考慮以下用于防止車輪提升的附加約束來(lái)增強(qiáng)MPC3,其成為MPC4,其解釋了不太可能出現(xiàn)的最壞情況。
Fz,rl,traj?和Fz,rr,traj?是左后輪胎和右后輪胎的垂直載荷,并計(jì)算為最可能“最強(qiáng)”的軌跡情景的參數(shù)值和狀態(tài)預(yù)測(cè)的函數(shù)。它們使用以下方程組來(lái)計(jì)算,除了使用不同的參數(shù)值組之外,其與方程(18)-21)相同。
表5總結(jié)了不同情景(MPC0,MPC1,MPC2)和兩個(gè)雙重最壞情況的原始公式的轉(zhuǎn)化為非線性規(guī)劃問(wèn)題(NLPs)中的變量數(shù),等式約束數(shù)和不等式約束數(shù)配方(MPC3和MPC4)的OCP相數(shù)Nph,用于離散化的節(jié)點(diǎn)數(shù)Nno,路徑約束的數(shù)量Npt,以及是事件限制的數(shù)量?Nev。因此,MPC4是計(jì)算上最昂貴的策略。
表5.MPC配方中OCP
5
模擬結(jié)果和討論
使用所有五種MPC配方進(jìn)行兩組模擬。第一組使用50個(gè)LHD場(chǎng)景,而第二組使用表3和表4中列出的七個(gè)場(chǎng)景? ,這是標(biāo)稱場(chǎng)景和六個(gè)最壞情況場(chǎng)景。
5.1 LHD場(chǎng)景
圖14顯示了使用考慮最壞情況的四種MPC公式的LHD情景的結(jié)果。表6總結(jié)了具有不同類型安全問(wèn)題和故障情景總數(shù)的方案的數(shù)量。雖然單個(gè)模擬可能存在多個(gè)安全問(wèn)題,但這僅僅算作一個(gè)失敗案例。因此,故障情景的總數(shù)不是表6中所有類型的安全問(wèn)題數(shù)量的總和。
圖14.使用不同控制器的50 LHD場(chǎng)景的閉環(huán)仿真結(jié)果。(a)MPC1的軌跡輪廓。(b)MPC1的垂直載荷曲線。(c)MPC2的軌跡輪廓。(d)MPC2的垂直載荷曲線。(e)MPC3的軌跡輪廓。(f)MPC3的垂直載荷曲線。(g)MPC4的軌跡輪廓。(h)MPC4的垂直載荷曲線。
表6. LHD情景中觀察到的安全問(wèn)題和故障情景的數(shù)量。
結(jié)論是,與MPC0相比,MPC1略微提高了參數(shù)不確定性的魯棒性。然而,MPC2顯著惡化了魯棒性。雖然沒(méi)有一個(gè)場(chǎng)景有車輪提升并且違反最小垂直載荷閾值的次數(shù)減少,但是違反最小距離目標(biāo)閾值的次數(shù)急劇增加,因此導(dǎo)致不能完成任務(wù),不滿足最終航向角要求。MPC3和MPC4都顯著提高了魯棒性,因?yàn)樗薪Y(jié)果都是動(dòng)態(tài)安全的并且滿足任務(wù)要求。值得強(qiáng)調(diào)的是,雖然魯棒性得到了改善,但無(wú)法保證所有可能的情況都使用MPC3或MPC4,因?yàn)樵诓呗灾兄豢紤]了最可能的最壞情況。
預(yù)計(jì)提高參數(shù)不確定性的魯棒性會(huì)犧牲任務(wù)完成性能。為了評(píng)估這種權(quán)衡,使用四個(gè)度量來(lái)評(píng)估障礙物避免算法的任務(wù)完成性能:目標(biāo)時(shí)間,平均速度,加速性能和轉(zhuǎn)向性能。除了優(yōu)選較大度量值的平均速度之外,其他三個(gè)度量值需要較小的值。僅當(dāng)場(chǎng)景不包含具有所有考慮的控制器的故障場(chǎng)景時(shí),度量的比較才有意義。因此,僅考慮使用MPC0沒(méi)有安全問(wèn)題的38個(gè)場(chǎng)景,因?yàn)槌薓PC2之外,其他三個(gè)控制器也不會(huì)導(dǎo)致這38個(gè)場(chǎng)景的安全問(wèn)題。表7 總結(jié)了除MPC2之外的每個(gè)MPC配方的平均度量值。
表7 使用MPC0成功的38個(gè)LHD場(chǎng)景的任務(wù)完成性能評(píng)估指標(biāo)
將使用MPC1的結(jié)果與使用MPC0的結(jié)果進(jìn)行比較,前三個(gè)性能指標(biāo)略差,最后一個(gè)略好一些。對(duì)于MPC3和MPC4,前三個(gè)性能指標(biāo)與MPC0和MPC1相比都略差。因此,可以得出結(jié)論,在魯棒性和任務(wù)完成性能之間存在折衷。通過(guò)考慮最壞情況場(chǎng)景來(lái)提高穩(wěn)健性會(huì)降低任務(wù)完成性能。更具體地說(shuō),由于策略的保守性,MPC3和MPC4的平均速度比MPC0慢約11%。由于速度較慢和/或路線較長(zhǎng),使用MPC3和MPC4的目標(biāo)時(shí)間比使用MPC0的時(shí)間長(zhǎng)約11%。此外,MPC3和MPC4使用的加速力比MPC0多50%。這三個(gè)控制器所需的轉(zhuǎn)向力幾乎相同。總之,MPC3和MPC4都顯著地改善了避障算法對(duì)參數(shù)不確定性的魯棒性,然而,如上所述,以任務(wù)完成性能降低為代價(jià)。
使用MPC2產(chǎn)生的結(jié)果在所有考慮的配方中在每個(gè)方面都是最差的。原因是使用最可能最小的垂直載荷場(chǎng)景生成的軌跡非常“靈活”,如圖9和圖? 11所示。因此,用MPC2產(chǎn)生的轉(zhuǎn)向命令不足以使幾乎所有場(chǎng)景都使AGV遠(yuǎn)離障礙物。在通過(guò)硬減速進(jìn)行急轉(zhuǎn)彎之前,AGV非常接近障礙物,這導(dǎo)致大的控制力,顯著的迂回和任務(wù)不完整。
5.2 最壞情況
圖 15顯示了使用MPC0的標(biāo)稱場(chǎng)景和六種最壞情況的閉環(huán)仿真結(jié)果。除了標(biāo)稱場(chǎng)景的模擬外,其他六個(gè)模擬導(dǎo)致安全問(wèn)題。情景2,4和6導(dǎo)致車輪抬起。方案1和5的結(jié)果違反了最小垂直負(fù)載閾值。方案1和方案3導(dǎo)致違反最小距離到目標(biāo)閾值并且無(wú)法完成任務(wù)。因此,MPC0是具有標(biāo)稱參數(shù)值的原始公式,對(duì)最壞情況不具有魯棒性。
圖15.使用MPC0的標(biāo)稱場(chǎng)景和最壞情況的閉環(huán)仿真結(jié)果。(a)具有MPC0的軌跡輪廓; (b)MPC0的垂直載荷曲線。
圖 16顯示了其他四種MPC策略的結(jié)果。表8總結(jié)了具有不同類型的安全問(wèn)題和故障情景總數(shù)的方案的數(shù)量。結(jié)果表明,雖然觀察到不同程度的成功,但這四個(gè)控制器比MPC0更有效。只有在使用MPC4時(shí),這是五個(gè)中最復(fù)雜的配方,在最壞情況下,模擬結(jié)果中沒(méi)有安全問(wèn)題或任務(wù)完成問(wèn)題。對(duì)于MPC1,方案2導(dǎo)致車輪提升,方案4和5的結(jié)果違反了最小垂直負(fù)載閾值。對(duì)于MPC2,只有方案2和4的結(jié)果沒(méi)有安全問(wèn)題或任務(wù)完成問(wèn)題。對(duì)于MPC3,方案1和6導(dǎo)致違反最小垂直負(fù)載閾值。因此,當(dāng)考慮最壞情況時(shí),MPC4是在所有考慮的五種方案中所有考慮的情景中對(duì)參數(shù)不確定性具有魯棒性的公式。
圖16 使用不同控制器的標(biāo)稱場(chǎng)景和最壞情況場(chǎng)景的閉環(huán)仿真結(jié)果。顏色約定與圖15相同。(a)MPC1的軌跡剖面; (b)MPC1的垂直載荷剖面; (c)MPC2的軌跡剖面; (d)MPC2的垂直載荷剖面; (e)MPC3的軌跡剖面; (f)MPC3的垂直載荷剖面; (g)MPC4的軌跡剖面; (h)MPC4的垂直載荷曲線。
表8 標(biāo)稱方案和最壞情況下觀察到的安全問(wèn)題和故障情景的數(shù)量
最后,這組結(jié)果不用于研究魯棒性和任務(wù)完成性能之間的權(quán)衡,因?yàn)樵伎刂破?MPC0)在所有最壞情況下都失敗了。此外,如果要比較MPC1,MPC3和MPC4的任務(wù)完成性能,則只能使用場(chǎng)景0和場(chǎng)景3,因?yàn)檫@三個(gè)控制器不會(huì)僅在這七個(gè)考慮場(chǎng)景中的這兩個(gè)場(chǎng)景中導(dǎo)致安全問(wèn)題。但是,這兩種情況的數(shù)量太少,無(wú)法產(chǎn)生具有統(tǒng)計(jì)意義的結(jié)果。
總之,使用分層隨機(jī)場(chǎng)景和最壞情況場(chǎng)景的模擬結(jié)果表明,只有第二個(gè)雙重最壞情況公式(MPC4)才能使算法對(duì)所有測(cè)試的不確定性實(shí)現(xiàn)都具有魯棒性。從模擬的性能評(píng)估度量與分層隨機(jī)場(chǎng)景的比較,還得出結(jié)論,魯棒性的提高降低了性能,但可以說(shuō),降低到可接受的水平。
預(yù)計(jì)結(jié)論對(duì)于其他障礙領(lǐng)域是通用的,因?yàn)樽羁赡艿淖顗那闆r場(chǎng)景是獨(dú)立于障礙物配置而獲得的。本文討論的兩組模擬也已經(jīng)在我們之前的工作中討論過(guò)另一個(gè)甚至更具挑戰(zhàn)性的障礙領(lǐng)域[11],本文省略了結(jié)果,但它們得出與上述相同的結(jié)論。
6
結(jié)論和其他研究
作者以前的工作重點(diǎn)是在未知和非結(jié)構(gòu)化環(huán)境中的大型高速自主地面車輛中避障,并開發(fā)了基于非線性MPC的避障算法。該算法的目的是利用車輛的動(dòng)態(tài)極限將其盡可能快地導(dǎo)航到給定的目標(biāo)位置而不損害安全性。為此,該算法依賴于車輛和輪胎參數(shù)的知識(shí)。
本文首先研究了參數(shù)不確定性對(duì)避障算法性能的影響。該研究表明需要提高算法的魯棒性,并且由于應(yīng)用現(xiàn)有技術(shù)的困難,提出了新的公式。與依賴于對(duì)數(shù)百個(gè)場(chǎng)景的評(píng)估的現(xiàn)有基于場(chǎng)景的方法不同,新的公式通過(guò)僅考慮兩種最可能的最壞情況場(chǎng)景來(lái)提高魯棒性。此外,與分析魯棒或隨機(jī)MPC算法不同,所提出的方法適用于非線性系統(tǒng)和非高斯不確定性分布。因此,實(shí)現(xiàn)了計(jì)算上有效的公式以改善非線性MPC算法的魯棒性。最后,討論了獲得的額外穩(wěn)健性和任務(wù)完成性能之間的權(quán)衡。可以得出結(jié)論,所提出的雙最壞情況公式可以以某種可接受的任務(wù)完成性能降低為代價(jià)來(lái)提高算法的魯棒性。
因此,總之,本文的貢獻(xiàn)描述如下。首先評(píng)估基于非線性MPC的避障算法對(duì)參數(shù)不確定性的魯棒性。其次,確定了兩種類型的不安全情景,這些情景被定義為最硬的軌跡和最小的垂直載荷情景。第三,開發(fā)了一種算法來(lái)獲得每種類型的不安全情景的最可能和最不可能的最壞情況。第四,開發(fā)了一種考慮最壞情況的新的雙重最壞情況公式,以解釋避障算法中的參數(shù)不確定性。最后,分析了魯棒性和任務(wù)完成性能之間的權(quán)衡。
本文介紹的方法是被動(dòng)的。可以在補(bǔ)充中使用主動(dòng)方法,其通過(guò)在線非線性自適應(yīng)估計(jì)器來(lái)減少不確定性,以基于模型預(yù)測(cè)與從車輛收集的實(shí)際數(shù)據(jù)之間的差異來(lái)獲得參數(shù)值的更準(zhǔn)確的估計(jì)。為此,可以利用現(xiàn)有的自適應(yīng)觀測(cè)器方案,例如擴(kuò)展卡爾曼濾波器[ 31 ]。未來(lái)的研究可能包括將這種能力添加到閉環(huán)系統(tǒng)中,以減少由于大的不確定性范圍引起的保守性導(dǎo)致的任務(wù)完成性能下降。
最后,除了參數(shù)不確定性之外,還有其他不確定性來(lái)源。例如,一個(gè)不確定性來(lái)源是車輛位置知識(shí)的誤差,以及障礙物的當(dāng)前和未來(lái)位置。另一個(gè)不確定因素是由風(fēng)和其他因素引起的外部干擾。這些來(lái)源也可能引起問(wèn)題,需要加以考慮[ 20 ]。研究其他不確定性來(lái)源的影響是未來(lái)研究的主題。
參考文獻(xiàn):
[1] Khatib O. Real-time obstacle avoidancefor manipulators and mobile robots. Int J Rob Res.1986;5:90–98.
[2] Ogren P, Leonard NE. A convergentdynamic window approach to obstacle avoidance. IEEE Trans Robot.2005;21:188–195.
[3] Shimoda S, Kuroda Y, Iagnemma K.High-speed navigation of unmanned ground vehicles on uneven terrain usingpotential fields. Robotica. 2007;25:409–424.
[4] Park JM, Kim DW, Yoon YS, et al.Obstacle avoidance of autonomous vehicles based on model predictive control.Proc Inst Mech Eng Part D J Automob Eng. 2009;223:1499–516.
[5] Gao Y, Lin T,Borrelli F, et al. Predictive control of autonomousground vehicles with obstacle avoidance on slippery roads. Proceedings of theASME 2010 Dynamic Systems and Control Conference (DSCC) Vol. 1; 2010 Sept12-15; American Society of Mechanical Engineers, Cambridge, MA; 2010. p.265–272.
[6] Tahirovic A,MagnaniG.General frameworkfor mobile robot navigation using passivity-based MPC. IEEE Trans AutomatControl. 2011;56:184–190.
[7] Gray A, Gao Y, Lin T, et al. Predictivecontrol for agile semi-autonomous ground vehicles using motion primitives.Proceedings of the 2012 American Control Conference (ACC 2012); 2012 Jun 27-29;Institute of Electrical and Electronics Engineers Inc., Montréal, Canada; 2012.p.4239–4244.
[8] Frasch JV,Gray A, Zanon M, et al. An auto-generated nonlinear MPCalgorithm for real-time obstacle avoidance of ground vehicles. Proceedings the2013 European Control Conference (ECC 2013); 2013 Jul 17-19; IEEE ComputerSociety, Zurich, Switzerland; 2013. p. 4136–4141.
[9] Beal CE, Gerdes JC.Model predictivecontrol for vehicle stabilization at the limits of handling. IEEE Trans ControlSyst Technol. 2013;21:1258–1269.
[10] Liu J, Jayakumar P, Stein JL, ET AL. Anonlinear model predictive control formulation for
obstacle avoidance in high-speed autonomousground vehicles in unstructured environments.
Vehicle Syst Dyn. 2018;56:853–882.
[11] Liu J, Jayakumar P, Stein JL, et al.Combined speed and steering control in high speed
autonomous ground vehicles for obstacleavoidance usingmodel predictive control. IEEE Trans Veh Technol.2017;66:8746–8763.
[12] Liu J, Jayakumar P, Stein JL, et al. Astudy on model fidelity for model predictive controlbased obstacle avoidance inhigh-speed autonomous ground vehicles. Vehicle Syst Dyn.2016;54:1629–1650.
[13] Walton CL. The design andimplementation of motion planning problems given parameter uncertainty [PhDdissertation]. Santa Cruz: University of California; 2015.
[14] Bemporad A, Morari M. Robust modelpredictive control: A survey. In: Garulli A, Tesi A, editors. Robustness inidentification and control. Lecture Notes in Control and Information Sciences,vol 245. London: Springer; 1999.
[15] Jalali AA,NadimiV.Asurvey onrobustmodel predictive control from1999–2006. Proceedings of the CIMCA 2006International Conference on Computational Intelligence for Modelling, Controland Automation. Jointly with IAWTIC 2006 International Conference onIntelligent AgentsWeb Technology, Institute of Electrical and ElectronicsEngineering Computer Society; 2008 Dec 10-12; Vienna, Austria; 2007.
[16] Adetola V, Guay M. Robust adaptive MPCfor constrained uncertain nonlinear systems. Int J Adapt Control SignalProcess. 2011;25:155–167.
[17] Carvalho A, Lefevre S, Schildbach G,et al. Automated driving: the role of forecasts and uncertainty–a controlperspective. Eur J Control. 2015;24:14–32.
[18] Ramirez DR, Alamo T, Camacho EF, etal. Min-MaxMPC based on a computationally efficient upper bound of the worstcase cost. J Process Control. 2006;16:511–519.
[19] Carson JM, Acikmese B, Murray RM, etal. A robust model predictive control algorithm augmented with a reactivesafetymode. Automatica. 2013;49:1251–1260.
[20] Gao Y, Gray A, Tseng HE, et al. Atube-based robust nonlinear predictive control approach to semiautonomousground vehicles. Vehicle SystDyn. 2014;52:802–823.
[21] SchildbachG, Fagiano L, Frei C, et al. The scenario approach forstochasticmodel predictive control with bounds on closed-loop constraintviolations. Automatica. 2014;50:3009–3018.
[22] Carvalho A, Gao Y, Gray A, et al.Predictive control of an autonomous ground vehicle using an iterativelinearization approach. Proceedings of the 16th International IEEE Conferenceon Intelligent Transportation Systems (ITSC 2013); 2013 Oct 6-9; The Hague, TheNetherlands; 2013. p. 2335–2340.
[23] Maiworm M, Bathge T, Findeisen R.Scenario-based model predictive control: recursive feasibility and stability.IFAC Proc Vol. 2015;28:50–56.
[24] Xiong F, Xiong Y, Xue B. Trajectoryoptimization under uncertainty based on polynomial chaos expansion. Proceedingsof the AIAA Guidance, Navigation, and Control Conference 2013; 2013 Aug 19-22;American Institute of Aeronautics and Astronautics Inc, AIAA, Boston, MA; 2015.
[25] Xiu D, Em Karniadakis G. TheWiener-Askey polynomial chaos for stochastic differential equations. SIAM J SciComput. 2003;24:619–644.
[26] Shim T, Ghike C. Understanding thelimitations of different vehicle models for roll dynamics studies. User ModelUser-Adapt Interact. 2007;45:191–216.
[27] Pacejka H. Tire and vehicle dynamics.Oxford: Elsevier; 2012.
[28] Rucco A, Notarstefano G, Hauser J.Optimal control based dynamics exploration of a rigid car with longitudinalload transfer. IEEE Trans Control Syst Technol. 2014;22:1070–1077.
[29] Viana FAC. Things you wanted to knowabout the Latin hypercube design and were afraid to ask. Proceedings of the10th World Congress on Structural and Multidisciplinary Optimization; 2013 May5-24; Orlando, Florida; 2013. p. 1–9.
[30] Viana FAC, Venter G, Balabanov V. Analgorithm for fast optimal latin hypercube design of experiments. Int J NumerMethods Eng. 2010;82:135–156.
[31] AstromKJ, Wittenmark B. Adaptivecontrol. 2nd ed. Upper Saddle River: PrenticeHall; 2008.
END
聯(lián)系人:李老師??
電話:021-69589225
郵箱:11666104@tongji.edu.cn
總結(jié)
以上是生活随笔為你收集整理的非确定性算法_使用最坏情况提高基于MPC的避障算法对参数不确定性的鲁棒性的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 广度优先搜索_广度优先搜索(BFS)
- 下一篇: python网页优化公司_使用pytho