概率机器人阅读笔记
第一章 緒論
機(jī)器人學(xué)是一門通過計(jì)算機(jī)控制設(shè)備來感知和操縱物理世界的科學(xué),脫離開結(jié)構(gòu)化的工作環(huán)境,客觀世界中存在著大量的不確定性:
- 機(jī)器人環(huán)境的不可預(yù)測
- 傳感器感知信息的局限性
- 執(zhí)行機(jī)構(gòu)的不確定性
- 機(jī)器人軟件中抽象模型的誤差。
為了使機(jī)器人接納這些不確定性,《概率機(jī)器人》致力于將機(jī)器人感知與行為的不確定性用概率理論明確地表示出來,推測整個(gè)空間中概率分布信息,表示出每種可能的模糊性和置信度,形成相對魯棒的控制方式。
概率理論是有其局限性的,主要在計(jì)算的復(fù)雜性和近似的必要性上。
機(jī)器人技術(shù)的發(fā)展已經(jīng)經(jīng)歷了基于模型的范式和基于行為的范式,前者依賴于給定的環(huán)境和機(jī)器人的完整的精確的模型,后者則依賴于機(jī)器人與物理世界交互過程中的檢測的精確性,現(xiàn)代概率機(jī)器人學(xué)從20世紀(jì)90年代中期已經(jīng)出現(xiàn),通過將模型和傳感器測量兩者相結(jié)合,設(shè)計(jì)出控制行為。
第二章 遞歸狀態(tài)估計(jì)
本章節(jié)介紹的貝葉斯濾波,是狀態(tài)估計(jì)的遞歸算法,是本書幾乎每一項(xiàng)技術(shù)的基礎(chǔ)。
概率
可以將普通的一維正態(tài)分布表示為:
p(x)=(2πσ2)?12exp?{?12(x?μ)2σ2}p(x)=(2{\pi}{\sigma}^2)^{-\frac{1}{2}}\exp\{-\frac{1}{2}\frac{(x-\mu)^2}{{\sigma}^2}\} p(x)=(2πσ2)?21?exp{?21?σ2(x?μ)2?}
拓展到多維可以寫為
p(x)=det(2πΣ)?12exp?{?12(x?μ)TΣ?1(x?μ)}p(x)=det(2{\pi}{\Sigma})^{-\frac{1}{2}}\exp\{-\frac{1}{2}(x-\mu)^T{\Sigma}^{-1}(x-\mu)\} p(x)=det(2πΣ)?21?exp{?21?(x?μ)TΣ?1(x?μ)}
其中 μ\muμ 為均值矢量,Σ\SigmaΣ 為一個(gè)半正定對稱矩陣,稱為協(xié)方差矩陣。
全概率定理
p(x)=∑yp(x∣y)p(y)(離散情況)p(x)=∫p(x∣y)p(y)dy(連續(xù)情況)p(x)={\sum_y}p(x|y)p(y)\ \ \ \ \ \ (離散情況) \\ p(x)={\int}p(x|y)p(y)dy\ \ \ \ \ \ (連續(xù)情況) p(x)=y∑?p(x∣y)p(y)??????(離散情況)p(x)=∫p(x∣y)p(y)dy??????(連續(xù)情況)
進(jìn)而得到貝葉斯準(zhǔn)則
p(x∣y)=p(y∣x)p(x)p(y)=...(離散/連續(xù)情況)p(x|y)=\frac{p(y|x)p(x)}{p(y)}=...\ \ \ \ \ \ (離散/連續(xù)情況) p(x∣y)=p(y)p(y∣x)p(x)?=...??????(離散/連續(xù)情況)
在這個(gè)公式中,xxx 是希望由 yyy 推測出來的數(shù)值,p(x)p(x)p(x) 是先驗(yàn)概率分布(前一次概率計(jì)算結(jié)果),yyy 為傳感器測量值,得出了 XXX 的后驗(yàn)概率分布 p(x∣y)p(x|y)p(x∣y) 。
狀態(tài)
環(huán)境特征以狀態(tài)表征,本書中認(rèn)為狀態(tài)是所有會(huì)對未來產(chǎn)生影響的機(jī)器人和其環(huán)境的所有方面因素,典型的狀態(tài)變量包括:
- 機(jī)器人位姿:
- 執(zhí)行機(jī)構(gòu)配置:
- 速度和角速度:
- 環(huán)境中周圍物體的位置和特征:
總結(jié)