5.7 随机采样最小二乘法
5.7 隨機(jī)采樣最小二乘法
如果萬(wàn)一出現(xiàn)差錯(cuò),又難以檢測(cè)出,則強(qiáng)影響點(diǎn)影響很大,此時(shí)可以采用一種隨機(jī)方法,盡量避免差錯(cuò)帶來(lái)的影響。
隨機(jī)最小二乘法不采用所有測(cè)量數(shù)據(jù),而是隨機(jī)抽取部分測(cè)量數(shù)據(jù),根據(jù)這些部分測(cè)量數(shù)據(jù)進(jìn)行最小二乘。如果沒(méi)有抽取到強(qiáng)影響點(diǎn),則由抽取到的部分測(cè)量數(shù)據(jù)進(jìn)行最小二乘法能獲得滿意的結(jié)果,所以隨機(jī)最小二乘法關(guān)鍵是怎么保證沒(méi)有抽取到強(qiáng)影響點(diǎn)。由于隨機(jī)抽取到強(qiáng)影響點(diǎn)的概率與強(qiáng)影響點(diǎn)所占比例成正比,故強(qiáng)影響點(diǎn)越少,抽取到的可能性越低。具體做法如下:
為了避免實(shí)際抽取到了強(qiáng)影響點(diǎn),但由于巧合,第 222 步卻沒(méi)有發(fā)現(xiàn)強(qiáng)影響點(diǎn),導(dǎo)致擬合徹底失敗,可以多次運(yùn)行上面流程,得到多個(gè)模型,選取最好的模型。
該方法最大優(yōu)點(diǎn)是能適用于強(qiáng)影響點(diǎn)比例很大的場(chǎng)景,比如強(qiáng)影響點(diǎn)比例達(dá) 60%60\%60% ,缺點(diǎn)是運(yùn)行時(shí)間不定,效果不定,有一定運(yùn)氣成分。需要設(shè)定幾個(gè)閾值,比如第一步的比例 ppp ,第二步的判斷強(qiáng)影響點(diǎn)的殘差設(shè)定,第三步的預(yù)測(cè)殘差與殘差大小相當(dāng)?shù)脑O(shè)定,最后判斷最好模型的設(shè)定,總的來(lái)說(shuō),最終結(jié)果對(duì)這些閾值不是很敏感,閾值能在較大范圍內(nèi)變動(dòng),而不影響最終結(jié)果。該方法和 RANSACRANSACRANSAC 隨機(jī)采樣一致性算法十分類似。
總結(jié)
以上是生活随笔為你收集整理的5.7 随机采样最小二乘法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 5.6 稳健最小二乘法
- 下一篇: 5.8 正则化和数据标准化