机器学习知识点(三十五)蒙特卡罗方法
強(qiáng)化學(xué)習(xí)中免模型學(xué)習(xí)采用蒙特卡羅方法去逼近最優(yōu)解,那這種采樣原理是怎樣的呢?
1、蒙特卡羅思想
? ? ? 是一類隨機(jī)方法的統(tǒng)稱。這類方法的特點(diǎn)是,可以在隨機(jī)采樣上計(jì)算得到近似結(jié)果,隨著采樣的增多,得到的結(jié)果是正確結(jié)果的概率逐漸加大,但在(放棄隨機(jī)采樣,而采用類似全采樣這樣的確定性方法)獲得真正的結(jié)果之前,無(wú)法知道目前得到的結(jié)果是不是真正的結(jié)果。
? ? ? 和拉斯維加斯算法相比,經(jīng)典的描述就是:
? ? ?蒙特卡羅算法:采樣越多,越近似最優(yōu)解;盡量找好的,但不保證是最好的。
? ? 拉斯維加斯算法:采樣越多,越有機(jī)會(huì)找到最優(yōu)解;盡量找最好的,但不保證能找到。
? ? 這是一種采樣隨機(jī)的算法或原理。誕生于上個(gè)世紀(jì)40年代美國(guó)的"曼哈頓計(jì)劃",名字來(lái)源于賭城蒙特卡羅,象征概率。近似或逼近,插值等等概念不外如是。
2、蒙特卡羅數(shù)學(xué)定義
??
??
3、借案例理解-π的計(jì)算
? ??蒙特卡羅算法表示采樣越多,越近似最優(yōu)解。舉個(gè)例子,假如筐里有100個(gè)蘋(píng)果,讓我每次閉眼拿1個(gè),挑出最大的。于是我隨機(jī)拿1個(gè),再隨機(jī)拿1個(gè)跟它比,留下大的,再隨機(jī)拿1個(gè)……我每拿一次,留下的蘋(píng)果都至少不比上次的小。拿的次數(shù)越多,挑出的蘋(píng)果就越大,但我除非拿100次,否則無(wú)法肯定挑出了最大的。這個(gè)挑蘋(píng)果的算法,就屬于蒙特卡羅算法。告訴我們樣本容量足夠大,則最接近所要求解的概率。
? ??
如何用蒙特卡羅方法計(jì)算圓周率π。
正方形內(nèi)部有一個(gè)相切的圓,它們的面積之比是π/4。
現(xiàn)在,在這個(gè)正方形內(nèi)部,隨機(jī)產(chǎn)生10000個(gè)點(diǎn)(即10000個(gè)坐標(biāo)對(duì) (x, y)),計(jì)算它們與中心點(diǎn)的距離,從而判斷是否落在圓的內(nèi)部。
如果這些點(diǎn)均勻分布,那么圓內(nèi)的點(diǎn)應(yīng)該占到所有點(diǎn)的 π/4,因此將這個(gè)比值乘以4,就是π的值。通過(guò)R語(yǔ)言腳本隨機(jī)模擬30000個(gè)點(diǎn),π的估算值與真實(shí)值相差0.07%。
? ??
? ? ??
總結(jié)
以上是生活随笔為你收集整理的机器学习知识点(三十五)蒙特卡罗方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 机器学习笔记(十六)强化学习
- 下一篇: 【正一专栏】欧冠决赛点评——只服齐达内,