日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

机器学习知识点(三十五)蒙特卡罗方法

發(fā)布時(shí)間:2025/4/16 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 机器学习知识点(三十五)蒙特卡罗方法 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

強(qiáng)化學(xué)習(xí)中免模型學(xué)習(xí)采用蒙特卡羅方法去逼近最優(yōu)解,那這種采樣原理是怎樣的呢?


1、蒙特卡羅思想

? ? ? 是一類隨機(jī)方法的統(tǒng)稱。這類方法的特點(diǎn)是,可以在隨機(jī)采樣上計(jì)算得到近似結(jié)果,隨著采樣的增多,得到的結(jié)果是正確結(jié)果的概率逐漸加大,但在(放棄隨機(jī)采樣,而采用類似全采樣這樣的確定性方法)獲得真正的結(jié)果之前,無(wú)法知道目前得到的結(jié)果是不是真正的結(jié)果。

? ? ? 和拉斯維加斯算法相比,經(jīng)典的描述就是:

? ? ?蒙特卡羅算法:采樣越多,越近似最優(yōu)解;盡量找好的,但不保證是最好的。
? ? 拉斯維加斯算法:采樣越多,越有機(jī)會(huì)找到最優(yōu)解;盡量找最好的,但不保證能找到。

? ? 這是一種采樣隨機(jī)的算法或原理。誕生于上個(gè)世紀(jì)40年代美國(guó)的"曼哈頓計(jì)劃",名字來(lái)源于賭城蒙特卡羅,象征概率。近似或逼近,插值等等概念不外如是。


2、蒙特卡羅數(shù)學(xué)定義

??

??


3、借案例理解-π的計(jì)算

? ??蒙特卡羅算法表示采樣越多,越近似最優(yōu)解。舉個(gè)例子,假如筐里有100個(gè)蘋(píng)果,讓我每次閉眼拿1個(gè),挑出最大的。于是我隨機(jī)拿1個(gè),再隨機(jī)拿1個(gè)跟它比,留下大的,再隨機(jī)拿1個(gè)……我每拿一次,留下的蘋(píng)果都至少不比上次的小。拿的次數(shù)越多,挑出的蘋(píng)果就越大,但我除非拿100次,否則無(wú)法肯定挑出了最大的。這個(gè)挑蘋(píng)果的算法,就屬于蒙特卡羅算法。告訴我們樣本容量足夠大,則最接近所要求解的概率。

? ??

如何用蒙特卡羅方法計(jì)算圓周率π。

正方形內(nèi)部有一個(gè)相切的圓,它們的面積之比是π/4。

現(xiàn)在,在這個(gè)正方形內(nèi)部,隨機(jī)產(chǎn)生10000個(gè)點(diǎn)(即10000個(gè)坐標(biāo)對(duì) (x, y)),計(jì)算它們與中心點(diǎn)的距離,從而判斷是否落在圓的內(nèi)部。

如果這些點(diǎn)均勻分布,那么圓內(nèi)的點(diǎn)應(yīng)該占到所有點(diǎn)的 π/4,因此將這個(gè)比值乘以4,就是π的值。通過(guò)R語(yǔ)言腳本隨機(jī)模擬30000個(gè)點(diǎn),π的估算值與真實(shí)值相差0.07%。

? ??

? ? ??


總結(jié)

以上是生活随笔為你收集整理的机器学习知识点(三十五)蒙特卡罗方法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。