日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

贝叶斯告诉你,投掷硬币概率可以是90%

發(fā)布時(shí)間:2024/4/18 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 贝叶斯告诉你,投掷硬币概率可以是90% 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

信貝爺, 得永生

開頭先開個(gè)玩笑, 有人說(shuō)“信貝爺, 得永生” 你是否理解此中真意??

貝爺是這位, 生前是個(gè)神父。

貝葉斯分析是整個(gè)機(jī)器學(xué)習(xí)的基礎(chǔ)框架, 它的思想之深刻遠(yuǎn)出一般人所認(rèn)知的, 我們這里要從貝葉斯統(tǒng)計(jì)說(shuō)起。

首先談概率,概率這件事大家都覺得自己很熟悉, 叫你說(shuō)概率的定義 , 你卻不一定說(shuō)的出,我們中學(xué)課本里說(shuō)概率這個(gè)東西表述是一件事發(fā)生的頻率, 或者說(shuō)這叫做客觀概率。

而貝葉斯框架下的概率理論確從另一個(gè)角度給我們展開了答案, 他說(shuō)概率是我們個(gè)人的一個(gè)主觀概念, 表明我們對(duì)某個(gè)事物發(fā)生的相信程度。?如同Pierre Lapalace說(shuō)的: Probability theory is nothing but common sense reduced to calculation. ?這正是貝葉斯流派的核心,換句話說(shuō),它解決的是來(lái)自外部的信息與我們大腦內(nèi)信念的交互關(guān)系。

兩種對(duì)于概率的解讀區(qū)別了頻率流派和貝葉斯流派。如果你不理解主觀概率就無(wú)法理解貝葉斯定律的核心思想。

貝爺居然能解決家庭糾紛?

我們來(lái)看一下貝葉斯統(tǒng)計(jì)的一個(gè)有趣的案例案例:假如你是一個(gè)女生, 你在你的老公書包里發(fā)現(xiàn)了一個(gè)別的女人的內(nèi)褲那么他出軌的概率是多少。?

圖:貝爺居然能解決家庭糾紛?

稍微熟悉這個(gè)問(wèn)題的人對(duì)會(huì)知道做這個(gè)題目你要先考察基率,你要把這個(gè)問(wèn)題分解為幾步考慮:

1,你老公在沒有任何概率情況下出軌的概率是多少? 如果他是個(gè)天生老實(shí)巴交的程序員或者風(fēng)流倜儻的CEO, 那么顯然不該一視同仁

2,如果你老公出軌了, 那么他有一條內(nèi)褲的概率是多少, 如果他沒出軌, 出現(xiàn)這個(gè)情況概率有多少? ?想想一般人即使出軌也不會(huì)犯那么傻的錯(cuò)誤, 會(huì)不會(huì)有沒出軌而出現(xiàn)內(nèi)褲的狀況? 有沒有可能是某個(gè)暗戀你老公的人的陷害?

3, 根據(jù)1 和2求解最終問(wèn)題,這才是擁有大學(xué)數(shù)學(xué)能力的你該做的分析。

在這里1其實(shí)就是先驗(yàn)概率P(A),而2是條件概率P(B|A), 最終得到3后驗(yàn)概率P(A|B)。這三種即是貝葉斯統(tǒng)計(jì)的三要素。

基于條件概率的貝葉斯定律數(shù)學(xué)方程極為簡(jiǎn)單:?

A即出軌, B是內(nèi)褲出現(xiàn), 你得到1,2,就可以根據(jù)公式算出根據(jù)根據(jù)內(nèi)褲出現(xiàn)判斷出軌的概率。

先驗(yàn)概率在貝葉斯統(tǒng)計(jì)中具有重要意義,首先先驗(yàn)概率即我們?cè)谌〉米C據(jù)之前所指定的概率P(A), 這個(gè)值通常是根據(jù)我們之前的常識(shí),帶有一定的主觀色彩。 就像剛剛說(shuō)的出軌的問(wèn)題, 你的先驗(yàn)概率代表了你對(duì)你男人的信心。

有一個(gè)非常有趣的現(xiàn)象是如果我們的先驗(yàn)概率審定為1或0(即肯定或否定某件事發(fā)生), 那么無(wú)論我們?nèi)绾卧黾幼C據(jù)你也依然得到同樣的條件概率(此時(shí)P(A)=0 或 1 , P(A|B)= 0或1) 這告訴我們的第一個(gè)經(jīng)驗(yàn)就是不要過(guò)早的下論斷, 下了論斷你的預(yù)測(cè)也就無(wú)法進(jìn)化了, 或者可以稱之為信仰。?你如果想讓你的認(rèn)知進(jìn)步,就要給各種假設(shè)留一點(diǎn)空間。

貝葉斯分析看辛普森案

貝葉斯分析的思路對(duì)于由證據(jù)的積累來(lái)推測(cè)一個(gè)事物發(fā)生的概率具有重大作用, 它告訴我們當(dāng)我們要預(yù)測(cè)一個(gè)事物, 我們需要的是首先根據(jù)已有的經(jīng)驗(yàn)和知識(shí)推斷一個(gè)先驗(yàn)概率, 然后在新證據(jù)不斷積累的情況下調(diào)整這個(gè)概率,整個(gè)通過(guò)積累證據(jù)來(lái)得到一個(gè)事件發(fā)生概率的過(guò)程我們稱為貝葉斯分析。

貝葉斯分析中的三要素在不同的問(wèn)題中通常側(cè)重點(diǎn) , 很多時(shí)候我們都是在忽略先驗(yàn)概率的作用,比如描述一個(gè)人很書呆子氣讓你判斷他是大學(xué)老師還是銷售員的經(jīng)典案例(要看先驗(yàn)大學(xué)老師還是銷售員哪個(gè)多啊)。?

但是有時(shí)候我們也不理解條件概率, 比如著名的辛普森案, 為了證明辛普森有殺妻之罪,檢方說(shuō)辛普森之前家暴,而辯護(hù)律師說(shuō),美國(guó)有400萬(wàn)女性被丈夫或男友打過(guò),而其中只有1432人被殺,概率是2800分之一。

這其實(shí)就是勿用了后驗(yàn)概率, 這里的條件是被殺而且有家暴,而要推測(cè)的事件是兇手是男友(事實(shí)上概率高達(dá)90%),這才是貝葉斯分析的正當(dāng)用法, 而辯護(hù)律師卻把完全在混淆條件與要驗(yàn)證的假設(shè)。

圖: 貝葉斯分析法庭也用的上哦!

理解貝葉斯分析最好的方法即圖像法, 這里的A的面積即先驗(yàn), 后驗(yàn)是陰影占籃圈的百分比。

貝葉斯分析可以瞬間理解一些常用的理論, 如幸存者偏差,你發(fā)現(xiàn)一些沒讀過(guò)書的人很有錢,事實(shí)上是你發(fā)現(xiàn)就已經(jīng)是幸存者了(對(duì)應(yīng)上圖中小紅圈), 而死了的人(紅圈外的大部分面積)你都沒見到啊。

還有陰謀論, 陰謀論的特點(diǎn)是條件很多很復(fù)雜, 但是條件一旦成立,結(jié)論幾乎成立,你一旦考慮了先驗(yàn),這些條件成立本身即很困難, 陰謀論不攻自克。

注: 圖上紅圈和籃圈的面積, 很少我們?cè)陂_始就知道, 這才是應(yīng)用中的難點(diǎn)。

此處貝葉斯分析的框架也在教我們?nèi)绾翁幚硖乩c一般常識(shí)的規(guī)律

如果你太注重特例(即完全不看先驗(yàn)概率) 很有可能會(huì)誤把噪聲看做信號(hào), 而奮不顧身的跳下去。

如果恪守先驗(yàn)概率, 就成為無(wú)視變化而墨守成規(guī)的人。其實(shí)只有貝葉斯流的人生存率會(huì)更高, 因?yàn)樗麄儠?huì)重視特例, 但也不忘記書本的經(jīng)驗(yàn),根據(jù)貝葉斯公式小心調(diào)整信心,甚至?xí)鲃?dòng)設(shè)計(jì)實(shí)驗(yàn)根據(jù)信號(hào)判斷假設(shè),這就是我們下一步要講的。?

貝葉斯決策如何判定男女

在剛剛講到的貝葉斯統(tǒng)計(jì)分析的基礎(chǔ)上, 我們就可以引出一個(gè)更核心的概念,?貝葉斯決策

貝葉斯決策主要包含四個(gè)部分: 數(shù)據(jù)(D), 假設(shè)(W),目標(biāo)(O),決策(S)。?此處的數(shù)據(jù)即之前講到的證據(jù), 假設(shè)是我們要驗(yàn)證的事實(shí), 目標(biāo)是我們最終要取得優(yōu)化的量, 決策時(shí)根據(jù)目標(biāo)得到的最后行為。與上一步貝葉斯分析增加的部分是目標(biāo)和決策。假設(shè)在問(wèn)題里如果是連續(xù)的往往以參數(shù)空間的形式表達(dá)。

然后我們可以按照如下步驟做:

  • 第一, 理清因果鏈條,哪個(gè)是假設(shè),哪個(gè)是證據(jù)。?

  • 第二,給出所有可能假設(shè),即假設(shè)空間

  • 第三,給出先驗(yàn)概率

  • 第四,根據(jù)貝葉斯概率公式求解后驗(yàn)概率, 得到假設(shè)空間的后驗(yàn)概率分布

  • 第五,利用后驗(yàn)概率求解條件期望, 得到條件期望最大值對(duì)應(yīng)的行為

貝葉斯決策如果一旦變成自動(dòng)化的計(jì)算機(jī)算法, 它就是機(jī)器學(xué)習(xí)。Ok, 此處應(yīng)有掌聲,我們就用貝葉斯決策詮釋一個(gè)最簡(jiǎn)單的機(jī)器學(xué)習(xí)分類算法- 樸素貝葉斯

假設(shè)給你一個(gè)人的身高和體重資料,你不知道他的男女性別, 你可以通過(guò)我上述給出的貝葉斯決策機(jī)制解決這個(gè)問(wèn)題:

首先, 此處我們的證據(jù)是身高和體重, 假設(shè)是男或女。先驗(yàn)概率是人口中的男女比例, 而我們需要掌握的條件概率是男性和女性的身高和體重分布,這應(yīng)該是很好掌握的信息。

然后我們可以根據(jù)貝葉斯公式求解后驗(yàn)概率,而此處我們要做的決策時(shí)男女,目標(biāo)是分類錯(cuò)誤率最低,決策即性別分類。

此處我們用到一個(gè)基本假設(shè)就是證據(jù)是互相獨(dú)立的, 使我們能夠求得更簡(jiǎn)單的公式:


圖: 樸素貝葉斯,核心在于假設(shè)證據(jù)互相獨(dú)立。由此我們得到下列乘法公式(feature對(duì)應(yīng)x)

用數(shù)學(xué)語(yǔ)言白表征這個(gè)問(wèn)題, X特征向量,h把X映射成不同的分類, 我們要求得是P(y|x) 正確率最大的假設(shè)(y)。

投擲硬幣的概率并不是50%

事實(shí)上,貝葉斯決策很少只涉及A和B, 而是內(nèi)部包含非常關(guān)鍵的隱變量(參數(shù)),涉及我們對(duì)所研究事物的一些基本預(yù)設(shè)。比如下面這個(gè)特別簡(jiǎn)單的例子:

拋擲硬幣,一個(gè)硬幣被投擲10次9次朝上,那么根據(jù)頻率學(xué)派的觀點(diǎn), 得到第11次投擲的概率不變?yōu)?.5 ,如果你回答了0.9, 你經(jīng)常會(huì)被看成一個(gè)傻X。 其實(shí)不然,天底下哪有一樣的硬幣呢?

那么問(wèn)題來(lái)了,我設(shè)一個(gè)賭局, 一次正面向上你可以受益100, 反面懲罰150, 基于剛才的事實(shí)你要不要做這個(gè)局??

我們完全可以套用貝葉斯決策的理論來(lái)。 這里的一個(gè)重要的隱變量是每一次投擲硬幣的概率,這個(gè)數(shù)字按照經(jīng)典頻率學(xué)派認(rèn)定一定是0.5, 而按照貝葉斯學(xué)派的觀點(diǎn), 需要把這個(gè)變量看成是未知的,具有一定先驗(yàn)概率,之后嚴(yán)格按照貝葉斯公式計(jì)算新加入證據(jù)對(duì)先驗(yàn)概率的影響。

此處的先驗(yàn)概率即你對(duì)硬幣向上0.5這件事的信念, 你越相信這個(gè)事實(shí), 這個(gè)分布越尖,反之越寬廣。 我們用希臘字母theta來(lái)表征這個(gè)概率。整個(gè)決策表述如下:

公式的含義是你要用求解已知9次朝上1次朝下的時(shí)候求解你下一次投擲硬幣的期望收益, 并因此決策要不要賭。

中間要驗(yàn)證的假設(shè)空間即每一次投擲為正的概率,我們依然以每次事件獨(dú)立和該概率不隨時(shí)間變化為基準(zhǔn)(如果不是問(wèn)題將無(wú)限復(fù)雜),那么證據(jù)將根據(jù)上述公式改變假設(shè)空間的概率分布, 而最終的期望可以根據(jù)這個(gè)分布求出。決策即使得這個(gè)期望最大的解。

注意此處先驗(yàn)十分重要,因?yàn)樗绊憶Q策的結(jié)果, 而這又是一個(gè)很主觀的東西,如果你對(duì)0.5有絕對(duì)的信心, 那么你的就會(huì)非常尖,這個(gè)時(shí)候你需要得到大量偏離0.5的證據(jù)才能逐步糾偏。?

對(duì)于書呆子樣的人,估計(jì)會(huì)傾向給出一個(gè)比較尖銳的先驗(yàn)分布,相信書里說(shuō)的0.5而不賭, 而一些更加傾向于相信特例的人則會(huì)給出很平坦的先驗(yàn)而更大的概率去賭。最終后者發(fā)財(cái)和傾家蕩產(chǎn)的幾率都比較高,而前者比較容易旱澇保收。

當(dāng)然, 在數(shù)據(jù)量超大,比如說(shuō)1000次有900次為正的情況下,我們幾乎不需要考慮先驗(yàn)(自己去看公式),此時(shí)幾乎可以認(rèn)定投擲的概率就是0.9.

圖:證據(jù)對(duì)信念發(fā)生作用的貝葉斯過(guò)程

大腦是一個(gè)貝葉斯網(wǎng)絡(luò)?

如果我們的貝葉斯決策中牽涉的證據(jù)更復(fù)雜呢? 如果這些證據(jù)之間不是簡(jiǎn)單獨(dú)立而是互為因果呢?這時(shí)候更為強(qiáng)大的工具——貝葉斯網(wǎng)絡(luò)就應(yīng)運(yùn)而生。

世界上的事無(wú)一不處于復(fù)雜的聯(lián)系之中, 而貝葉斯網(wǎng)絡(luò)正是刻畫這種關(guān)聯(lián)的數(shù)學(xué)表述。

構(gòu)建一個(gè)貝葉斯網(wǎng)絡(luò)的關(guān)鍵方法是圖模型,構(gòu)建一個(gè)圖模型我們需要把具有因果聯(lián)系的各個(gè)事件用箭頭連在一起。

下圖的例子是這樣一個(gè)事件, 我們看到草坪濕潤(rùn)了,那么我想推測(cè)此時(shí)天氣多云的概率 ,因?yàn)閷?dǎo)致草坪濕潤(rùn)的原因有下雨或者灑水車在工作, 而這兩者又都和多云有聯(lián)系,那么我們可以畫出如下圖形,按照貝葉斯概率公式逐級(jí)推出每個(gè)事件的概率。

貝葉斯網(wǎng)絡(luò)的特性是,當(dāng)某點(diǎn)的一個(gè)證據(jù)出現(xiàn), 整個(gè)網(wǎng)絡(luò)中事件的概率都變化, 所謂看到鏡中的一絲百發(fā), 就改變你對(duì)人生中所有重大事件概率的推斷。

我們的大腦 : 有人說(shuō)我們的大腦是一個(gè)貝葉斯網(wǎng)絡(luò), 這句話又對(duì)又不對(duì) ,我們的大腦學(xué)習(xí)的原理,的確正是一個(gè)新的證據(jù)逐步和內(nèi)部信念耦合的過(guò)程,本質(zhì)即貝葉斯網(wǎng)絡(luò),但是我們大腦又是一個(gè)不完全的貝葉斯推斷機(jī), 每個(gè)人都有一個(gè)頂層以三觀構(gòu)建,底層逐步深入個(gè)個(gè)關(guān)于具體問(wèn)題看法的貝葉斯網(wǎng)路, 但是我們卻很少有能夠通過(guò)一個(gè)證據(jù)更新整個(gè)網(wǎng)絡(luò)的能力,或者是我們吸收新證據(jù)的速度也往往十分緩慢,這是為什么我們經(jīng)常具有自相矛盾的信念體系,經(jīng)常一方面喊著人性解放一方面又崇拜偶像。

梧桐一葉又有幾人知秋。

(注:本文僅代表作者觀點(diǎn))

總結(jié)

以上是生活随笔為你收集整理的贝叶斯告诉你,投掷硬币概率可以是90%的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。