日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

逻辑推理篇:数据分析中违背常理的悖论:辛普森悖论

發布時間:2024/1/23 编程问答 55 豆豆
生活随笔 收集整理的這篇文章主要介紹了 逻辑推理篇:数据分析中违背常理的悖论:辛普森悖论 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在現實生活中,我們常常會遇到這樣一種現象,當嘗試研究兩個變量是否具有相關性的時候,會分別對此進行分組研究。

然而,在分組比較中都顯示非常有優勢的一方,在總評時卻成了失勢的一方。直到1951年,英國統計學家E.H.辛普森發表論文對此現象做了描述解釋,后來人們就以他的名字命名該現象,即辛普森悖論。

思考下,辛普森悖論為什么成立?

一、辛普森悖論的原理

下面給出辛普森悖論的數學原理:

從數學表達式上,我們可以看出,對a、b、c、d四個變量,分成1組和2組,在1組比率占優勢的情況下,總體占優勢卻不成立。

看一個例子:抖音6月與7月活躍人群得活躍時長對比,發現男性活躍時長上升,女性也上升,但是整體上7月活躍時長比6月降低是什么原因?

為了讓結果更直觀,我做了一個數據圖,不是很標準,但是足以解釋。

假設6月,活躍男生占比20%,使用平均時長 1.2h;活躍女生占比80%,使用平均時長1.5h,則可以計算6月整體使用時長為1.44h。同理,假設7月,活躍男生占比60%,使用平均時長 1.3h;活躍女生占比40%,使用平均時長1.6h,則可以計算7月整體使用時長為1.42h。

這樣就可以非常清晰的看出,7月比6月男女生的平均觀看時長確實增加了,但是整體的反而降低,問題出現在活躍男女生的比例上。

所以,上述抖音案例的解釋,應該是6月活躍人群女性占比較大,而七月男生占比較大,雖然7月男女生觀看時長都增長了,但是由于一天24小時,除掉工作吃飯睡覺時間,男女生活躍時長的提升幅度并不是很大,這樣就導致,雖然7月男女生活躍觀看時長都有提升,但是整體7月的活躍時長低于6月,本質還是活躍人群結構男女比例發生變化。

所以在運營的時候,在活躍時長增長幅度有限的條件下,如果想增加整體的時長,先保證人群結構中女生占較大比例,再引導男女行增長活躍時長。

二、如何避免出現辛普森悖論

關于如何避免出現辛普森悖論,我個人覺得,辛普森悖論無法完全避免的,很多問題,完全依靠統計學推導因果關系無法實現。就拿生產環境數據來說,雖然我們做了各種畫像,但是其他分類方式依然存在,理論上的潛在變量會無窮無盡。

我們能做的,就是仔細認真的研究各種影響因素,不要籠統概括的看問題,尤其數據分析問題,拆解的越細,最終得到的效果越好。

關于避免辛普森悖論的出現,目前比較流行的一種做法,就是需要斟酌個別分組的權重,以一定的系數去消除以分組資料基數差異所造成的影響,同時必須了解該情境是否存在其他潛在因素,需要進行綜合性考慮。

這段話看完有點暈圈,在實際中斟酌權重和判斷其他因素,大多數還是更多依賴經驗。

雖然不能根本上避免辛普森悖論,但我們至少應該明白:在因果關系里,量與質是不等價的,但是量比質更容易測量,所以人們總是習慣用量來評定好壞,而該數據卻不是重要的。

三、倒過來說辛普森悖論

前面講的辛普森悖論是:在每個分組中占優勢的一方,但整體總評卻成了失勢的一方。那倒過來說辛普森悖論,就是在總體中占優勢的一方,在每個分組比較中反而都占劣勢。

下面介紹一個案例,假設,某產品的推廣渠道有頭條和微信兩種,頭條整體的付費轉化率是3.1%%,微信整體的付費轉化率是1.38%,連頭條轉化率的一半都不到。于是有數據分析師得出結論:微信用戶付費轉化率較低,建議停止微信端的廣告投放。

你認為這個分析師做的對嗎?

我們先來看看,頭條和微信整體轉化率對比情況,頭條的確實比微信轉化率要高:

但是,正常情況下,微信的廣告包括微信公眾號和微信朋友圈兩部分,我們把微信的數據量拆開來對比:

這里,我們會驚奇的發現,原來朋友圈的轉化率是最高的4.12%,而微信公眾號的轉化率很低,但是展示量很大,把整個微信的值拉低了。也可以說,那個分析師失誤了,誤區產生的原因就在于將“值與量”兩個維度的數據,歸納成了“值”一個維度的數據,并進行了合并。

如果要避免“辛普森悖論”給我們帶來的誤區,就需要斟酌個別分組的權重,以一定的系數去消除因分組資料基數差異所造成的影響。

而在實際工作中,就需要盡量去拆解指標,采用MECE原則,指標維度互不重復,完全窮盡。

四、內容延伸

我們繼續理解一個概念:基本比率謬誤(base rate fallacy)。

先看一個例子,小易生病去醫院,做完檢查結果呈陽性,醫生告訴他可能是患上了XX疾病,嚇得他驚慌失措,冷靜之余,他趕忙到網上查詢資料,網上說檢查總是有誤差的,這種檢查有“百分之一的假陽性率和百分之一的假陰性率”。

這句話的意思是說,在得病的人中做實驗,有1%的人是假陽性,99%的人是真陽性。而在未得病的人中做實驗,有1%的人是假陰性,99%的人是真陰性。

于是,小易根據這種解釋,估計他自己得了XX疾病的可能性(即概率)為99%。可是,醫生卻告訴他,他被感染的概率只有0.09左右。這是怎么回事呢?

醫生說:你忘了一件事,XX病在人口中的得病基本比例(1/1000)這個事實。

醫生給出計算方法:因為測試的誤報率是1%,1000個人將有10個被報為“假陽性”,而根據X病在人口中的比例(1/1000=0.1%),真陽性只有1個。所以,大約11個測試為陽性的人中只有一個是真陽性(有病)的,因此,小易被感染的幾率是大約1/11,即0.09(9%)。

基本比率謬誤數學解釋,首先要回顧下貝葉斯定理:

P(A|B) = P(B∣A)P(B)P(B|A) \over {P(B)}P(B)P(BA)?P(A)

從貝葉斯定理的原理,解釋小易被感染的幾率就計較容易了。

  • A:普通人群中的小易感染XX病
  • B:陽性結果
  • P(A):普通人群中感染X病的概率
  • P(B|A):陽性結果的概率
  • P(A|B):有了陽性結果條件下,小易感染XX病的概率
  • P(B):結果為陽性的總可能性=檢查陽性中的真陽性+檢查陰性中的真陽性

類似的悖論,還有羅杰斯現象、伯克森悖論、生日悖論等。

總結:

本文介紹了數據分析容易犯的一個誤區,辛普森悖論。上面的例子也告訴我們,統計學中有不少陷阱,如果不提前進行了解,工作中很可能會被錯誤的統計方法迷惑,得出不正確的結論。

辛普森悖論讓我們明白了,在因果關系里,量與質是不等價的,但是量比質更容易測量,所以人們總是習慣用量來評定好壞,而該數據卻不是重要的。

辛普森悖論帶給我們的另外一個啟示是:如果我們在人生的抉擇上選擇了一條比較難走的路,就得具備可能不被賞識、懷才不遇的心理準備。

總結

以上是生活随笔為你收集整理的逻辑推理篇:数据分析中违背常理的悖论:辛普森悖论的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日本www高清视频 | 久草91| 日本久久片 | 亚洲影视一区二区 | 久久免费视频精品 | 少妇毛片一区二区三区粉嫩av | 久久亚洲精品石原莉奈 | 自拍偷拍亚洲天堂 | 精品视频一二 | 色偷偷一区二区三区 | 久久久青草 | 爱射网| 欧美一区二区区 | 亚洲春色一区二区三区 | a视频免费在线观看 | 日韩成人av在线 | 久久精品免费在线 | 这里只有精品999 | 日韩无码精品一区二区三区 | 亚洲av无码国产精品色午夜 | 国产二区av| 天天插夜夜爽 | 国产在线视频网站 | www.日韩av | 欧美三级特黄 | 亚洲va天堂va欧美ⅴa在线 | 青草青在线 | 亚洲在线网站 | 亚洲AV无码精品国产 | 日日撸夜夜撸 | 中文字幕 自拍偷拍 | 蜜桃色一区二区三区 | 黄色一级片黄色一级片 | 俄罗斯porn| 最近中文字幕在线mv视频在线 | 在线亚洲成人 | 欧美粗又大 | 99久久99久久精品国产片 | 亚洲国产精品久久久久久久 | www.色妞 | 国产精品香蕉在线 | 波多野结衣高清视频 | 三级国产在线 | 日韩在线视频中文字幕 | 一本色道久久综合亚洲精品按摩 | 日本美女视频 | 国产精品无码AV | 天天躁日日躁aaaxxⅹ | 欧美一级一区二区三区 | 绯色av一区二区 | 国产伊人自拍 | 动漫女生光屁股 | 欧美性猛交乱大交xxxx | 欧美xxxx在线| 新呦u视频一区二区 | 日韩一二三区在线观看 | 成人免费视频一区二区 | 少妇人妻偷人精品无码视频新浪 | 在线免费观看av网址 | 久久久久久9 | 国产精品国产精品国产专区不卡 | 亚洲涩涩在线 | 不卡中文av | 青娱乐极品视频在线 | 日韩极品一区 | 青娱乐在线视频观看 | 一级福利视频 | 18禁超污无遮挡无码免费游戏 | 国产一区视频在线观看免费 | 炕上如狼似虎的呻吟声 | 国产91视频在线观看 | 天堂一区二区三区 | 天天操操操 | 国产精品亚洲自拍 | 91青青草 | 国产自产一区二区 | 欧美日韩性 | 秘密基地动漫在线观看免费 | 中文字幕精品一区 | 91精品国产乱码在线观看 | 在线免费观看污网站 | 亚洲欧美伦理 | 亚洲人精品午夜射精日韩 | 黄色污污网站 | 亚洲午夜18毛片在线看 | 亚洲大乳| 亚洲精品成人 | 精品久久在线观看 | 欧美91精品久久久久国产性生爱 | 精品丝袜一区 | 中文字幕精品一二三四五六七八 | 麻豆av一区二区三区久久 | 日本高清在线一区 | 日韩一区二区三区在线看 | 国产理论一区 | 最新国产一区 | 少妇自拍视频 | 成年人在线网站 | 精品国产av无码 |