拿了年终奖后,发现自己又拖后腿了?对不起,可能事实并没有那么糟糕...
全世界只有3.14 %?的人關(guān)注了
爆炸吧知識(shí)
不平凡的2020年早已過(guò)去了,打工人們已經(jīng)跨過(guò)了2021年的門(mén)檻。2021年將會(huì)怎么樣,那只有到2021年結(jié)束后我們才會(huì)知道。
但我們的情緒常常毫無(wú)例外地會(huì)被“年終獎(jiǎng)”這個(gè)關(guān)鍵詞所擾動(dòng),無(wú)論在什么時(shí)候,也無(wú)論是興奮的還是沮喪的。
當(dāng)然土豪除外,因?yàn)樗麄儾恍枰杲K獎(jiǎng)。?
?????
某聯(lián)招聘的《2020年白領(lǐng)年終獎(jiǎng)?wù){(diào)研報(bào)告》在2021年2月1日發(fā)布了。這是份直擊廣大人民群眾靈魂的報(bào)告,讓我們先看看其中的“2020年不同城市白領(lǐng)年終獎(jiǎng)均值”Top35情況。
有沒(méi)有很扎心,有沒(méi)有感覺(jué)到“傷害性不強(qiáng),侮辱性極大”!
對(duì),沒(méi)錯(cuò),我知道我又屬于了那些拖后退的人之一。不說(shuō)了,先去廁所里哭暈一會(huì)…
?????????????
但哭歸哭,暈歸暈,在擦干眼淚后,我仔細(xì)想了一想,然后弱弱地直接對(duì)自己說(shuō),它給我傳導(dǎo)了錯(cuò)誤信息。也許我真的沒(méi)有那么差勁,而且怎么也得找個(gè)理由對(duì)我的父母、另一半、親朋好友好好解釋一番。
是的,“平均值”這個(gè)統(tǒng)計(jì)方法在有時(shí)候真的很是不靠譜(我真的不是在狡辯)。要知道在統(tǒng)計(jì)學(xué)中,計(jì)算“平均數(shù)“的方法可不僅僅只有”平均值“,還包括”中位數(shù)“和”眾數(shù)“。”平均值“、”中位數(shù)“和”眾數(shù)“都是對(duì)數(shù)據(jù)集中數(shù)據(jù)中心的度量,只不過(guò)計(jì)算方法和特質(zhì)不一樣而已。
所謂平均值(這里是專(zhuān)指算術(shù)平均值,不是幾何平均值等其他計(jì)算方法),是將數(shù)據(jù)集中所有數(shù)據(jù)值的總和除以數(shù)據(jù)值的個(gè)數(shù)的方法,即設(shè)數(shù)據(jù)集中有一組n個(gè)數(shù)據(jù){ x1,x2,…,xn},則其平均數(shù)。
例如,我所在的部門(mén),我和我的同事一共9個(gè)屌絲,發(fā)了如下的年終獎(jiǎng){5萬(wàn),6萬(wàn), 6萬(wàn), 7萬(wàn), 8萬(wàn),9萬(wàn),8萬(wàn),10萬(wàn),11萬(wàn)}(再一次申明,這是樣例數(shù)據(jù),我們真的沒(méi)有發(fā)這么多),按照平均數(shù)公式計(jì)算則為
(5 + 6 +6 + 7 + 8 + 9 + 8 + 10 + 11) ÷ 9 = 7.778萬(wàn)
那么這組打工人的平均年終獎(jiǎng)圖形化的情況大概是這樣的:
?
當(dāng)有某個(gè)熟人問(wèn)我年終獎(jiǎng)發(fā)了多少時(shí),日常生活拮據(jù)的我為了防止被他借錢(qián),只告訴了ta一個(gè)最小值。但ta一臉的憤怒,不屑地指出我是多么地不厚道。我只好又告訴那個(gè)平均數(shù),ta還是繼續(xù)搖著頭。我咬咬牙,一不做二不休,無(wú)奈地說(shuō)出了最高的那個(gè)年終獎(jiǎng)錢(qián)數(shù)。這倒ta徹底地怒了:“據(jù)我所知應(yīng)該至少是七位數(shù)吧,你這么的不真誠(chéng)。”what?平均百萬(wàn)的年終獎(jiǎng),為什么我才拿了6位數(shù)還沒(méi)到的鈔票,現(xiàn)在該輪到我憤怒了。
這是怎么回事?原來(lái)隔壁部門(mén)有一位大神級(jí)人物突然加入我們屌絲團(tuán)隊(duì),一起計(jì)算了平均值,那么效果就不一樣了。大神的年終獎(jiǎng)為1000萬(wàn),按照最新的數(shù)據(jù)計(jì)算年終獎(jiǎng)平均值則為
(5 + 6 +6 + 7 + 8 + 9 + 8 + 10 + 11 + 1000) ÷ 10= 107萬(wàn)
?
哎喲喂,原來(lái)我們都是平均年終獎(jiǎng)過(guò)百萬(wàn)的人群了,這樣氣氛就不一樣了!
但這樣科學(xué)嗎?當(dāng)然不科學(xué)!
這就是我們經(jīng)常詬病的統(tǒng)計(jì)學(xué)“平均值陷阱”:我家年收入2萬(wàn),隔壁家年收入為3萬(wàn)元,而對(duì)面別墅區(qū)一家的年收入是2995萬(wàn),大家一平均,全是年收入千萬(wàn)的富裕家庭了。
平均值是人類(lèi)數(shù)學(xué)智慧的結(jié)晶,要知道人類(lèi)僅僅從“三只老虎“、”三棵樹(shù)“、”三座山“抽象出”3“這個(gè)數(shù)量就花費(fèi)了幾十萬(wàn)年(或上百萬(wàn)年)的時(shí)間。平均值曾經(jīng)破解了古代統(tǒng)計(jì)學(xué)上著名時(shí)間難題。
比如,據(jù)印度史詩(shī)《摩訶婆羅多》(Mahabharata)記載﹐在公元前四世紀(jì),古印度部落首領(lǐng)帕納通過(guò)平均值估算了一棵尾避多伽(vibhitaka)果樹(shù)兩個(gè)枝干上的葉子和果實(shí)的數(shù)量。他的具體方法是先統(tǒng)計(jì)某一根樹(shù)枝上的葉子和果實(shí)的數(shù)量,然后乘以?xún)蓚€(gè)樹(shù)干上的樹(shù)枝數(shù)。
帕納用這種方法計(jì)算的結(jié)果是那棵樹(shù)總共結(jié)了2095個(gè)水果和 50 000 000 片葉子。最后他發(fā)動(dòng)了自己的族人,經(jīng)過(guò)一個(gè)晚上的詳細(xì)統(tǒng)計(jì),發(fā)現(xiàn)他的平均值估算結(jié)果與真實(shí)情況非常接近。
但在很多場(chǎng)景下,平均值對(duì)數(shù)據(jù)集的集中性進(jìn)行考量是有問(wèn)題的,特別在一組統(tǒng)計(jì)樣本中出現(xiàn)了極端數(shù)值的時(shí)候。
于是,由于平均值在現(xiàn)實(shí)世界中各種問(wèn)題,所謂數(shù)量統(tǒng)計(jì)學(xué)中的“中位數(shù)”計(jì)算就漸漸浮出水面了。
人類(lèi)最早有文本記錄的“中位數(shù)”出現(xiàn)在大航海時(shí)代的1599年,航海家愛(ài)德華·賴(lài)特在他所著的一本關(guān)于航海的書(shū)模糊地提到了“中位數(shù)”。
愛(ài)德華·賴(lài)特繪制的航海圖(1599-1600)
在變化無(wú)常的海浪中,愛(ài)德華·賴(lài)特和他的同事需要使用各類(lèi)測(cè)量?jī)x器在大海上進(jìn)行導(dǎo)航和定位。通過(guò)長(zhǎng)期對(duì)航海數(shù)據(jù)(例如方位和距離等)觀測(cè)、記錄和分析,他發(fā)現(xiàn)最中間的測(cè)量數(shù)據(jù)是最有可能是接近描述真相的測(cè)量結(jié)果。但從賴(lài)特的那本書(shū)來(lái)看,他是否真的發(fā)現(xiàn)中位數(shù)還不確定。
人類(lèi)社會(huì)進(jìn)化到科學(xué)爆炸式的十九世紀(jì)。在整個(gè)十九世紀(jì),很多科學(xué)家因?yàn)椴煌睦碛墒褂昧酥形粩?shù)作為平均值的替代計(jì)算。
1874年,德國(guó)心里物理學(xué)家費(fèi)希納(Gustav TheodorFechner,1801年4月19日-1887年11月18日)使用了中位數(shù)試圖描述許多社會(huì)學(xué)和心理學(xué)現(xiàn)象。這種統(tǒng)計(jì)學(xué)的研究方法之前在天文學(xué)中被證明是有用的。于是,費(fèi)大神主張用中位數(shù)去度量不規(guī)則的非對(duì)稱(chēng)數(shù)據(jù)中心位置。
1882年,現(xiàn)代數(shù)理統(tǒng)計(jì)的奠基人、英國(guó)維多利亞時(shí)期百科全書(shū)式的科學(xué)家、探險(xiǎn)家高爾頓(FrancisGalton,1822年2月16日-1911年1月17日)第一次使用英語(yǔ)術(shù)語(yǔ)“中位數(shù)(Median)”,正式開(kāi)啟了對(duì)這一統(tǒng)計(jì)概念的認(rèn)知。高爾登通過(guò)對(duì)大量的數(shù)據(jù)進(jìn)行歸納分析,發(fā)現(xiàn)中位數(shù)很重要,因?yàn)樗子谟?jì)算,并且表達(dá)直觀清晰又準(zhǔn)確。于是,高爾頓的精心設(shè)計(jì),在1889年公布了較為復(fù)雜的四分位數(shù)法來(lái)表達(dá)中位數(shù)。
所謂的四分位數(shù)就是把數(shù)據(jù)集中的數(shù)據(jù)按數(shù)值大小長(zhǎng)序排列后,分成4個(gè)部分,每個(gè)部分包括全部數(shù)據(jù)的四分之一即25%。每個(gè)部分劃分的臨界值就是所謂的四分位數(shù)。就像一個(gè)線段需要三點(diǎn)把它分為四段,四分位數(shù)有三個(gè),分別是下四分位數(shù)、中位數(shù)和上四分位數(shù),用Q1、Q2、Q3來(lái)表示。
設(shè)數(shù)據(jù)集中有序數(shù)據(jù)的個(gè)數(shù)為n,則Q1、Q2、Q3的位置計(jì)算公式為:
a
例如,使用上面用Q1、Q2、Q3三個(gè)公式對(duì)7個(gè)有序數(shù)值的數(shù)據(jù)集{2, 4, 4, 5, 6, 7, 8}進(jìn)行四分位數(shù)計(jì)算則有:
不過(guò),盡管有古諾(Antoine Augustin Cournot,1801年8月28日-1877年3月31日)、費(fèi)希納、高爾頓等大佬們的力挺,但在19世紀(jì),“中位數(shù)“大多被科學(xué)家所忽視,而用平均數(shù)度量去數(shù)據(jù)的趨勢(shì)則被普遍看好。
到20世紀(jì),中位數(shù)越來(lái)越多應(yīng)用于順序數(shù)據(jù)的分析統(tǒng)計(jì),因?yàn)槭褂闷骄捣治龃嬖跇O端數(shù)據(jù)的數(shù)據(jù)集是存在很多缺點(diǎn)的。中位數(shù)比較平均值來(lái)說(shuō),分析大數(shù)據(jù)的中心趨勢(shì)更加穩(wěn)健(1953年,統(tǒng)計(jì)學(xué)界開(kāi)始使用術(shù)語(yǔ)“穩(wěn)健”來(lái)表示統(tǒng)計(jì)方法對(duì)異常值的不敏感性)。
隨著21世紀(jì)大數(shù)據(jù)時(shí)代的到來(lái),統(tǒng)計(jì)應(yīng)用于越來(lái)越多的不規(guī)則數(shù)據(jù)的領(lǐng)域,統(tǒng)計(jì)方法的應(yīng)用越來(lái)越廣泛,而中位數(shù)已經(jīng)變得越來(lái)越流行。
當(dāng)然現(xiàn)在的中位數(shù)計(jì)算方法比高爾頓朝代要更加完整了。
其具體計(jì)算方法為:對(duì)于一組升序排列(從小到大)的數(shù)據(jù)集{},有中位數(shù)計(jì)算公式為:
?
例如,對(duì)于一個(gè)有n=15(奇數(shù))個(gè)數(shù)據(jù)的數(shù)據(jù)集{3, 13,7, 5, 21, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29},根據(jù)以上公式計(jì)算中位數(shù)則有:
例如,對(duì)于有n=14(偶數(shù))個(gè)數(shù)據(jù)的數(shù)據(jù)集{3, 5,7, 12, 13, 14, 21, 23, 23, 23, 23, 29, 40, 56},根據(jù)以上公式計(jì)算中位數(shù)則有:
回到上面那個(gè)9個(gè)打工人再加一個(gè)大佬年終獎(jiǎng)問(wèn)題{5萬(wàn),6萬(wàn), 6萬(wàn), 7萬(wàn), 8萬(wàn),9萬(wàn),8萬(wàn),10萬(wàn),11萬(wàn),1000萬(wàn)},排序后為{5萬(wàn),6萬(wàn), 6萬(wàn), 7萬(wàn), 8萬(wàn),8萬(wàn),9萬(wàn),10萬(wàn),11萬(wàn),1000萬(wàn)},用中位值對(duì)其進(jìn)行“平均數(shù)”的計(jì)算,則有
圖形化分析結(jié)果為:
?
而所謂的“眾數(shù)”就是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值(可能為零個(gè)、一個(gè)或多個(gè)),這個(gè)概念比較簡(jiǎn)單,比如數(shù)據(jù)集{1,2,3,3,4,5,6}的“眾數(shù)”為3,而上面這個(gè)年終獎(jiǎng)的例子中“眾數(shù)”應(yīng)為6萬(wàn)和8萬(wàn)。
因此,摒棄不靠譜的年終獎(jiǎng)“平均值“107萬(wàn),用”中位數(shù)“8萬(wàn)來(lái)考量所有樣本年終獎(jiǎng)情況。
如果能夠這樣公布年終獎(jiǎng)的中位數(shù),大家心里就會(huì)舒坦多了,不再淚流如河。
對(duì)于我們打工人來(lái)說(shuō),要時(shí)刻記住打工人的那句語(yǔ)錄“生活中有80%的痛苦來(lái)源于打工,但不打工就會(huì)有100%的痛苦來(lái)源于沒(méi)錢(qián)。”無(wú)論如何,我們還是要在2021年繼續(xù)努力的,該搬磚的還得繼續(xù)搬磚,雖然它已經(jīng)只剩下不到十個(gè)月了。
最后,打工人已經(jīng)開(kāi)始了新的一年打工生涯。無(wú)論有沒(méi)有年終獎(jiǎng),有多少年終獎(jiǎng),打工人們?nèi)兆舆€是繼續(xù)的!如果仍有人對(duì)你嘰嘰歪歪,那么你就把篇文章發(fā)到ta的眼前,然后請(qǐng)ta好好地認(rèn)真讀一遍,并且告訴ta在數(shù)據(jù)統(tǒng)計(jì)中種種陷阱里,有許多看似客觀的數(shù)據(jù)分析隱藏著諸多不易察覺(jué)的謊言。
寫(xiě)在最后
用數(shù)學(xué)理解世間萬(wàn)物,用理性思維尋找解決問(wèn)題的新角度。所以,超模君為大家準(zhǔn)備了《數(shù)學(xué)之旅》!
在娛樂(lè)的同時(shí),通俗易懂的感受數(shù)學(xué)之美,做到真正的寓教于樂(lè)!你還在等什么?趕緊開(kāi)啟你的數(shù)學(xué)之旅吧!
《數(shù)學(xué)之旅 ·?閃耀人類(lèi)的54位數(shù)學(xué)家》
?數(shù)學(xué)藝術(shù)禮盒
指導(dǎo)價(jià)219
新春價(jià)139
只需再+19元
買(mǎi)就送數(shù)理文化“鼠標(biāo)墊”
預(yù)購(gòu)從速!!!
(點(diǎn)擊小程序,即可購(gòu)買(mǎi))
作者簡(jiǎn)介:晨星,湖北武漢人,副高職稱(chēng),理學(xué)博士,高級(jí)程序員,IAMG(國(guó)際數(shù)學(xué)地質(zhì)協(xié)會(huì))會(huì)員,省級(jí)醫(yī)學(xué)人工智能與大數(shù)據(jù)專(zhuān)委會(huì)委員。
本文系網(wǎng)易新聞·網(wǎng)易號(hào)“各有態(tài)度”特色內(nèi)容
轉(zhuǎn)載請(qǐng)?jiān)诠娞?hào)中,回復(fù)“轉(zhuǎn)載”
參考文獻(xiàn):
智聯(lián)招聘.《2020年白領(lǐng)年終獎(jiǎng)?wù){(diào)研報(bào)告》. 2021
StephenM. The history ofstatistics : the measurement of uncertainty before 1900[M]. Belknap Press ofHarvard University Press, 1987.
Plackett R L . Studies in theHistory of Probability and Statistics: VII. The Principle of the ArithmeticMean[J]. Biometrika(1-2):130-135.
Porter T M . The Rise of StatisticalThinking, 1820–1900[M]. 2020.
超模君每周分享來(lái)襲
????????????
“整整600頁(yè)!國(guó)家?jiàn)W數(shù)教頭主編教材”
掃描上方二維碼
回復(fù)“600”領(lǐng)取資料全文
總結(jié)
以上是生活随笔為你收集整理的拿了年终奖后,发现自己又拖后腿了?对不起,可能事实并没有那么糟糕...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 最懂男人心的内裤,戳100个洞透气,超舒
- 下一篇: 需要多快的速度,才能在抽走桌布之后保持桌