【数学基础】正态分布为什么如此常见?
文章目錄:
1 生活中的正態分布
2 名字由來
3 ?剖析細節
4 有偏分布
每個人都相信它(正態分布):實驗工作者認為它是一個數學定理,數學研究者認為它是一個經驗公式。----加布里埃爾·李普曼
本文主要是為了之后講解最小二乘法、嶺回歸等優化方法做個鋪墊。
1 生活中的正態分布
生活中女性的身高,
假設你有200個相親對象,然后你老媽搜集了他們所有人的身高信息,然后以5cm為單位,來數一數每5cm各有多少人。接著用身高為橫軸,人數為縱軸,畫了下面的圖:
這種數據分布就是正態分布,正態分布像是一個小山,兩頭低,中間高,左右對稱,大部分數據集中在平均值,小部分分布在兩端
實際上人的分高確實是符合正態分布的。2017年我國18歲及以上成年男性的平均身高是167.1cm,所以167.1的身高就是中國普遍男性身高的數值,如果是150cm或者是190cm都是人數比較少的,處于分布兩端的人群。
神奇的地方在于,不管是人的身高,手臂長度,肺活量,還是他們的考試成績,都符合正態分布。
這是為什么呢?
2 名字由來
正太正態分布為什么不叫“正點”呢?
這個要從這個東西說起,下面這個東西
這個東西叫做高爾頓釘板,你猜猜這是誰發明的?沒錯,就是維多利亞時期的學者Francis Galton(高爾頓)。他做了這個釘板之后,發現這種形狀適用于很多數據,所以他將其命名為“正態分布”(The Normal Distribution).
正態分布的英文“normal”,表示常見的,典型的 , 用來表示這種分布能代表多種多樣的數據類型。
3 ?剖析細節
高爾頓釘板中,每一個小珠子下滾的時候,撞到柱子就會隨機的向左走或者向右走。然后一個小珠子一路滾下來會選擇多次方向,最終的分布就會接近正態分布。
關鍵點在于,一個事情經過多個隨機的因素的影響,結果似乎就是正態分布 。
女性身高可能會受父母身高的影響、飲食習慣的影響、是否喜好運動的影響 等等,這些影響類比成高爾頓釘板中的柱子。
此外,還要注意一點就是高爾頓釘板 中,所有珠子的初始狀態一致。
4 有偏分布
現實中,也有很多有偏分布,比如在醫學中的檢測。有一種說法是因為在細胞中,細胞分類是乘法而非加法。所以用log方法來將乘法變成加法,所以log方法也可以把有偏數據變成正態分布。
對橫坐標取log:
【個人感想】人生也是如此,左邊是貧窮,右邊是富有。人生面臨無數的隨機選擇,大部分人落在了中間位置,成為了一般人。少數運氣不好的和運氣好的人變成了特別窮的人和特別富有的人,但是大部分的我們變成了普通人。我們之所以努力,就是希望在每一次選擇的時候,可以做出更好的選擇,讓我們的未來更好。共勉!
- END -往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯獲取一折本站知識星球優惠券,復制鏈接直接打開:https://t.zsxq.com/662nyZF本站qq群1003271085。加入微信群請掃碼進群(如果是博士或者準備讀博士請說明):總結
以上是生活随笔為你收集整理的【数学基础】正态分布为什么如此常见?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【资源】MIT 更新最大自然灾害图像数据
- 下一篇: 【面试招聘】 美团提前批通关之旅