数学教材里的神秘数表在国外红出圈,网友:引人入胜、猜不到结局
本文受權(quán)轉(zhuǎn)載自“把科學(xué)帶回家”,ID:steamforkidsie
有這樣一本神書,它的正文不包含任何字母卻暢銷60多年,再版了3次,在亞馬遜上的評論量超過了亞馬遜十大暢銷書之一的《饑餓游戲》的第一部,獲得了4.2/5的高評分,并引發(fā)《紐約時報》、《華爾街日報》等主流媒體報道。
2001年《紐約時報》對《百萬隨機數(shù)表》(A Million Random Digits With 100,000 Normal Deviates)的報道。
此書中的章節(jié)還經(jīng)常出現(xiàn)在各種統(tǒng)計學(xué)教材中,它就是附錄中經(jīng)常出現(xiàn)的神秘數(shù)表的常見來源。
統(tǒng)計教材中的隨機數(shù)表。圖片來源:WHO Health Systems Library
這本書就是標志著人類核武器時代到來的著作,在個人計算機時代前被統(tǒng)計工作者奉為圣經(jīng)的《百萬隨機數(shù)表》(A Million Random Digits With 100,000 Normal Deviates)(下文中稱為百萬)。
沒錯,這本書的正文就是100萬個隨機數(shù)。為美國空軍制造RAND計算機的計算機學(xué)家 Gary Briggs 表示,這本書是一個有65年歷史的巨著,“我們都崇敬它。”賓夕法尼亞大學(xué)沃頓商學(xué)院副教授 Ethan Mollick 則指出,在計算機出現(xiàn)前,百萬這本書是隨機數(shù)的最常見來源。
截至今年八月,這本書的評論量已經(jīng)有699條。與此相比,亞馬遜的十大暢銷書之一的《饑餓游戲》的平裝初版也只有200多條評論。
我們先來看看亞馬遜網(wǎng)友對這本書的評價——
“一本引人入勝的大作,具有重要的歷史意義,不看到最后你猜不到結(jié)局。”
“百萬隨機數(shù)?他們只用了10,然后用不同的組合重復(fù),不要被騙了!”
“我被書名騙了...我以為里面是隨機數(shù),但是看了一會兒后我發(fā)現(xiàn)還是有規(guī)律的…在做了好幾個小時的數(shù)學(xué)模擬后我證明…每頁左上角的數(shù)字可以形成1-628的遞增序列。”
好的,網(wǎng)友們的評價非常中肯貼切,作為一本你完全揣摩不透的書,百萬完全擔得起這樣的美譽。
要了解這本書的劃時代性,我們有必要要了解一下隨機數(shù)有多么難獲得。
隨機性看起來無處不在,比如馬路邊的石子兒、女孩的心情、學(xué)渣的答案…但實際上,要獲得高質(zhì)量的隨機數(shù)真的很難。計算機輸出的隨機數(shù)是“偽隨機數(shù)”,因為給計算機什么指令,它們就會穩(wěn)定進行同樣的操作,輸出同樣的結(jié)果。也就是說,計算機無法輸出真隨機數(shù)。
真隨機數(shù)的唯一來源是自然界。比如,核裂變。
你可能想問,我們怎么知道隨機數(shù)是真的還是偽的呢?
很簡單,畫圖就好了。
真隨機數(shù)會形成隨機游走。圖片來源:khan academy
如果用一串隨機數(shù)做一個貪吃蛇的圖,讓貪吃蛇每走一步就根據(jù)這個數(shù)列里的數(shù)字轉(zhuǎn)向,那么真隨機數(shù)形成的貪吃蛇看起來毫無規(guī)律,不管把這個圖放大還是縮小,在任何尺度上貪吃蛇都在亂走。而真隨機的貪吃蛇走出來的這張圖就叫做隨機游走(random walk)。
但是,計算機生成的偽隨機數(shù)最終會展現(xiàn)出規(guī)律性,貪吃蛇的步伐最后會以特定周期不斷重復(fù)。
偽隨機數(shù)(藍色)最終會展現(xiàn)出規(guī)律。圖片來源:khan academy
真隨機數(shù)和偽隨機數(shù)的對峙在20世紀40年代被推向了高潮,因為在研究核物理時,人們才意識到真隨機數(shù)有多重要。
比如在設(shè)計核反應(yīng)堆時,最關(guān)鍵的一步就是預(yù)測中子的分布。了解中子是誰,中子從哪兒來,中子要到哪兒去的終極三問就成了設(shè)計核反應(yīng)堆時的核心,而這個研究方向也叫做中子輸運(Neutron transport )。
在反應(yīng)堆中,中子(藍)引發(fā)鈾235(黃)裂變。圖片來源:wikipedia
核物理研究者們一般認為,中子就像氣體一樣在反應(yīng)核里擴散,并用中子輸運方程模擬這個過程。但是,暴力強解中子輸運方程太復(fù)雜,當時的物理學(xué)家們很頭疼。
后來,這個問題被洛斯阿拉莫斯國家實驗室的數(shù)學(xué)家斯塔尼斯拉夫·烏拉姆(Stanislaw Ulam)破解了。烏拉姆的思路是,方程太復(fù)雜了老子不解了好伐,我直接模擬中子怎么動不就好了。這種“你動動我試試”的方法就是著名的統(tǒng)計學(xué)技術(shù)——蒙特卡羅方法。
蒙特卡洛方法其實不難理解。比如要看方形和圓形的面積比,我們可以在兩個盒子上方隨機倒珠子,倒了巨量珠子后,看一下兩個盒子里的珠子數(shù)量比,這個比值就是它們的面積之比。圖片來源:marble science
蒙特卡洛方法不需要求解中子輸運方程,而是通過模擬大量中子的運動軌跡來對反應(yīng)堆中中子的擴散過程進行預(yù)測。在洛斯阿拉莫斯國家實驗室發(fā)明和推廣了蒙特卡洛方法后,其他學(xué)科也紛紛覺得它好用。現(xiàn)在蒙特卡洛方法被廣泛用于研究各種復(fù)雜系統(tǒng)的行為,比如金融市場、湍流啥的。
顯然,蒙特卡洛方法依賴大量隨機數(shù),這樣才能保證模擬結(jié)果無限接近真實。洛斯阿拉莫斯國家實驗室發(fā)明的這個統(tǒng)計學(xué)工具讓高質(zhì)量的隨機數(shù)變成了炙手可熱的學(xué)術(shù)“商品”,百萬這本書也是依托這種需求誕生的。
為了滿足暴漲的需求,1947年,為美國軍方服務(wù)的蘭德公司(RAND Corporation)就開始制造這種“商品”。1955年,百萬的第一版開始發(fā)行。
那么,這些高質(zhì)量的隨機數(shù)是怎么產(chǎn)生的呢?
首先,一個來自自然界的隨機脈沖源發(fā)出隨機脈沖。這個脈沖源和一個電子輪盤相連,輪盤把隨機信號轉(zhuǎn)化為0-9的十進制數(shù)。
圖片來源:wikimedia
接著,這些十進制的數(shù)字又被轉(zhuǎn)化為2萬張能被計算機讀取的卡片。這些卡片被插入一臺IBM計算機里,這臺計算機就產(chǎn)生了一百萬個隨機數(shù)。
當然了,隨機數(shù)的質(zhì)量取決于隨機脈沖的質(zhì)量。蘭德公司并沒有公布它的來源,一些人猜測隨機脈沖來自對著鈾礦的蓋革計數(shù)器。
天然鈾礦。圖片來源:wikimedia
鈾會衰變,在這個過程中釋放出粒子,不過兩次衰變之間的間隔是隨機的,因此記錄到粒子的蓋革計數(shù)器的信號也是隨機的。
出版后,這本書也成了蘭德公司最暢銷的書籍。蘭德公司表示,這本書是“史上已出版的最大隨機數(shù)表。”
高質(zhì)量的隨機數(shù)很難獲得,因此這本書對于教師、學(xué)生、研究者等等一系列需要和統(tǒng)計數(shù)字打交道的職業(yè)來說就是必不可少的。而根據(jù)蘭德公司的介紹,百萬這本書已經(jīng)成了工程學(xué)和計量經(jīng)濟學(xué)教材中的標準參考書。
大部分科學(xué)研究都需要隨機取樣。圖片來源:wikimedia
比如在2000年出版的經(jīng)典社會統(tǒng)計教材?Social Research Methods: Qualitative and Quantitative Approaches?寫道,要隨機取樣的話,可以用百萬這本書。
昆士蘭大學(xué)的數(shù)學(xué)系教授 Anthony J. Richardson、康奈爾大學(xué)工程學(xué)榮譽教授 Arnim H. Meyburg 和同事 Elizabeth S. Ampt 甚至指出,百萬這本書是最知名的隨機數(shù)表,大多數(shù)統(tǒng)計學(xué)教材都會摘錄百萬這本書中的部分隨機數(shù)。
這本書也被廣泛用于游戲設(shè)計和模擬中。在設(shè)計游戲時,研發(fā)者要讓玩家時不時遇到不可測的情況,從而增加游戲的成癮性,這時也需要大量隨機數(shù)。
實際上在麻省理工學(xué)院數(shù)字媒體教授 Nick Montfort 和佐治亞理工學(xué)院助理教授 Ian Bogost 撰寫的電子游戲史《與電子束賽跑——雅達利視頻計算機系統(tǒng)》(Racing the Beam: The Atari Video Computer System)一書中就提到,游戲設(shè)計師經(jīng)常使用百萬這本書中的隨機數(shù)。
蘭德公司還表示,直到現(xiàn)在,百萬這本書依舊是隨機數(shù)的最大已知來源,統(tǒng)計學(xué)家、物理學(xué)家、市場分析師、民意測驗者、品控工程師還在利用這本書里的隨機數(shù)。
比如,在對橋梁的焊接部位進行定期檢查時就需要隨機數(shù),因為工程師不可能調(diào)查每一個焊接處,因此就要隨機地挑選幾個樣本進行調(diào)查。
甚至出現(xiàn)了一種傳言,那就是美國海軍潛艇還曾用這本書里的數(shù)字來進行無規(guī)律的航行,從而避免被敵軍發(fā)現(xiàn)。但搞笑的是,紐約公立圖書館一開始把這本書歸到“心理學(xué)”里。
除了百萬這本書,2013年9月5日,美國國家標準技術(shù)研究所(NIST)開始每60秒發(fā)布一次高質(zhì)量的隨機數(shù)。
雖然這些隨機數(shù)表又大又方又好,是重要的工具,但是對于計算機安全來說,它們是“禁書”。這是因為,這些公開的隨機數(shù)已經(jīng)不是秘密,也就是說它們已經(jīng)失去了不可預(yù)測性,壞人可以用這些已知的隨機數(shù)破解密碼,因此它們不能用于加密,美國國家標準技術(shù)研究所也強調(diào)了這一點。
美國國家標準技術(shù)研究所(NIST)的紅字警告:不要將本所的隨機數(shù)用于加密!!!圖片來源:beacon.nist.gov/home
隨機數(shù)出名后反而不“隨機”了,因為它不再能讓人感到意外了,這真是讓人意外呢。
數(shù)學(xué)老師的作業(yè):這本著作非常經(jīng)典,建議大家全文背誦。
封面來源:wired
參考資料:https://docs.qq.com/doc/DVEhpVXpOY1VXSktX
原創(chuàng)文章版權(quán)歸微信公眾號“把科學(xué)帶回家”所有
轉(zhuǎn)載請聯(lián)系 bd@wanwuweb.com
往期精品(點擊圖片直達文字對應(yīng)教程)
機器學(xué)習
后臺回復(fù)“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結(jié)
以上是生活随笔為你收集整理的数学教材里的神秘数表在国外红出圈,网友:引人入胜、猜不到结局的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C运行库和C语言函数库/Microsof
- 下一篇: C语言函数手册:c语言库函数大全|C语言