日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

清华校友预测美国疫情发展,准确率达96%|网友:病毒都听你的,绝了

發(fā)布時間:2023/11/22 综合教程 28 生活家
生活随笔 收集整理的這篇文章主要介紹了 清华校友预测美国疫情发展,准确率达96%|网友:病毒都听你的,绝了 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

  近來,一個關于美國和歐洲疫情數(shù)據(jù)的 "神預測" 的日更博客,在網(wǎng)上火了。

  到底有多神呢?略舉二三,如下:

  3 月 27 日起的連續(xù) 10 天里,該博客對美國感染人數(shù)的預測準確率都在 90% 以上,其中在 4 月 4 日,準確率接近 100%(預測為 276727,實際為 276931)。

  3 月 31 日,該博客預測美國疫情將在 8-10 天內(nèi)當檢測人數(shù)超過 200 萬的時候出現(xiàn)斷崖式下跌;7 天之后,也就是 4 月 6 日,美國疫情數(shù)據(jù)出現(xiàn)斷崖式下跌,增幅從 12.43% 降為 8.13%——這篇文章引起了巨大反響,閱讀量超過 134 萬。

  自 3 月 27 日以來,該博客對歐洲感染人數(shù)的每日預測平均準確率達到 97%,其中在 4 月份的前五天,預測準確率接近 100%。

  李志斌對美國感染人數(shù)的預測(樂觀),準確率高達 90%

  對此,有網(wǎng)友評論稱:大神,病毒都聽你的,絕了。

  要知道,新冠肺炎疫情的爆發(fā)是一個涉及到政治、經(jīng)濟、地理等諸多復雜因素的全球性重大公共事件,對具體人數(shù)的預測聽起來就像是天方夜譚,準確率更是一門玄學——所以,能夠實現(xiàn)上述的預測成績,這個博客背后的博主堪稱是當代 "神算子" 了。

  那么,這位 "神算子" 是怎么煉成的?

  清華大學畢業(yè) + 8 年市場預測經(jīng)驗

  這個博客背后的博主,也就是 "神算子" 本人,名為李志斌。

  李志斌,1980 到 1985 年就讀于清華大學計算機系,1985 到 1994 年,他就讀并就職于中科院,三十歲擔任副研究員、產(chǎn)品部主任、所長助理,1994 年移居新西蘭,后定居香港至今,現(xiàn)任香港致佳物流軟件有限公司、香港易經(jīng)科技有限公司總經(jīng)理。

  李志斌博客截圖

  在李志斌所在的這兩家公司中,前者的主營業(yè)務是物流系統(tǒng)開發(fā)(Logistics Systems);后者有香港中文大學背景,主要業(yè)務是市場需求預測(Market Demand Forecast),也就是為企業(yè)提供在未來 3 到 6 個月內(nèi)特定區(qū)域的產(chǎn)品需求、價格波動等方面的數(shù)據(jù)分析和預測。

  在接受雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))專訪時,李志斌表示,他從 2012 年開始進入數(shù)據(jù)分析和預測領域,由于易經(jīng)公司的香港中文大學背景,李志斌也從教授們那里耳濡目染學了不少東西。

  另外,從技術層面來說,李志斌在清華大學計算機系的學習經(jīng)歷,也讓他在軟件建模、大數(shù)據(jù)分析等方面已經(jīng)形成一個完備的知識體系;同時,清華大學的理工科學風和背景,也讓他更加重數(shù)據(jù)、重證據(jù)、重例舉,而不是重結論。

  所有這些加起來,讓李志斌對 "數(shù)據(jù)" 非常敏感。

  去年底今年初,武漢開始報告病例,香港也出現(xiàn)疑似新冠病毒患者,這讓長期身在香港的李志斌頗為警惕;到了 2020 年 1 月 7 日,香港特別行政區(qū)政府宣布新冠肺炎為法定傳染病,并開始向公眾通報疫情數(shù)據(jù),由此,李志斌開始了對新冠肺炎相關數(shù)據(jù)的追蹤。

  從那時開始,李志斌每天早上起來進行集中數(shù)據(jù)采集,一開始只是武漢、湖北、香港的數(shù)據(jù),后來是內(nèi)地其他地區(qū)數(shù)據(jù),到了 1 月下旬,開始收集海外數(shù)據(jù),并整理成 Excel 表,同時開始利用自己的專業(yè)知識進行數(shù)據(jù)建模,并結合新聞中的數(shù)據(jù)對官方通報數(shù)據(jù)進行分析和判斷。

  最初,李志斌只是在清華的同學群里分享數(shù)據(jù)和觀點,后來也每天花出 30 分鐘的時間來博文,并發(fā)表在新浪博客上。如今,這已經(jīng)形成了每天的習慣。

  當然,對于李志斌而言,除了對常規(guī)的數(shù)據(jù)進行收集、整理和分析之外,他也在不斷結合自己的專業(yè)知識來構建一個數(shù)據(jù)模型,并且不斷對這個模型進行參數(shù)補充和驗證,使之達到預期中的效果。

  到了 3 月 27 日,李志斌在數(shù)據(jù)模型已經(jīng)趨于穩(wěn)定的基礎上,第一次給出了針對美國感染情況的預測數(shù)據(jù);3 月 28 日,他又給出了針對歐洲感染情況的預測數(shù)據(jù)。

  李志斌對歐洲感染人數(shù)的預測,平均準確率高達 97%

  在他的預測中,不僅僅包含感染病例數(shù)量,還包括感染增速、峰值時間、總感染人數(shù)、總死亡人數(shù)、死亡率等數(shù)據(jù)——當然,感染人數(shù)是他用來衡量預測準確率的最為重要的指標。

  就連李志斌自己都沒有想到,自己的預測數(shù)據(jù)會那么準。

  但是李志斌強調,沒有人可以 100% 準確預測未來,一定要滾動預測。他表示:

預測是一個動態(tài)過程,因為好多即時措施、事件等突發(fā)因素,是無法預測的,這個時候需要把這些突發(fā)事件和決定等因素變成對參數(shù)的調整,反饋到預測模型中,使之運行更加準確。我的預測模型、預測參數(shù)也在不斷完善過程中。

  再好的軟件也不能 100% 預測準確

  李志斌的預測,離不開兩個核心要素:數(shù)據(jù),和預測模型。

  首先是數(shù)據(jù)的可信度問題。在采訪中,李志斌表示,自己從 1 月份開始每天收集數(shù)據(jù),一開始只有武漢和香港有數(shù)據(jù),一直到現(xiàn)在,每天收集上百個國家和地區(qū)的數(shù)據(jù)。

  李志斌強調,在數(shù)據(jù)收集和分析的過程中,一定需要甄別數(shù)據(jù)沖突(Data Conflicting)的出現(xiàn);尤其是在官方通報的數(shù)據(jù)量比較大的情況下,會用好多方法包括新聞數(shù)據(jù)去檢查不同地區(qū)的數(shù)據(jù)之間可能存在的數(shù)據(jù)沖突,數(shù)據(jù)沖突點越多,數(shù)據(jù)的可信度越低。

  同時,在判斷數(shù)據(jù)真實性的過程中,要看數(shù)據(jù)發(fā)布的速度;數(shù)據(jù)發(fā)布頻率越高,那么可信度就會更高一些——而南亞、東南亞地區(qū)發(fā)布的數(shù)據(jù)比較少、比較慢,可信度就會打折扣。

  來自美國 CDC 官網(wǎng)的疫情情況

  另外,在對數(shù)據(jù)的可信度進行判斷時,還可以借用新聞數(shù)據(jù)來做對比。李志斌告訴雷鋒網(wǎng),比如說,醫(yī)生和病人之間的比例是比較穩(wěn)定的,那就可以用新聞中報道的醫(yī)療人員數(shù)量,來反推病人數(shù)量。

  他表示,其實,所有的數(shù)據(jù)都可能存在一些人為的誤差或者統(tǒng)計誤差,沒有任何地區(qū)的可信度是百分之百;但是相對來說,美國的數(shù)據(jù)沖突比較少,在可信度上高一些,歐洲的數(shù)據(jù)可信度次于美國,因為西歐與東歐之間的不平衡,所以會取平均值。但印度、東南亞、日本等地區(qū)的數(shù)據(jù)就似乎存在一些問題,數(shù)據(jù)發(fā)布慢、數(shù)據(jù)沖突點較多,影響了數(shù)據(jù)可信度的設置。

  到二月底,在之前以國內(nèi)數(shù)據(jù)為基礎建模、驗證的基礎上,李志斌開始對美國、歐洲兩個地區(qū)進行疫情數(shù)據(jù)預測。于是,在數(shù)據(jù)的基礎之上,李志斌打造了一個預測模型——實際上,這是一個極為復雜的模型,加起來有上百個參數(shù),其中重要的參數(shù)有二三十個,分為以下三類:

  • 第一類是疫情參數(shù)——不同地區(qū)/國家/城市確診人數(shù)、人口、每日新增確診人數(shù)、疑似人數(shù)、每日檢測人數(shù)、死亡人數(shù)、治愈人數(shù)(含自愈人數(shù))、在診人數(shù)、入院人數(shù)(重癥人數(shù))。

  • 第二類參數(shù)與地區(qū)/城市/國家特征相關——城市類型(古城、現(xiàn)代城市、鄉(xiāng)村)、人口密度、氣溫、天氣(大雨、陰雨、有霧、天晴等)、城市 60 歲以上老年人口比例、城市平均年齡、城市建設情況(主要是下水道的狀況)。

  • 第三類參數(shù)是關于資源和管治能力——醫(yī)療資源、病床數(shù)量、社會組織能力、信息透明度、管理方式等等。

  李志斌表示,在實際的操作過程中,一般是先用 Excel 收集數(shù)據(jù),然后導入到后臺數(shù)據(jù)庫中,在用自己開發(fā)的軟件模型(里面包含了算法)來得出三個結論,最后自己會再人為地就結果進行判斷——他強調,有很多參數(shù)是不能量化的,比如說社會情緒;所以需要人為參與。

  他還表示:再好的軟件也不能百分之百預測準確。

  當大船和小船同時遇見冰山

  在采訪中,雷鋒網(wǎng)發(fā)現(xiàn),畢業(yè)于清華大學的李志斌,有著超越數(shù)據(jù)分析之外的超前洞見和思維。

  比如說,在建模過程中,李志斌是從國內(nèi)的數(shù)據(jù)開始的,這些數(shù)據(jù)不僅對李志斌的建模過程產(chǎn)生了重要影響,也讓他得出了一些觀察。于是,武漢封城前一天,他就在自己所在的 "清華 80 同學群" 里和同學們分享了兩個想法:

  • 一是武漢應當立即封城,因為數(shù)據(jù)上升太嚇人;

  • 二是在湖北尤其是武漢地區(qū)快速建立二三十個網(wǎng)格式野戰(zhàn)醫(yī)院,作為隔離救治中心,所謂野戰(zhàn)醫(yī)院,也就是后來的方艙醫(yī)院,因為疫情發(fā)展太猛,隔離病人是比治療更為關鍵的防控措施。

  這些想法在同學群里引起了很多討論,當然也有質疑和反對,但更多的是同學們的積極參與,并提出了好多更好的想法和建議,獲益良多。后來的事實證明,這些想法都是中肯的,并且也被官方后續(xù)采取的措施所印證——其中關于野戰(zhàn)醫(yī)院等想法更是超前了兩周。

  除了上述建議,李志斌還在數(shù)據(jù)分析和模型構建的過程中發(fā)現(xiàn),成為疫情爆發(fā)點的城市往往具備幾個特征:

  • 老城區(qū);

  • 氣候潮濕;

  • 氣溫 5-15 度;

  • 下水系統(tǒng)老化;

  • 老年人比例高。

  值得一提的是,在不同國家的疫情爆發(fā)城市,如中國武漢、韓國大邱、意大利米蘭、伊朗德黑蘭、美國紐約等,都大致符合這些特征。

  對于這些特征的歸因,李志斌強調,其中夾雜了個人的主觀合理猜測,但也經(jīng)過一系列的結果驗證,最終才體現(xiàn)在預測結果中。他還表示,實際上,在參數(shù)中,還涉及到社會組織方式、管理模式、社會信息透明度等問題,所以他在預測中也會把結果設定為悲觀或樂觀。

  雷鋒網(wǎng)注意到,如果按照李志斌在在 4 月 4 日給出的悲觀預測結果,他對美國感染人數(shù)的總體預測準確率高達 96%。

  李志斌對美國感染人數(shù)的預測(悲觀),準確率高達 96%

  不過,在專訪中,盡管有人為參與,但李志斌還是強調了數(shù)據(jù)在決策中的絕對地位。他表示,即使是拋開疫情不談,在一個日常的決策過程中,數(shù)據(jù)的重要性可以說是百分之百的;這些數(shù)據(jù)不僅僅要真實,而且要全面,還要透明,即使在后續(xù)過程中有人的參與,也是要基于這些數(shù)據(jù)判斷而來的——數(shù)據(jù),正是決策的基礎。

  那么,基于數(shù)據(jù)的決策,有多大的覆蓋面呢?

  李志斌認為,即使是新冠肺炎疫情這樣的頗具偶然性、又包含政治、經(jīng)濟等復雜社會因素的群體性公共事件,也是可以預測的。

  他表示,類似于傳染病的情況,它的發(fā)展存在著一種特定的模式(Pattern),偶然之中有規(guī)律在,我們也許無法掌握 100% 準確的規(guī)律,但是在一定的規(guī)律占比下,我們依然可以做出一些判斷和決策——當然前提是巨大的有效數(shù)據(jù)量。

  由此,李志斌還談到了一個有趣的比喻:

一只大船和一只小船,在突然遇到冰山時,它們勢必要拐彎;但相對來說,大船的結局顯然更具有可預測性。小船一下子就改過來了,但大船的體量太大,有一個慣性,因此它有更大的可能性撞上冰山——這個慣性就是規(guī)律,而船的體量本身,就是數(shù)據(jù)量。

  數(shù)據(jù)量越大、數(shù)據(jù)越準確、相關信息越透明,這種群體性事件發(fā)生的時候就越容易預測、且預測越準確——李志斌最后如是說。

總結

以上是生活随笔為你收集整理的清华校友预测美国疫情发展,准确率达96%|网友:病毒都听你的,绝了的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。