AI 预测未来? 虽然有曙光,但路还很长
編者按:本文來自微信公眾號“學(xué)術(shù)頭條”(ID:SciTouTiao),作者:曹綺桐
如果了解一個家庭的經(jīng)濟(jì)實力、教育水平、生活環(huán)境等基礎(chǔ)狀況數(shù)據(jù),你能預(yù)測未來十年或者二十年的生活樣子嗎?
答案是可想而知的 —— 畢竟復(fù)雜的社會網(wǎng)絡(luò)、難測的生活經(jīng)歷,以及每個帶有個人主觀性質(zhì)的小小決定,都有可能對未來生活造成不可逆轉(zhuǎn)的方向的改變。
但是,當(dāng)擁有大量基礎(chǔ)數(shù)據(jù)后,我們或許可以判斷個人在特定生活環(huán)境下怎樣成長或者趨向性做出怎樣的決定,某個事件對于家庭會造成怎樣積極或者消極的影響, 這也許就會讓不可能變成可能。
而 AI 強大的分析數(shù)據(jù)的能力,給這種預(yù)測未來的可能帶來了一絲曙光。
如今,科學(xué)家們正開始在這一領(lǐng)域的嘗試。
來自普林斯頓大學(xué) (Princeton University) 與弗吉尼亞理工大學(xué) (Virginia Tech) 等多家機構(gòu)的研究人員合作進(jìn)行的一項大規(guī)模研究,通過建立統(tǒng)計和機器學(xué)習(xí)模型來預(yù)測和衡量美國各地兒童、父母和家庭的生活結(jié)果,這個大規(guī)模的合作項目被稱為 “脆弱的家庭挑戰(zhàn)”。
來自弗吉尼亞理工大學(xué)弗拉林生命科學(xué)研究所的研究科學(xué)家 Brian Goode 是脆弱家庭挑戰(zhàn)中的數(shù)據(jù)和社會科學(xué)家之一。“這是一項努力,試圖捕捉數(shù)據(jù)和模型中構(gòu)成人類生活結(jié)構(gòu)的復(fù)雜性和復(fù)雜性。但是,為了更好地推斷預(yù)測的不確定性和局限性,必須采取下一步行動,將模型置于如何應(yīng)用它們的環(huán)境中。這是一個很難解決的問題,我認(rèn)為脆弱家庭的挑戰(zhàn)表明,我們需要在這一領(lǐng)域提供更多的研究支持,特別是在機器學(xué)習(xí)對我們?nèi)粘I町a(chǎn)生更大影響的情況下。”Brian Goode 說道。
Goode 博士
該研究對 1998 年至 2000 年間出生在美國大城市的約 5000 名兒童進(jìn)行了研究,其中未婚父母所生兒童的樣本數(shù)量過多。這項縱向研究的目的是了解出生在未婚家庭的孩子的生活。
通過收集六次調(diào)查 (孩子出生的時間,然后孩子長到 1、3、5、9、15 歲時),這項研究已經(jīng)收集了數(shù)百萬關(guān)于兒童及其家庭的數(shù)據(jù)點。另一組數(shù)據(jù)將在孩子們 22 歲時被獲取。
在研究人員設(shè)計這個項目的時候,15 歲的數(shù)據(jù) (研究人員在論文中稱其為 “保留數(shù)據(jù)”) 還沒有公開。這同時也創(chuàng)造了一個機會,讓其他科學(xué)家通過大規(guī)模合作來預(yù)測研究對象的生活結(jié)果。
聯(lián)合組織者收到了來自世界各地 68 所大學(xué)的 457 份申請,其中包括來自普林斯頓的幾個團(tuán)隊。利用該項目的家庭數(shù)據(jù),參與者被要求預(yù)測 15 歲時六種生活結(jié)果中的一種或多種。其中包括兒童平均績點 (GPA)、孩子毅力、家庭物質(zhì)困難、主要照顧者裁員、主要照顧者參與工作培訓(xùn)等。
麥克拉納漢是普林斯頓大學(xué)和哥倫比亞大學(xué) “脆弱家庭與兒童健康研究”(Fragile Families and Child happiness Study) 的首席研究員。“剛開始的時候,我真的不知道什么是大規(guī)模協(xié)作,但我知道把我們的數(shù)據(jù)介紹給一組新的研究人員是個好主意, 那就是數(shù)據(jù)科學(xué)家,” 麥克拉納漢說。
“結(jié)果讓人大開眼界,” 她說,“要么運氣在人們的生活中扮演著重要角色,要么我們作為社會科學(xué)家的理論遺漏了一些重要的變量。”
這項挑戰(zhàn)是基于 “共同任務(wù)法”,這是一種在計算機科學(xué)中經(jīng)常使用的研究設(shè)計,但在社會科學(xué)中卻不常用。這種方法釋放了部分但不是全部的數(shù)據(jù),允許人們使用任何他們想要的技術(shù)來確定結(jié)果。目標(biāo)是準(zhǔn)確地預(yù)測保留的數(shù)據(jù),不管達(dá)到這個目標(biāo)需要多么復(fù)雜的技術(shù)。
研究結(jié)果由 112 名共同作者發(fā)表在《美國國家科學(xué)院院刊》(PNAS) 雜志上。結(jié)果表明,即使使用了最先進(jìn)的建模技術(shù)和包含 4000 多個家庭 1.3 萬個數(shù)據(jù)點的高質(zhì)量數(shù)據(jù)集,最好的人工智能預(yù)測模型也不是很準(zhǔn)確。因此,社會學(xué)家和數(shù)據(jù)科學(xué)家對于 AI 預(yù)測模型時應(yīng)謹(jǐn)慎使用,尤其是在刑事司法系統(tǒng)和社會項目中。
弗吉尼亞理工大學(xué)的研究小組還在美國社會學(xué)協(xié)會 (American Sociological Association) 新出版的開放獲取期刊《社會學(xué)》(Socius) 的一期特刊上發(fā)表了研究成果。為了支持這一領(lǐng)域的進(jìn)一步研究,所有提交的挑戰(zhàn) —— 代碼、預(yù)測和敘事解釋 —— 都是公開的。
研究人員表示,結(jié)果向我們表明,我們有很多要學(xué),科學(xué)家用來預(yù)測大數(shù)據(jù)集結(jié)果的機器學(xué)習(xí)技術(shù),在預(yù)測人們的生活結(jié)果方面可能存在不足。
參考資料:
https://www.eurekalert.org/pub_releases/2020-03/puww-pto032520.php
https://www.eurekalert.org/pub_releases/2020-03/vt-pto032720.php
總結(jié)
以上是生活随笔為你收集整理的AI 预测未来? 虽然有曙光,但路还很长的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于自动驾驶你想知道的“干货”
- 下一篇: 别把创始人IP打造,弄成PUA教学