第四范式蒋仁皓:什么才是构建企业AI的关键要素
或許在我們想象中人工智能已經(jīng)如星火燎原般迅速蔓延到各種行業(yè)、場(chǎng)景里面取代或者幫助人提升一些業(yè)務(wù)價(jià)值了,但事實(shí)到底是否如此?在落地中,什么才是構(gòu)建企業(yè)AI的關(guān)鍵要素??
?
?
11月30日,在清數(shù)大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟與清華校友總會(huì)AI大數(shù)據(jù)專(zhuān)委會(huì)(籌)共同主辦的金融大數(shù)據(jù)行業(yè)思享會(huì)上,第四范式咨詢(xún)副總監(jiān)蔣仁皓分享了金融行業(yè)構(gòu)建AI核心能力的實(shí)踐。蔣仁皓重點(diǎn)介紹基于學(xué)習(xí)圈的金融業(yè)務(wù)的AI核心能力構(gòu)建方法,來(lái)自中國(guó)銀行、包商銀行、電信公司、微軟公司等相關(guān)業(yè)務(wù)領(lǐng)域近30余位業(yè)內(nèi)人士參與交流和討論。
?
AI到底是什么?我們?yōu)槭裁匆獛椭髽I(yè)構(gòu)建AI核心能力?
?
我們對(duì)本次分享的精彩內(nèi)容進(jìn)行了整理,在不改變?cè)獾那疤嵯掠袆h改:?
?
我們可以從兩個(gè)數(shù)字講起,一個(gè)是5598.82億美元,一個(gè)是2914.61億美元,前者是亞馬遜,后者是沃爾瑪,這代表了兩個(gè)上市公司的最新市值。在今年四月份的時(shí)候亞馬遜還在4400多億,沃爾瑪是2200多億,當(dāng)過(guò)了半年之后我們發(fā)現(xiàn)兩家公司的市值差距從原來(lái)的一倍越拉越大。但我們要知道在2005年的時(shí)候亞馬遜市值可能只有200多億,沃爾瑪?shù)氖兄祬s接近了2000多億,亞馬遜只有其十分之一。在2005年到2016年期間,亞馬遜的營(yíng)業(yè)收入開(kāi)始以10-20%的速度增長(zhǎng),甚至有些年份達(dá)到了40%。但反過(guò)來(lái)看沃爾瑪?shù)脑鲩L(zhǎng)率,卻維持在了個(gè)位數(shù),有些年份更是零增長(zhǎng)或者負(fù)增長(zhǎng)。
?
這表明亞馬遜正在迅速的擴(kuò)張,雖然其與沃爾瑪本質(zhì)上都是零售行業(yè),但因?yàn)閬嗰R遜的業(yè)務(wù)線豐富,導(dǎo)致亞馬遜逐漸蠶食沃爾瑪?shù)睦麧?rùn)空間與客戶(hù),使得亞馬遜市值一路走高,到2015年7月份終于超過(guò)沃爾瑪,在2016年的時(shí)候,亞馬遜市值飆升到全球第四。
?
另一個(gè)角度分析兩家企業(yè)
?
這兩家公司還有一個(gè)角度可以對(duì)比一下,即兩家企業(yè)每一位員工給企業(yè)創(chuàng)造的價(jià)值,沃爾瑪是22萬(wàn)美元,亞馬遜是62萬(wàn)美元,是沃爾瑪?shù)娜丁5?#xff0c;沃爾瑪這個(gè)從營(yíng)業(yè)規(guī)模上來(lái)看依然是世界500強(qiáng)排名第一的企業(yè)真的是一個(gè)菜鳥(niǎo)嗎?我們都應(yīng)該聽(tīng)過(guò)一個(gè)耳熟能詳?shù)睦?#xff1a;啤酒和尿布。無(wú)論這件事是真是假,都說(shuō)明了一件事情,沃爾瑪并不是一個(gè)菜鳥(niǎo)。其實(shí)沃爾瑪一直在用數(shù)據(jù)驅(qū)動(dòng)它的業(yè)務(wù),它會(huì)基于不同的地方,根據(jù)數(shù)據(jù)分析周?chē)目蛻?hù)群行為模式、消費(fèi)習(xí)慣、偏好,然后決定這家店里面的商品如何擺放,做到了每家店都不一樣,成為了千店千面。
但是這個(gè)問(wèn)題十分復(fù)雜,沃爾瑪?shù)?015年的時(shí)候全球有一萬(wàn)家店,它要解決的問(wèn)題是萬(wàn)級(jí)的復(fù)雜度。而亞馬遜是完全基于客戶(hù)的,即使這個(gè)客戶(hù)在不同的時(shí)間點(diǎn)偏好都不一樣,它依然會(huì)針對(duì)這個(gè)客戶(hù)去分析客戶(hù)最有可能感興趣的商品,給客戶(hù)一個(gè)定制化的面向客戶(hù)的商品擺放,所以亞馬遜在解決商品擺放這件事上是億級(jí)別的復(fù)雜度。
?
《經(jīng)濟(jì)學(xué)人》有一句話:當(dāng)沃爾瑪還在研究怎么幫助客戶(hù)省錢(qián)的時(shí)候,亞馬遜在做的是怎么讓客戶(hù)更快地找到他想要的東西。亞馬遜正是通過(guò)這樣的方式不斷提升客戶(hù)的體驗(yàn),從而去蠶食競(jìng)爭(zhēng)對(duì)手的利潤(rùn)空間。?
?
新的利潤(rùn)的增長(zhǎng)點(diǎn)在哪里
?
在上世紀(jì)90年代,大家的競(jìng)爭(zhēng)是靜態(tài)的,但移動(dòng)互聯(lián)網(wǎng)的時(shí)代來(lái)了之后,資本的大量進(jìn)入導(dǎo)致了人們發(fā)現(xiàn)可以通過(guò)快速的擴(kuò)張,從而占領(lǐng)更多的市場(chǎng)和客戶(hù),這時(shí)候大家只需要做的一件事就是比誰(shuí)跑得快。這時(shí)我們會(huì)發(fā)現(xiàn)另一個(gè)新的問(wèn)題:當(dāng)增長(zhǎng)到一定程度之后,所有的客戶(hù)都被圈完了,新的利潤(rùn)的增長(zhǎng)點(diǎn)在哪里?無(wú)非兩種情況罷了,第一是改變商業(yè)模式,從而找到新的商業(yè)增長(zhǎng)點(diǎn),但這件事情相對(duì)來(lái)講是很難的,因?yàn)檎麄€(gè)企業(yè)的業(yè)務(wù)會(huì)發(fā)生很大的變化。第二種是從競(jìng)爭(zhēng)對(duì)手那邊搶客戶(hù),依靠好的產(chǎn)品搶奪客戶(hù),這也叫做企業(yè)的競(jìng)爭(zhēng)力。
?
企業(yè)競(jìng)爭(zhēng)力從哪來(lái)?
?
最重要的一點(diǎn)是決策的能力。
決策的能力分成兩方面,第一是決策的好壞,第二是決策的速度。
決策能力的差異體現(xiàn)在精細(xì)化、差異化,即針對(duì)每個(gè)人更精細(xì)化、差異化的做經(jīng)營(yíng),這是體現(xiàn)經(jīng)營(yíng)能力的地方。而想要提升經(jīng)營(yíng)能力或者決策效率,背后有一個(gè)很重要的能力是人工智能,人工智能去做這件事情會(huì)更快、更細(xì)。?
?
人工智能的發(fā)展
?
人工智能的概念并不新鮮,在上世紀(jì)五六十年代的時(shí)候就已經(jīng)有人提出人工智能的概念了。在上世紀(jì)五六十年代大家都很樂(lè)觀,覺(jué)得這件事情一定能夠做成,二十年內(nèi)機(jī)器一定能在所有領(lǐng)域超越人類(lèi),但后來(lái)這件事情并沒(méi)有發(fā)生。到了七十年代,大家想通過(guò)一些專(zhuān)家系統(tǒng)的方式做人工智能,結(jié)果是失敗了。當(dāng)九十年代深藍(lán)打敗卡斯帕羅夫的時(shí)候,依然是失敗了,因?yàn)樯钏{(lán)并不是人工智能,它靠的是暴力搜索。一直到21世紀(jì),我們又回到了模仿人類(lèi)這條路上來(lái)。
AI模仿人類(lèi)背后有幾個(gè)條件。一個(gè)是大數(shù)據(jù),大數(shù)據(jù)是現(xiàn)今人工智能能夠做成的非常重要的必要條件,現(xiàn)在全球的數(shù)據(jù)大概以每年50%的速度增長(zhǎng),這是一個(gè)數(shù)據(jù)爆炸的時(shí)代。第二個(gè)是計(jì)算資源價(jià)格的下降,計(jì)算資源變得越來(lái)越便宜。第三是計(jì)算的架構(gòu)變得越來(lái)越成熟。第四是現(xiàn)在一些分布式計(jì)算技術(shù)的成熟。
?
機(jī)器學(xué)習(xí)與分析數(shù)據(jù)
?
分析數(shù)據(jù)這件事情并不新鮮,從上世紀(jì)90年代有了信息化系統(tǒng)、有了數(shù)據(jù)之后,人們就開(kāi)始分析數(shù)據(jù)。但我們現(xiàn)在做的分析數(shù)據(jù)與以前的分析數(shù)據(jù)有很大的不同,這種不同是體現(xiàn)在傳統(tǒng)的大數(shù)據(jù)分析會(huì)做一件叫抓大放小的事情。抓大放小的意思是如果有一億條數(shù)據(jù),我們會(huì)從里面抽出一些數(shù)據(jù)拿來(lái)做分析,另外則是找一些專(zhuān)家通過(guò)一些方法和工具分析,把我們認(rèn)為最有用的特征抽出來(lái),然后用這些特征讓一些算法跑出一個(gè)最后的東西。?
?
這使得傳統(tǒng)大數(shù)據(jù)分析具備了兩個(gè)特性:
?
一個(gè)是抽樣,一個(gè)是降維。
?
但用機(jī)器學(xué)習(xí)方式做數(shù)據(jù)分析的時(shí)候,首先不會(huì)做抽樣的事情,也不會(huì)做降維,甚至還會(huì)升維。
?
有人問(wèn),是不是有了VC維就代表我們有了一個(gè)AI的核心能力?VC維上升是否就代表企業(yè)AI能力上升從而提高了競(jìng)爭(zhēng)力?
?
舉個(gè)例子,VC維就像我們現(xiàn)在有了一個(gè)性能非常強(qiáng)勁的發(fā)動(dòng)機(jī),但有了發(fā)動(dòng)機(jī)不代表我們就有了一輛跑車(chē),我們還要給它配相適應(yīng)的底盤(pán)、變速箱、車(chē)架以及排氣管,有了這些才算是真正的跑車(chē)。
?
構(gòu)建企業(yè)AI的關(guān)鍵要素
?
企業(yè)要具備什么樣的東西才能被認(rèn)為是具備了AI的核心能力?這里借鑒大衛(wèi)·庫(kù)伯提的理論:三歲以上的人學(xué)習(xí)東西是有一個(gè)過(guò)程的。第一件事情是有行動(dòng),去做一些事情,基于這些行動(dòng)會(huì)得到一些經(jīng)驗(yàn),有了這些經(jīng)驗(yàn)之后會(huì)去思考能學(xué)到什么,以及能夠總結(jié)出什么樣的經(jīng)驗(yàn),下次要如何去做,通過(guò)這些反思去得到一些理論,從而指導(dǎo)我們下一次的行動(dòng)。
?
機(jī)器學(xué)習(xí)的過(guò)程與這個(gè)理論本質(zhì)上是一樣的,我們要做人工智能或者機(jī)器學(xué)習(xí)要具備一些要素。第一是大數(shù)據(jù),首先大數(shù)據(jù)不是一個(gè)絕對(duì)的概念,大數(shù)據(jù)并沒(méi)有一個(gè)嚴(yán)格的標(biāo)準(zhǔn),它是一個(gè)相對(duì)概念,我們需要的是有一定量的數(shù)據(jù)幫助機(jī)器學(xué)習(xí),在這個(gè)過(guò)程中最重要的是去積累這些數(shù)據(jù),并加上反饋數(shù)據(jù)訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)模型的過(guò)程,從而幫助我們總結(jié)經(jīng)驗(yàn)。在這個(gè)過(guò)程中有一個(gè)很重要的叫算法,即實(shí)現(xiàn)這些算法或者面向一個(gè)海量數(shù)據(jù)用這些算法訓(xùn)練模型所需要的基礎(chǔ)架構(gòu)。
?
讓機(jī)器實(shí)現(xiàn)學(xué)習(xí)圈。AI核心能力還要建設(shè)一個(gè)學(xué)習(xí)圈,讓它變成一個(gè)可以像人一樣去學(xué)習(xí)去決策并不斷自我學(xué)習(xí)的一個(gè)應(yīng)用,所以它要解決的不僅僅是一個(gè)算法的問(wèn)題,我們還要把數(shù)據(jù)引進(jìn)來(lái),然后把這些數(shù)據(jù)結(jié)合反饋數(shù)據(jù)放到一個(gè)算法里面訓(xùn)練,訓(xùn)練完之后這個(gè)模型才可以上線、發(fā)布、應(yīng)用。然后我們?nèi)ナ占答?#xff0c;不斷迭代。
一個(gè)企業(yè)要構(gòu)建AI能力,除了要覆蓋端到端的機(jī)器學(xué)習(xí)或者人工智能從訓(xùn)練到應(yīng)用到不斷地自迭代、自反饋的過(guò)程之外,也要注意一些關(guān)鍵因素。
?
-
第一高維度,它決定了你和別人差異化的優(yōu)勢(shì)。
-
第二算法的豐富性,很多時(shí)候我們面對(duì)不同場(chǎng)景需要用到的算法是不一樣的,可能面對(duì)一些場(chǎng)景需要用邏輯回顧、一些場(chǎng)景需要用決策樹(shù)、一些場(chǎng)景需要用深度神經(jīng)網(wǎng)絡(luò)等等。所以我們需要應(yīng)用不同的算法解決不同的問(wèn)題。
-
第三高性能,很多時(shí)候資源是有限的,比如計(jì)算資源,計(jì)算資源即是計(jì)算的成本,比如做一件事情要用1萬(wàn)臺(tái)機(jī)器的集群才能把這件事情做出來(lái),這件事情就會(huì)變得不可行。第二個(gè)是時(shí)間資源,如果一件事情需要算三個(gè)月才能行,但三個(gè)月后業(yè)務(wù)上的需求可能都已經(jīng)過(guò)去了,所以這些事情都是有制約的,這就需要我們具備高性能的設(shè)備去計(jì)算那些海量的數(shù)據(jù)。
-
第四是時(shí)效性,在移動(dòng)互聯(lián)網(wǎng)的場(chǎng)景下,很多場(chǎng)景對(duì)時(shí)效性都有非常高的要求,要在非常有限的時(shí)間內(nèi)算出結(jié)果進(jìn)行反饋。
-
第五是持續(xù)演講,一個(gè)成功的業(yè)務(wù)除了單個(gè)業(yè)務(wù)的學(xué)習(xí)環(huán)之外,還需要與其它業(yè)務(wù)之間相互促進(jìn)相互融合,需要平臺(tái)對(duì)這些業(yè)務(wù)的融合上有些持續(xù)演進(jìn)。
-
第六,實(shí)現(xiàn)統(tǒng)一管理,即除了自己的算法、框架以外,還要能集成更多的開(kāi)源的框架,最后做出一個(gè)統(tǒng)一的管理。
?
低門(mén)檻與成本問(wèn)題
?
如今的人工智能非常火,大家都十分關(guān)注,或許我們想象中人工智能已經(jīng)如星火燎原般迅速蔓延到各種行業(yè)、場(chǎng)景里面取代或者幫助人提升一些業(yè)務(wù)價(jià)值了。但是我們看到這些事情無(wú)論是生活中還是新聞中,都沒(méi)有那么多。?
?
首先就是它的門(mén)檻高。回到剛才說(shuō)的五個(gè)條件:大數(shù)據(jù)、反饋、算法、架構(gòu)和需求,這涉及到了業(yè)務(wù)專(zhuān)家、建模專(zhuān)家、IT架構(gòu)師,它的門(mén)檻是很高的,需要很多方面的專(zhuān)家配合在一起才能把這件事情做好。所以人工智能的一個(gè)核心能力在于要把這件事情的門(mén)檻降低,讓更多的人一起來(lái)做這件事情,通過(guò)一些平臺(tái)和工具讓大家協(xié)作起來(lái)更好地做好這件事情。
?
最后是成本問(wèn)題。對(duì)于企業(yè)來(lái)講做任何事情都有一個(gè)成本問(wèn)題,比如說(shuō)很多時(shí)候一個(gè)企業(yè)構(gòu)建一個(gè)AI團(tuán)隊(duì)可能要去找很多專(zhuān)家,構(gòu)建起一個(gè)10人、20人的團(tuán)隊(duì)去做產(chǎn)品、平臺(tái)、應(yīng)用等等。
這件事情有兩個(gè)方面的成本,第一是這些大牛的成本是很高的,中國(guó)比較資深的數(shù)據(jù)科學(xué)家年薪達(dá)到了100萬(wàn)。第二是時(shí)間的代價(jià)很高,這件事情需要投入非常多的時(shí)間,在投入這些事情的過(guò)程中可能會(huì)錯(cuò)失非常多的商機(jī),所以很重要的一點(diǎn)是怎么樣用比較低的資金成本和時(shí)間成本構(gòu)建這個(gè)能力,這些事情是構(gòu)建一個(gè)企業(yè)AI核心能力最重要的問(wèn)題。
思享會(huì)
思享會(huì),亦私想?yún)R,亦私享會(huì),亦思想?yún)R,是由清數(shù)大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟與清華校友總會(huì)AI大數(shù)據(jù)專(zhuān)委會(huì)(籌)共同發(fā)起的思想交流平臺(tái),定位為小范圍的深度交流,目標(biāo)是希望通過(guò)思想交流與碰撞促進(jìn)產(chǎn)業(yè)的數(shù)據(jù)創(chuàng)新,以及大數(shù)據(jù)與產(chǎn)業(yè)和資本的融合,幫助各產(chǎn)業(yè)發(fā)現(xiàn)和挖掘數(shù)據(jù)的價(jià)值,促成聯(lián)盟成員及校友之間的互助與合作,為參會(huì)嘉賓帶來(lái)新靈感和新啟發(fā)。
校對(duì):丁楠雅
為保證發(fā)文質(zhì)量、樹(shù)立口碑,數(shù)據(jù)派現(xiàn)設(shè)立“錯(cuò)別字基金”,鼓勵(lì)讀者積極糾錯(cuò)。
若您在閱讀文章過(guò)程中發(fā)現(xiàn)任何錯(cuò)誤,請(qǐng)?jiān)?/span>文末留言,或到后臺(tái)反饋,經(jīng)小編確認(rèn)后,數(shù)據(jù)派將向檢舉讀者發(fā)8.8元紅包。
同一位讀者指出同一篇文章多處錯(cuò)誤,獎(jiǎng)金不變。不同讀者指出同一處錯(cuò)誤,獎(jiǎng)勵(lì)第一位讀者。
感謝一直以來(lái)您的關(guān)注和支持,希望您能夠監(jiān)督數(shù)據(jù)派產(chǎn)出更加高質(zhì)的內(nèi)容。
總結(jié)
以上是生活随笔為你收集整理的第四范式蒋仁皓:什么才是构建企业AI的关键要素的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: directX学习系列8 颜色融合(转)
- 下一篇: 【蜂口 | AI人工智能】表情识别——龙