科大讯飞副总裁刘鹏:人机交互的未来是人人交互?
嘉賓介紹
劉鵬(微博&知乎:北冥乘海生/公眾號:計(jì)算廣告),現(xiàn)任科大訊飛副總裁,大數(shù)據(jù)研究院院長。劉鵬在清華大學(xué)獲得博士學(xué)位后,加入微軟亞洲研究院,從事人工智能研究。后參與創(chuàng)建雅虎北京研究院,出任高級科學(xué)家。劉鵬還曾擔(dān)任MediaV首席科學(xué)家、360商業(yè)化首席架構(gòu)師等職。在多年從業(yè)經(jīng)歷中,劉鵬一直致力于將人工智能方法與海量數(shù)據(jù)相結(jié)合的工業(yè)界問題,負(fù)責(zé)過多個大型互聯(lián)網(wǎng)商業(yè)產(chǎn)品體系。
Q1.?怎樣才能在大公司里得到晉升?
大公司里,項(xiàng)目成果被截和的概率,正比于項(xiàng)目的成功程度。
如果你不明不白地?cái)]起袖子就干,就算是項(xiàng)目大火,最多也就落得慶功宴上領(lǐng)導(dǎo)致詞里輕描淡寫的點(diǎn)贊:在CEO的英明領(lǐng)導(dǎo)下,COO的大力支持下,CAO的全力配合下,我?guī)ьI(lǐng)團(tuán)隊(duì),與某某和某某的兄弟部門密切配合,取得了階段性的成果。在此,我們要對某某、...、某某(你)等骨干員工提出表彰,并給他們每人加發(fā)半個月的獎金!?
因此,要想獲得credit,做事前起范兒至關(guān)重要。在事情八字還沒一撇的時候,沒幾個人會跟你來搶功,趁著這個機(jī)會,一定要充分請示、頻繁匯報,planning、brain storming、kick off搞個不停,一直到碼皇們耳朵都磨出繭子,冊封你為這個項(xiàng)目的負(fù)責(zé)人,全公司上下也都知道你有御賜的尚方寶劍。事情傳開了,別人再來搶功,就師出無名了。
在大公司里,當(dāng)一個干部管理的團(tuán)隊(duì)充分大時,他只有升職和離開兩種可能的后續(xù)狀態(tài)。
項(xiàng)目成敗在天,干部晉升在人。把仕途寄托在虛無飄渺的項(xiàng)目成敗上,是對自己不負(fù)責(zé)任的表現(xiàn)。趁著項(xiàng)目開工,迅速擴(kuò)大團(tuán)隊(duì)的話,則可以立于不敗之地——老板絕不可能承認(rèn)一個高調(diào)成立的隊(duì)伍啥也沒干出來,因?yàn)槟且彩撬氖?#xff0c;最后只好找個機(jī)會給你升職加薪,這樣的事情,在大公司呆過的應(yīng)該都見過不少。
所以,這一步是干部往上升最核心的步驟:巧立一個名目,招到十來個人,經(jīng)理的職位就算是穩(wěn)了;如法炮制搞個大事情,招到大幾十個人,再抓住各種機(jī)會多要點(diǎn)headcount,基本上就可以進(jìn)入中層了。
我還聽說某公司一位真正的高手,連名目也跳過了:在移動應(yīng)用大火的那兩年,這位經(jīng)理主動跳出來說,我要為公司招100名iOS和安卓工程師!干什么先別管,這是公司的戰(zhàn)略儲備!老板激動得涕泗橫流,當(dāng)即批復(fù):馬上干!后來,這位就成了移動開發(fā)事業(yè)部的總經(jīng)理。
怎么把小公司20人搞定的事兒編制出200個headcount,還顯得倍兒有道理呢?這方面需要專門的技巧和經(jīng)驗(yàn)了,回頭有機(jī)會我們專門撰文說明。
Q2. 從事互聯(lián)網(wǎng)行業(yè)的人員如何避免出現(xiàn)中年危機(jī)這種狀況?
PPT路線:這條路線,是從寫代碼的崗位轉(zhuǎn)入寫PPT的崗位,比如產(chǎn)品、運(yùn)營、領(lǐng)導(dǎo)秘書,或者仍在技術(shù)團(tuán)隊(duì)中的項(xiàng)目管理、架構(gòu)等角色。
分析此路線的好處,首先在于PPT技能隨變化很慢。我翻了翻十幾年前看過的一些講稿,放到今天也基本能糊弄過去。因此,PPT崗位不太容易因?yàn)榧夹g(shù)的驟然升級而被淘汰。另外,雖然PPT能力非常容易習(xí)得,可是相配合的演講能力卻需要一番磨煉,總體來說比碼農(nóng)的上手速度也要慢。
Politics路線:這條路線,是從生產(chǎn)力崗位轉(zhuǎn)入生產(chǎn)關(guān)系崗位,一般來說就是各種管理崗。這條路性價比高,競爭也激烈,要有意識地構(gòu)建好自己的能力,才有機(jī)會進(jìn)入。
這條路線的兩個速度都很慢:搞生產(chǎn)關(guān)系這事兒,需要長時間與人斗的歷練,核心能力的習(xí)得過程相當(dāng)漫長,除了天賦異稟的白頭山天降偉人,一般都是老而彌堅(jiān)。另一方面,與人斗的技能樹,中國在奴隸社會以降,就沒有太大變化,以至有“半部論語治天下”的說法。所以,向這個方向努力,對碼農(nóng)來說,是逃離職場中年危機(jī)的通途。
Paper路線:這條路線適應(yīng)者相對較少,不過卻非常有效。簡單來說,能夠跟學(xué)術(shù)界搭上點(diǎn)兒關(guān)系,在此序列里標(biāo)名掛號,比只會coding,長期職業(yè)生涯會順利得多。
Q3. 目前人機(jī)交互有哪些難點(diǎn)?
今天所有實(shí)用的人工智能產(chǎn)品,都是用的“弱智”方法。簡單來說,就是湊答案:準(zhǔn)備一大坨標(biāo)注好的數(shù)據(jù),然后用大量機(jī)器堆上去狂撩,直到把答案湊個八九不離十。至于問題的內(nèi)在邏輯和簡約規(guī)律,今天的AI既無心顧及,也無力解讀。
“弱智”方法在數(shù)據(jù)充沛的領(lǐng)域,可謂所向披靡:無論是語音識別、人臉識別,還是機(jī)器翻譯、各種棋類,機(jī)器都已經(jīng)接近乃至碾壓真人了。且慢!機(jī)器翻譯都快解決了么?翻譯可比聊天要難吧?不然,機(jī)器翻譯這個問題,答案是比較好湊的:找到足夠多的語言對數(shù)據(jù),把詞譯過去跟麻將牌一樣碼好了,再調(diào)整一下順序即可。人機(jī)對話則不然,我們要找到對方語言里的關(guān)鍵信息,把它轉(zhuǎn)化為動作,再把動作的結(jié)果反饋回去。這些關(guān)鍵信息處理的過程,是要經(jīng)過統(tǒng)計(jì)意義上的推理過程的。
說到推理,當(dāng)然離不開句子表達(dá)內(nèi)容以外的背景知識。比如你問機(jī)器:“直徑為10的球體積是多少?”機(jī)器就得會球的體積公式才算得出來。當(dāng)然,微積分、背古詩、查法典這樣的知識,對機(jī)器來說總是可以解決,因?yàn)橛写罅繒旧系恼Z料可供學(xué)習(xí),按照弱智大法湊答案即可。難就難在,這世界上還有大量的知識,根本沒地方學(xué)去。
Q4. 人機(jī)交互的未來是要做到人人交互嗎?
從開始探索人機(jī)交互,我們就想當(dāng)然地認(rèn)為,把人人交互的那一端由人變成機(jī)器,就是人機(jī)交互的理想模式了。于是,我們設(shè)計(jì)出來的機(jī)器人,也都是倆肩膀扛個腦袋,四肢五官齊備,用語言的方式跟對面的人類交流,再加上對常識一竅不通,怎么看怎么像個二傻子。
問題出在哪兒了呢?人類的信息交互,最高效的輸出方式是“說”,也就是音頻通道;最高效的輸入方式是“看”,也就是視頻通道。如果你對面是個真人,那沒辦法,雙方都只能靠說輸出信息,這就形成了語音為主的交互方式。而靠語音的人機(jī)對話,是這樣的畫風(fēng):
我想訂一張明天去上海的機(jī)票
為您查到:6:35海南航空HU7611,票價480元;6:50吉祥航空HO252,438元;6:50廈門航空MF8178,票價...
我去你大爺?shù)陌?#xff01;
別樂,就算對面不是機(jī)器是個真人客服,這種交互也同樣令人抓狂,有過電話訂票經(jīng)歷的朋友都有體會,只不過對著活人您不好意思罵街罷了。
既然對面是個機(jī)器人,就沒必要如此拘泥了。實(shí)際上,機(jī)器的交互方式,應(yīng)該跟我們“相反"而不是“相同”:你輸出信息靠說,機(jī)器人接受信息就得靠聽,這沒錯;你輸入信息靠看,那機(jī)器人輸出就別靠說了,何不在一塊屏上展示出來呢?這樣,不但信息輸出效率提高了很多,而且用戶只要在展示的信息底板上做選擇題,就算用語音輸入也大為便捷。
所以,真正適合人機(jī)交互的機(jī)器人,最好有個視頻輸出的設(shè)備,近了靠手機(jī)就可以,遠(yuǎn)了怎么辦還值得探討。這個概念,就是訊飛的胡郁老師講的“強(qiáng)視覺呈現(xiàn)的語音交互”吧。這種模式下的交互方式,已經(jīng)跟人人交互有了質(zhì)的區(qū)別,未知之處很多,需要我們深入探索。當(dāng)然,可以確定的是,機(jī)器人絕對應(yīng)該拋棄人形,以避免用戶用人的眼光和標(biāo)準(zhǔn)來評價它。
人機(jī)交互這件事,看起來簡單,卻是人工智能王冠上最耀眼的一顆明珠。目前看來,嚴(yán)格意義上的圖靈測試離我們還相當(dāng)遙遠(yuǎn),不過通過交互方式和產(chǎn)品上的創(chuàng)新,一個在特定領(lǐng)域內(nèi)可用的合格助手,或許已經(jīng)在向我們招手了。
另外,由于計(jì)算機(jī)對海量信息的檢索和處理能力遠(yuǎn)勝人類,或許可以讓機(jī)器助手輔助人人交互,這樣既能大大提高內(nèi)容溝通效率,又能發(fā)揮人的情感溝通優(yōu)勢,這沒準(zhǔn)是目前更加可行的產(chǎn)品路線。
Q5. 人工智能的發(fā)展前景如何?
我進(jìn)入這個行業(yè)已經(jīng)有十多年了:博士期間,我做的是語音是別的研究,畢業(yè)開始又到MSRA接著干這個。雖然我們的兩任院長——李開復(fù)老師和洪小文老師都是語音研究出身,卻絲毫不能改變當(dāng)年這一項(xiàng)目在全院最雞肋的地位。因?yàn)樵诋?dāng)年,各種各樣的人工智能應(yīng)用能真刀真槍上陣的并不多。更別提要是向互聯(lián)網(wǎng)界提起自己是做“人工智能”的,那簡直就像在兩會會場上上偷看了毛片那樣無地自容。實(shí)際上,那個時期,正是人工智能發(fā)展的第二落。
以史為鑒,可以知興衰。為了探討人工智能的發(fā)展前景,我們簡單回顧一下人工智能前面發(fā)展的三起兩落。
一、六十多年前的達(dá)特茅斯會議,提出了“Artifitial Intelligence”的課題,目的是讓逐漸成熟的計(jì)算機(jī)能夠代替人類解決一些感知、認(rèn)知乃至決策的問題。這樣一個課題是如此令人神往,也迅速吸引了大量學(xué)者的眼球,相關(guān)的研究也如火如荼地開展了起來。是為第一起。
二、初,學(xué)者們解決人工智能問題的思路,是以人為師,通過專家編制規(guī)則的方法,教機(jī)器下棋、認(rèn)字乃至語音識別。在今天看來,這樣的方法是完全南轅北轍的——人類的視聽器官雖然很發(fā)達(dá),卻并沒有能力總結(jié)提煉其中的規(guī)律。于是,人工智能的美好憧憬中迎來了殘酷的現(xiàn)實(shí),學(xué)者們發(fā)現(xiàn)解決問題是如此遙遠(yuǎn),圍觀群眾也一度認(rèn)為人工智能的學(xué)者都是騙子。是為第一落。
三、既然靠人指導(dǎo)不行,那就要祭出“實(shí)事求是”的法寶,從數(shù)據(jù)里統(tǒng)計(jì)規(guī)律。在這樣數(shù)據(jù)+統(tǒng)計(jì)的方法論下,諸如人臉識別、手寫識別等一些較為簡單的問題取得了重大進(jìn)展,而在當(dāng)時最困難的問題——大詞表連續(xù)語音識別上,統(tǒng)計(jì)方法也是史無前例地造就了實(shí)驗(yàn)室中“基本可用”的系統(tǒng)。到此時,我們感覺找到了解決人工智能問題的基本思路。是為第二起。
四、數(shù)據(jù)+統(tǒng)計(jì)模型的方法盛行以后,也很快遇到了瓶頸:數(shù)據(jù)量的提升并不總能帶來識別率的提高。當(dāng)然,我們很早就知道“深度模型”比“淺層模型”學(xué)習(xí)數(shù)據(jù)的能力強(qiáng),無奈這種模型的計(jì)算代價極高,只能望洋興嘆。拿語音識別為例,在“基本可用”到“實(shí)用”之間的鴻溝,十幾年都沒有跨過去,于是大家又轉(zhuǎn)向悲觀,覺得人工智能還只是個夢。是為第二落。
五、第二落以來,繼續(xù)堅(jiān)持在“深度神經(jīng)網(wǎng)絡(luò)”這條戰(zhàn)線上的學(xué)者很少,因?yàn)樽鲞@個是拿不到funding的。其中有一位老前輩Jeffrey Hinton,和他的學(xué)生Alex一起,發(fā)現(xiàn)用GPU算神經(jīng)網(wǎng)絡(luò),能大幅提高速度,于是這種模型居然可能實(shí)用了。一旦實(shí)用,深度模型可以瘋狂吸收數(shù)據(jù)的優(yōu)勢就發(fā)揮出來了,于是在語音識別、圖像識別等領(lǐng)域帶來了飛躍式的進(jìn)展。是為第三起。
當(dāng)然,工業(yè)界的看到的這第三起,比我們上面輕描淡寫提到的內(nèi)容要波瀾壯闊得多。不過,不要太在意,因?yàn)楦髀反罄胁徽撨^去是做黑產(chǎn)、賣假貨還搞劫持的,都搖身一變成了人工智能的忠實(shí)擁躉和業(yè)界先驅(qū)——雖然他們的數(shù)學(xué)也就是初中肄業(yè)水平。去年,當(dāng)我聽到某此類上市公司老板歇斯底里地在財(cái)報中喊出要投入數(shù)千萬美元搞人工智能時,不由心生感慨:修腳的可以掛妙手回春的錦旗,但千萬別說自己是做精準(zhǔn)醫(yī)療的!
雖然人工智能的第三起確實(shí)有了質(zhì)的發(fā)展,但考慮到這些沉渣泛起的為人工智能從業(yè)者,我覺得第三落還是會來到,只不過并非對行業(yè)本身的懷疑,而是自我凈化罷了。
而人工智能的行業(yè)發(fā)展趨勢,由于大規(guī)模數(shù)據(jù)+大規(guī)模算力的基本方法論已經(jīng)成熟,今后的發(fā)展路徑是十分清楚的:在那些數(shù)據(jù)儲備充分、商業(yè)價值清晰的場景,人工智能會迅猛發(fā)展,投身于這樣的行業(yè)中期發(fā)展會非常好;而醫(yī)療、教育這類領(lǐng)域,由于電子化數(shù)據(jù)的整理與積累尚需時日,可以需要一個較為漫長的發(fā)展過程。
PMCAFF問答專場是一場與PMCAFF用戶互動的問答活動,我們每期都會邀請知名互聯(lián)網(wǎng)公司的一線產(chǎn)品從業(yè)者和咖友們共同交流,目前已成功舉辦過60+期,先后有來自騰訊、百度、阿里、360、小米、京東、去哪兒等大廠嘉賓入駐。
這個世界問題太多,我們需要一個能夠解決問題的人。
如果你有足夠的能力解決來自PMCAFF用戶在你的專業(yè)領(lǐng)域中,以不同的角度提出各類刁鉆問題,那么歡迎你參加PMCAFF問答專場。
活動申請可以添加工作人員微信溝通咨詢,加好友請備注:問答專場。
總結(jié)
以上是生活随笔為你收集整理的科大讯飞副总裁刘鹏:人机交互的未来是人人交互?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 一文弄懂用户画像以及如何召回用户
- 下一篇: 创业第一站丨产品经理、海归转型成创业者有