日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

搜狗大数据总监、Polarr 联合创始人关于深度学习的分享交流

發(fā)布時(shí)間:2023/12/14 pytorch 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 搜狗大数据总监、Polarr 联合创始人关于深度学习的分享交流 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

架構(gòu)師小組交流會是由國內(nèi)知名公司技術(shù)專家參與的技術(shù)交流會,每期選擇一個(gè)時(shí)下最熱門的技術(shù)話題進(jìn)行實(shí)踐經(jīng)驗(yàn)分享。
第一期:來自滬江、滴滴、蘑菇街、扇貝架構(gòu)師的 Docker 實(shí)踐分享

第二期:來自滴滴、微博、唯品會、魅族、點(diǎn)評關(guān)于高可用架構(gòu)的實(shí)踐分享

第三期:京東、宅急送的微服務(wù)實(shí)踐分享(上)(下)

第四期小組交流會邀請到了 Polarr 聯(lián)合創(chuàng)始人宮恩浩、搜狗大數(shù)據(jù)總監(jiān)高君、七牛云 AI 實(shí)驗(yàn)室負(fù)責(zé)人彭垚,對深度學(xué)習(xí)框架選型、未來趨勢展開了交流。


自由交流

Polarr 宮恩浩

我是宮恩浩,現(xiàn)在在斯坦福在讀,主要做深度學(xué)習(xí)研究,特別是醫(yī)學(xué)影像相關(guān)的研究。同時(shí)也在一家創(chuàng)業(yè)公司,國內(nèi)叫潑辣修圖,在美國是 Polarr,做圖片的大數(shù)據(jù),有云端的,也有手機(jī)端的,PC 端的。我們的 App 收集數(shù)據(jù),建立優(yōu)化的算法,我們在云端提供圖片整理、圖片選擇、圖片信息的識別,把識別的模型通過壓縮手段,把整個(gè)深度學(xué)習(xí)放在手機(jī)的 App,實(shí)現(xiàn)圖片裁定、識別、選擇、渲染,國內(nèi)可能叫霹靂相冊吧。我主要負(fù)責(zé)所有的 AI 的部分。

搜狗高君

我是高君, 目前在搜狗負(fù)責(zé)精準(zhǔn)廣告的算法研究和大數(shù)據(jù)相關(guān)的技術(shù)研發(fā)工作。搜狗從用戶端的產(chǎn)品來講,有兩個(gè)產(chǎn)品與深度學(xué)習(xí)有較強(qiáng)關(guān)系,一個(gè)是語音識別,應(yīng)用在輸入法,用于語音輸入轉(zhuǎn)文本,另一個(gè)是圖像搜索。在我的團(tuán)隊(duì)中,深度學(xué)習(xí)主要是用在廣告領(lǐng)域中,如 CTR 預(yù)估、廣告檢索,廣告相關(guān)性的評估上。未來,我們希望在 NLU 上面做一些有價(jià)值的工作,也希望在網(wǎng)絡(luò)壓縮方向取得一些成績。

彭垚

我是七牛云 AI 實(shí)驗(yàn)室的負(fù)責(zé)人彭垚,七牛是一個(gè)以云存儲起家的公司,在我們云平臺上面有廣泛的圖像、視頻、音頻的數(shù)據(jù),富媒體客戶非常多,所以我們 AI 實(shí)驗(yàn)室的主要職責(zé)是對大量的富媒體數(shù)據(jù)去做分析,并做一些內(nèi)容審核,識別等相關(guān)領(lǐng)域的應(yīng)用,以服務(wù)我們平臺上面的客戶。
話題交流


Q:關(guān)于網(wǎng)絡(luò)壓縮方面的分享一下?

Polarr 宮恩浩:網(wǎng)絡(luò)壓縮有幾部分。

一部分首先找一個(gè)最適合的架構(gòu),這部分我個(gè)人覺得還得根據(jù)具體的應(yīng)用、性能要求來定。

第二個(gè)部分是網(wǎng)絡(luò)壓縮,在不改變模型效果前提下盡量減少模型參數(shù)。我一個(gè)同學(xué)在做這方面工作叫 Deep Compression,然后我也和這個(gè)同學(xué)一起參與一些新的深度學(xué)習(xí)算法研究,基于在 Deep Compression 來進(jìn)一步優(yōu)化模型。最近一些研究發(fā)現(xiàn)一個(gè)深度模型可以壓縮甚至壓縮到幾十倍幾百倍,那說明整個(gè)有很大的冗余性,基于這個(gè)我們能不能選擇一些適當(dāng)?shù)哪P?trade off,在保持模型體積基礎(chǔ)上性能比原來顯著提升,比如它本身網(wǎng)絡(luò)是 Dense Network,壓縮到 Sparse Network,然后再長成 Dense Network 可以一步步進(jìn)行優(yōu)化??梢韵胂襁@個(gè) Network 一會胖,一會瘦,最終達(dá)到一個(gè)體積和性能更好的狀態(tài),我個(gè)人主要在做的是這個(gè)方法的統(tǒng)計(jì)分析。

第三個(gè)部分是模型編碼。我們公司有在做想把圖像識別的 Network 放在手機(jī)上,那么首先基于模型壓縮。具體實(shí)現(xiàn)的方法是:每步迭代的時(shí)候,一部分把小的部分變成零,然后不斷迭代優(yōu)化,最終模型還有一些優(yōu)化,會小很多。然后同時(shí)還可以在手機(jī)上 Network 優(yōu)化編碼,我實(shí)驗(yàn)的時(shí)候權(quán)重也可以從原來的 32 位 float,變成 16 位,就是少了一半,或者是變成 8 位的話做了 encoding 就會小很多,基于這些(優(yōu)化模型結(jié)構(gòu),閾值讓模型稀疏,編碼來減少存儲)就可以不斷進(jìn)行壓縮。但是主要還是看需求,比如在云端的話可能就不一定非要壓特別深,但我們遷往移動端就需要壓得比較大,要不可能 App 就太大,同時(shí)你壓縮完了,還得做解壓的工作,需要花費(fèi)一定的時(shí)間。

搜狗高君:今年看到有 paper 在說 teach student 這種網(wǎng)絡(luò),然后我有這么一個(gè)假設(shè),因?yàn)閺V告領(lǐng)域涉及到的特征空間非常大,用 teach student 的這種思路,能否把一個(gè)千萬量級以上的網(wǎng)絡(luò),想辦法讓它降到百萬量級,同時(shí)讓它的 performance 還是能維持在不錯的性能。

Polarr 宮恩浩:我說一下,首先我覺得并不是模型越小它就越快,這可能跟架構(gòu)有關(guān)。我覺得可以拿一些簡單的例子試一下??梢韵瓤匆幌聞e人已經(jīng)被驗(yàn)證過更小更快的模型??匆幌禄谀莻€(gè)做會不會合理,是否能達(dá)到你的需求。然后不行的話,犧牲一些精度,還得看你的具體精度各方面性能大概多少可以用。

Q:宮博士你們現(xiàn)在是做模型壓縮,主要是應(yīng)用在手機(jī)上吧。那壓縮了以后,在一定的精準(zhǔn)度情況下,你的運(yùn)算能耗能下降嗎?

Polarr 宮恩浩:運(yùn)算能耗的話,如果你直接用它的 Framework 的話,其實(shí)是一樣的。但是你可以再 hack 一些東西他就能提高。比如可以用低精度的乘法。
我覺得 iOS 的 Metal 很好。比如 AlexNet 大概能手機(jī)上,能 30 到 42 fps,然后 inception 模型,大概是 10 fps。同時(shí)他們出一些剛剛優(yōu)化,所以我覺得未來移動端的深度學(xué)習(xí),會有很多的公司用移動端解決問題,很有前景。

Q:你們是用的是哪個(gè) framework?

Polarr 宮恩浩:其實(shí)用挺多的,iOS 上肯定用它的 Metal Framework。然后其他的就是后端,很多都會去用,Caffe,Tensorflow 都有過一些接觸。

Q:搜狗的廣告推薦是以推薦結(jié)構(gòu)化數(shù)據(jù)為主,還是以推薦非結(jié)構(gòu)化數(shù)據(jù)為主?

搜狗高君:兩種都有,有搜索類的廣告問題,還有展示類的廣告問題,對于搜索廣告來講,它是有一個(gè)明確的查詢詞,你可以理解為是一個(gè)結(jié)構(gòu)化。假設(shè)把文本理解為結(jié)構(gòu)化,那么對于展示類的廣告就很復(fù)雜了,為了提高線上的 CTR,你需要明確用戶的興趣,那么處理用戶興趣的過程中,它的數(shù)據(jù)差異非常大,你肯定會用到搜索,但是你也會用到它站內(nèi)的一些瀏覽的行為,比方說我們拿到客戶站內(nèi)所有的數(shù)據(jù),它整個(gè)數(shù)據(jù)的來源很復(fù)雜。所以對于展示類廣告來講,可以認(rèn)為所有的處理的數(shù)據(jù)基本都是異構(gòu)的,可以理解為是個(gè)非結(jié)構(gòu)化的問題。

Q:廣告領(lǐng)域,深度學(xué)習(xí)的應(yīng)用是什么樣的呢?

搜狗高君:其實(shí)這個(gè)領(lǐng)域里邊的工作跟圖像差異蠻大的,很大的原因在于學(xué)術(shù)界是不關(guān)注廣告的。其中還一個(gè)很重要的原因是廣告數(shù)據(jù)也沒有那么多,那么很難看到有一些 paper,會專門關(guān)注于廣告領(lǐng)域里邊的深度學(xué)習(xí)的應(yīng)用,所以業(yè)內(nèi)的做法都在摸著石頭過河。我這邊的情況來講,深度學(xué)習(xí),至少在排序問題,會比我們現(xiàn)有的策略基礎(chǔ)至少高 10 個(gè)點(diǎn)。深度學(xué)習(xí),在廣告領(lǐng)域,百度用的相對早一點(diǎn)?,F(xiàn)在阿里發(fā)展很快,在商品推薦領(lǐng)域有不少應(yīng)用。所以從應(yīng)用的角度來講,我感覺是有收益,但是投入跟收益目前不成正比。

在廣告領(lǐng)域里邊,我們看到的就是 GPU 機(jī)器在加速比沒有呈現(xiàn)過優(yōu)勢,可能是由于我們在廣告領(lǐng)域,不像圖像領(lǐng)域會有大量的 CNN。在廣告領(lǐng)域,我小范圍的比過一些加速比的問題,GPU 的機(jī)器沒有優(yōu)勢,所以我一直心里邊有一個(gè)問題,到底為什么在圖像和語音,大家都會考慮用 GPU 的機(jī)器,難道是由于卷積網(wǎng)絡(luò)的原因嗎?就完全不考慮 CPU 的任何的問題。

主持人:最核心的是里面的這些函數(shù),這些解方程,大量的矩陣計(jì)算,所以說矩陣計(jì)算 CPU 肯定是沒有優(yōu)勢的,GPU 因?yàn)榭梢酝瑫r(shí)多個(gè)核算一個(gè)數(shù)據(jù),所以它的優(yōu)勢很明顯。所以在圖像語音,包括 NLP 處理,GPU 優(yōu)勢是很明顯的,基本上 CPU 的計(jì)算貢獻(xiàn)非常小,然后像廣告很多不是矩陣計(jì)算,所以導(dǎo)致加速比不高是很正常的事情,可能還沒有 CPU 運(yùn)算的快。

七牛彭垚:其實(shí)我這邊也有用過 CPU 跑過一些測試的。之前在有客戶也用過我們的鑒黃系統(tǒng),一開始他們說采購不了 GPU 機(jī)器,我就用 CPU 給他們測了一輪,他那個(gè)效率就很低,大概單個(gè) GPU 和 CPU 比的話,就 20 倍了。

搜狗高君:我還有一個(gè)小問題,不知道大家在多機(jī)并行做深度學(xué)習(xí)會處理到多大的集群問題。至少我們在做一些多機(jī)并行的時(shí)候,是從 Tensor 遷到了 MXNet 上,然后我們發(fā)現(xiàn) Tensor 的效率似乎有點(diǎn)問題,我不知道業(yè)內(nèi)在多機(jī)多卡這件事上,有沒有更好的,能有效地提升加速的問題。宮博士,在美國那邊,在并行問題上,你了解到有沒有一些新的進(jìn)展?

Polarr 宮恩浩:我之前有看到一個(gè)基于 Spark 的在 CPU 集群上的深度學(xué)習(xí) caffe franework 變種,但后來沒太關(guān)注,我覺得有可能是可行的,Spark 在數(shù)據(jù)處理上用的比較多一點(diǎn)。但是我個(gè)人暫時(shí)沒有涉及到多機(jī)多卡。但我覺得既然 Amazon 那么推 mxnet,他們肯定會推出來更好的多機(jī)多卡的東西。

七牛彭垚:之前有去調(diào)研過多機(jī)多卡,包括 Tensorflow、Caffe。Tensorflow 它本身并沒有提供好的 paramter server 設(shè)計(jì)??蚣芴峁┠愀鶕?jù)應(yīng)用情況更好的去設(shè)計(jì)參數(shù)服務(wù)器。倒是覺得 Caffe poseidon 提供了一好 Paramter server 的設(shè)計(jì),包括它矩陣同步的時(shí)候,怎么去傳輸,把矩陣就是做變換變小,能夠更高效的去做同步。

Q:有沒有覺得用 Tensorflow 訓(xùn)練的時(shí)候,比 MXNet 和 Caffe 慢很多,有沒有碰到過這樣的問題?

搜狗高君:遇到過,而且在多機(jī)上面差距非常大,所以我們還把傳統(tǒng)里邊一部分,涉及到多級并行策略的做了一小部分修改,改的地方不多,但是在 CPU 的基礎(chǔ)上,我們當(dāng)時(shí)看了一下,效果還不錯。

七牛彭垚:有沒有人用過 Torch,因?yàn)槲衣犚恍┡笥颜f Torch 在跑同樣的數(shù)據(jù)集和網(wǎng)絡(luò)情況下,和 Caffe 比,收斂率和準(zhǔn)確率都要好一點(diǎn),可能是他在底層算法上有一些 tricky 的地方。

Polarr 宮恩浩:我之前做 DSD 研究,就用了 Torch,是基于 resnet 的 Torch。對 Torch 的感覺,首先是太麻煩了,因?yàn)橛玫娜颂倭?#xff0c;有什么問題也不太好問。但是他有一些好處,比如說我想改一些 regularization 和迭代過程中修改 weights,在 Torch上改,它就相對方便很多,因?yàn)樗芏嗟讓拥牟僮鞲?expose 一些,比在 Caffe 改更方便一些。比如我們想每一步做一個(gè)調(diào)整,和獲得最新的調(diào)整,我們就可以通過 Torch。相對來說和 Python 類似,是比較好實(shí)現(xiàn)的,這是一個(gè)感受。

Q:大家怎么看深度學(xué)習(xí)在應(yīng)用領(lǐng)域的發(fā)展?

七牛彭垚:內(nèi)容的審核,就比方說鑒黃,就是鑒別黃色視頻這種,大量簡化了鑒黃師的工作。有一些內(nèi)容標(biāo)簽,特別是對社交網(wǎng)站,我們會給社交網(wǎng)站,直播,短視頻,打一些標(biāo)簽,幫助客戶理解圖像視頻的內(nèi)容。

搜狗高君:我問個(gè)小問題,您剛才有提到有為社交網(wǎng)站去做一些工作,是做一些視頻理解的方向的一些東西嗎?

七牛彭垚:舉個(gè)例子,根據(jù)客戶的需求,我們做了一個(gè)人臉檢測,審核上傳的照片到底有沒有頭像。如果他上傳的照片里一個(gè)頭像都沒有,那這個(gè)用戶其實(shí)是一個(gè) bad user。在比如,我們把某個(gè)社交網(wǎng)站的圖片收集起來,實(shí)際上這些圖片是雜亂無章的,那么我們做一個(gè)應(yīng)用,幫所有的圖片打上標(biāo)簽,還包括做了人臉的聚類、場景的識別,社交客戶就可以根據(jù)我們的標(biāo)簽應(yīng)用做相冊歸類,這樣就可以做一些數(shù)據(jù)分析,分析網(wǎng)站上每個(gè)用戶的自拍的數(shù)量等。就是從圖像方面做一些人群分析。

搜狗高君:我今年聽過的一個(gè)比較有意思的深度學(xué)習(xí)應(yīng)用,就是應(yīng)用在視頻推薦,傳統(tǒng)的視頻推薦使用文本去處理的??焓掷锸呛苌傥淖中畔⒌?#xff0c;完全是用戶上傳視頻,所以他們今年用了深度學(xué)習(xí),去理解視頻的內(nèi)容,然后再做推薦,也做的蠻有意思的。

七牛彭垚:我覺得這塊就相當(dāng)于是幫客戶的一些非結(jié)構(gòu)化的一些數(shù)據(jù),打上標(biāo)簽。然后打上標(biāo)簽以后,其實(shí)能做的事情就非常多,就可以做分類、搜索、推薦,能做的事情就很多,我甚至可以對每一個(gè)切片,比方說每 10 秒鐘的一個(gè)視頻的切片打標(biāo),然后你就能做很多事情了。比方說新聞片的剪輯,就是對新聞片的每個(gè)地方,它會去打一些標(biāo)簽。比方說我這一段新聞,我有我的主持人出現(xiàn),然后他會去檢測下面的主題的那個(gè)文字,把文字在 OCR 出來,他就會把那些新聞一段一段的打上標(biāo)簽,這樣能夠方便做剪輯、后期處理等。

搜狗高君:七牛的 AI 是主要是做 to B 服務(wù),就是幫助一些企業(yè)去解決他們內(nèi)部的需求,用機(jī)器學(xué)習(xí)處理問題嗎?

七牛彭垚:我們最開始是做鑒黃的內(nèi)容審核系統(tǒng),后面才去做各種標(biāo)簽系統(tǒng),和定制化識別應(yīng)用等。

搜狗高君:七牛 AI 的這種模式下邊,你們會把這種商業(yè)模式,當(dāng)做一個(gè)長期的商業(yè)模式去運(yùn)作嗎,因?yàn)槲以诒本┙佑|過一些公司,甚至是大公司,比如說招行這個(gè)量級的公司,我目前還沒有看到很強(qiáng)的付費(fèi)能力,他們內(nèi)部很難提出這種需要用機(jī)器學(xué)習(xí)的方法去解決問題,他們也很難形成一個(gè)估值,就是估價(jià)。我一直對這件事挺好奇,這種模式真的是可以做出一個(gè)真正的盈利的模式嗎?

七牛彭垚:要看客戶的群體的,像鑒黃是幫客戶節(jié)省了很多成本,原來他們需要很多基礎(chǔ)的人力,人力成本非常高的,所以它其實(shí)是很樂意做這個(gè)事情,而且鑒黃師這個(gè)事情特別難做,他都要熟練工,然后那種人他又干個(gè)半年一年他就不干了,其實(shí)用工成本就很高。還有其他應(yīng)用,我們都致力于大量節(jié)省人力成本的應(yīng)用。

Q:七牛是否有一些 AI 方面的戰(zhàn)略?

七牛彭垚:我們后期主要會在視頻方向做一些文章,包括像視頻分析之類的,包括一些視頻通用檢測的一些事情,我們會致力于解決我們平臺上客戶的實(shí)際問題來投入這方面的研究,主要是視頻分析領(lǐng)域,因?yàn)槲覀兇鎯ι厦嬉曨l非常多,視頻的細(xì)粒度檢測也是其中的一個(gè)重點(diǎn)方向。

Q:大家對深度學(xué)習(xí)有何展望?

搜狗高君:我問一個(gè)小的開放性的問題,由于深度學(xué)習(xí)出來以后,亞馬遜做了 echo 的那件事情。會不會在五年以后,真的會出現(xiàn)一個(gè)像鋼鐵俠里的家庭秘書一樣,就像原來蘋果手機(jī)把手機(jī)全搞了一遍,會不會五年以后也出現(xiàn)這樣一件事情?大家是怎么看這件事兒。

亞馬遜的 echo 現(xiàn)在提供了非常充分的 API,將家庭的一些設(shè)備等等,或者說你一些App 上的功能做對接。那么我自己就是在想,如果未來真是有這樣一種趨勢的話,那很有可能就會變成家庭必備的設(shè)備了。那如果這種場景下,它可以衍生出很多服務(wù),比如說它可以對接攝像頭,它本身也有語音,它可以變成無所不能的事。就是我們現(xiàn)在可能做的所有的這個(gè)事,都能被它給干掉。因?yàn)樗芡耆淖兩?#xff0c;所以我一直在想這件事會不會發(fā)生。

主持人:我覺得這個(gè)事情,如果只是一個(gè)智能家居,我覺得應(yīng)該可以。如果你是特別極客,在家里放一些燈,或者機(jī)器人在家里,我覺得沒有問題。但是很多人可能對隱私保護(hù)比較在意,他不一定會樂意放機(jī)器人在家里面。這個(gè)問題,我覺得小范圍推應(yīng)該沒有問題,大范圍我覺得還是會有問題。

Polarr 宮恩浩:我覺得 echo 最近比較火,但是我覺得以后每個(gè)人手機(jī)都可以有這種服務(wù)吧,其實(shí)就是更直接一些,而現(xiàn)在好像有很多 startup 搞個(gè)人助理,他們主打的想法是變成 AI 的助理,比如說幫我叫個(gè)車,就不用麻煩再自己打車了,手機(jī)助理可以和互聯(lián)網(wǎng)服務(wù)通過 AI 連接。我覺得這都是不久將來可以實(shí)現(xiàn)。

搜狗高君:在美國那邊做這個(gè)方向創(chuàng)業(yè)的公司多嗎?

Polarr 宮恩浩:最近就看見過一些,包括國內(nèi),我之前有同學(xué)回國做個(gè)人助理,最終肯定是想做,就是語音識別的,就是人工智能,現(xiàn)在可能就一開始都是人手人工實(shí)現(xiàn)服務(wù),我覺得還是一個(gè)剛開始的方向吧,都想往 AI 上做。

搜狗高君:記得國內(nèi)也有類似的團(tuán)隊(duì),跟亞馬遜 echo 很像。甚至有做車載的后視鏡的,好像也在往這個(gè)方向打。

我是平常用微軟的小冰,有時(shí)候會用它來調(diào)一些程序,做一點(diǎn)小東西。

主持人:個(gè)人習(xí)慣吧,從普通大眾來說,有多少人會用這些東西,我覺得可能用的也不多。

Polarr 宮恩浩:我覺得主要是有幾點(diǎn)問題,這就是識別準(zhǔn)確率,另外是說他就和其他的,比如在微信里給發(fā)啥,他無法實(shí)現(xiàn)這個(gè)功能,比如說著目前是很計(jì)費(fèi)一個(gè)東西。

主持人:我覺得聊天機(jī)器人大家可以探討一下,現(xiàn)在覺得還沒有一個(gè)特別好的應(yīng)用,算法上可能還沒有特別成熟。

搜狗高君:之前有朋友跟我說過聊天機(jī)器人,他跟我提到語料是一個(gè)非常麻煩的事兒,我不知道你們那邊怎么處理的。

主持人:最核心的就是知識圖譜的構(gòu)建。在聊天機(jī)器人上,技術(shù)上不是問題,其實(shí)就是生產(chǎn)資料的問題,就是你怎樣去構(gòu)建專業(yè)領(lǐng)域的聊天知識圖譜,這是目前聊天機(jī)器人做的好不好的差異化。怎么樣去跟行業(yè)深度應(yīng)用,這是一個(gè)未來的趨勢。技術(shù)是沒有門檻的,隨便幾個(gè)人,可以創(chuàng)建一家機(jī)器人聊天公司。

搜狗高君:如果做一個(gè)垂直領(lǐng)域的自動問答,有一個(gè)領(lǐng)域級的知識庫,可能對這些問題的解決幫助會很大。那比如說做小冰這種很寬泛的,我一直很好奇有個(gè)問題,比如說像電影和電視劇里邊有大量的對白,那么在這個(gè)場景里邊真的用這種對白有沒有價(jià)值能幫助這個(gè)聊天機(jī)器人的算法會變得更好?如果只是從這種 QA 的角度來講,要搜集這種配對關(guān)系,這個(gè)耗費(fèi)的人力非常大的。但有的時(shí)候聊天機(jī)器人可能只是想讓大家感覺到它像一個(gè)人。所以這樣為什么不能從電視劇和電影里邊去拿到大量的對白。

七牛彭垚:我覺得其實(shí)客服機(jī)器人是相對好做的,反而把它做得像人,我覺得是比較難。我之前就接觸到一個(gè)例子,是讓機(jī)器人去學(xué)習(xí)大家平時(shí)的聊天內(nèi)容。比方說“我生病了,我今天不舒服”,然后去做人工去打標(biāo),比方說 5 個(gè)回答,它這里面就有一個(gè)回答就是“怎么了”。結(jié)果它搞了好幾組人打標(biāo),選“怎么了”的人最多,其實(shí)“怎么了”這種說法你在任何場景都是通用的,這個(gè)機(jī)器人它什么都給你回怎么了。實(shí)際上,它還是沒有到融匯上下文,能夠理解所有東西的地步。

Q:大家可以探索一些新的領(lǐng)域。

Polarr 宮恩浩:除了公司這邊,我個(gè)人科研主要做醫(yī)學(xué)影像,算比較新的一些應(yīng)用,比如說用深度學(xué)習(xí)來幫助醫(yī)生做一些診斷,或者看到一些人看不到的診斷,就是其提供圖片的質(zhì)量,其實(shí)就是跟凸顯相關(guān),同時(shí)我覺得 NLP 也可以用在這種就是醫(yī)學(xué)診斷方面,最近好像有些人來用就用各種這種非結(jié)構(gòu)化的數(shù)據(jù)來預(yù)測,這就是說我個(gè)人比較感興趣,可能在做一些比較小的嘗試。

搜狗高君:我讀博期間的實(shí)驗(yàn)室是一個(gè) cv 的實(shí)驗(yàn)室,我很多的師兄師弟在做一些圖像相關(guān)的創(chuàng)業(yè)。剛才宮博士提到的醫(yī)學(xué)影像是我目前在關(guān)注的一件事情,確實(shí)很感興趣,因?yàn)閲鴥?nèi)目前也有幾個(gè)小的創(chuàng)業(yè)公司,比如說 deep care,然后他們也貌似在做類似的工作,好像好多人在學(xué)的 IBM 那個(gè) Watson,好像是那個(gè)方法,國內(nèi)有這樣一批的公司正在做,還有另外一批公司確實(shí)有在用 NLP 的方法在做病癥判斷和分診的問題,醫(yī)學(xué)上這兩個(gè)方向。我感覺現(xiàn)在創(chuàng)業(yè)公司比較多,但是目前在制藥這件事上我沒有聽到,所以我平常在廣告這件事完了以后,關(guān)注的最多的就是醫(yī)學(xué)影像,我會找這行的師兄師弟們聊聊天,聽聽他們的一些想法,因?yàn)槲矣X得這件事似乎商業(yè)價(jià)值蠻大的。

七牛彭垚:這種項(xiàng)目一般都非常大,對于這種,其實(shí)是解決一些非常通用性的問題,你只要解決一個(gè)科室的一些,比方說醫(yī)學(xué)影像,那其實(shí)就解決了這個(gè)非常通用的問題。

搜狗高君:不過我目前不看好國內(nèi)做這件事情,因?yàn)槲业囊粋€(gè)基本判斷是,你想讓醫(yī)院把正兒八經(jīng)有用的數(shù)據(jù)拎出來就不太靠譜,因?yàn)樗麄兏艺f過這么一件事兒,他們拿到過幾萬份的病例,然后就是相關(guān)的數(shù)據(jù),刪完了以后,大概能用的數(shù)據(jù)是千條,我當(dāng)時(shí)的感受,就是這個(gè)行業(yè)別說用深度學(xué)習(xí)了,你拿個(gè)邏輯回歸都搞不起來,數(shù)據(jù)量太小。國內(nèi)其實(shí)很難有這么大的時(shí)間,能讓你搞這個(gè),所以可能在美國很少做,但我覺得國內(nèi)應(yīng)該長期會有一個(gè)機(jī)會。

Polarr 宮恩浩:國內(nèi)其實(shí)這種病例還是多,主要是醫(yī)院和學(xué)校也可以合作,比如清華就有很多這方面資源,將來如果再想做這事的話,就是從每一個(gè)病人開始做起,就現(xiàn)在國內(nèi)基本上一周多的病人,就跟美國一個(gè)月一年的病人的數(shù)目差不多那種感覺。

七牛彭垚:對,像清華浙大交大這種醫(yī)學(xué)院研究院,有很多附屬醫(yī)院,數(shù)據(jù)還是非常多。剛才宮博士也說,是給到某些大學(xué),而大學(xué)里面這些影像中心可以流出去,所以這一塊其實(shí)有很多機(jī)會的。問題倒是以哪些病為突破口,這個(gè)倒是可以再探索。

Polarr 宮恩浩:最近基于 CNN 的 segmentation 發(fā)展有一定進(jìn)展,就可以做一些很多醫(yī)療方面的應(yīng)用。

搜狗高君:但是有一點(diǎn)像醫(yī)學(xué)影像,即使就目前來看,就算能拿到很好的數(shù)據(jù),它也不太可能變成一個(gè)主要的手段吧?我是這么想,畢竟它是有錯誤率的,如果讓一個(gè)機(jī)器去做主要建議的話,一旦出了事故會比較麻煩,我是這樣感覺的。所以我覺得這種工具在未來,也僅僅是給醫(yī)生做一個(gè)參考的作用。我不知道大家會對這件事有更大的期待嗎?

Polarr 宮恩浩:這些醫(yī)學(xué)倫理和管理方面問題,主要是你不管做的再好,目前你不可能一個(gè)機(jī)器來給你做這做那,都是最后簽字是有人來負(fù)責(zé),但是對于醫(yī)生來說,比如他需要看很多層的圖片,很多個(gè)不同的層的片,那如果能告訴他,你就看這一層,就是主要的一層,這種減少他的工作量,從實(shí)質(zhì)上來說,非常非常好。前幾天我跟一個(gè)醫(yī)學(xué)院的老師聊這事,他覺得就需要這方面的東西。

總結(jié)

以上是生活随笔為你收集整理的搜狗大数据总监、Polarr 联合创始人关于深度学习的分享交流的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。