深度学习:让电脑像人一样看世界
深度學(xué)習(xí):讓電腦像人一樣看世界
發(fā)表于2015-08-28 09:33| 5269次閱讀| 來(lái)源NDTV Gadgets| 4 條評(píng)論| 作者Gopal Sathe
云計(jì)算人工智能深度學(xué)習(xí) width="22" height="16" src="http://hits.sinajs.cn/A1/weiboshare.html?url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F2015-08-28%2F2825564&type=3&count=&appkey=&title=%E5%AF%B9%E4%BA%8EBlippar%EF%BC%8C%E5%85%B6%E5%88%9B%E5%A7%8B%E4%BA%BAOmar%20Tayeb%20%E8%A1%A8%E7%A4%BA%E5%85%B6%E7%9B%AE%E6%A0%87%E6%98%AF%E5%B0%86%E4%BB%BB%E4%B8%80%E7%85%A7%E7%9B%B8%E6%9C%BA%E5%9D%87%E8%BD%AC%E5%8F%98%E4%B8%BA%E6%99%BA%E8%83%BD%E8%AE%BE%E5%A4%87%EF%BC%8C%E4%B8%8D%E8%AE%BA%E5%85%B6%E8%BF%9E%E6%8E%A5%E4%BA%86%E9%AB%98%E7%AB%AF%E6%99%BA%E8%83%BD%E6%89%8B%E6%9C%BA%E4%B8%8E%E5%90%A6%E3%80%82%E6%88%91%E4%BB%AC%E5%8F%AA%E9%9C%80%E8%A6%81%E4%B8%80%E4%B8%AA%E4%B8%8D%E4%BD%8E%E4%BA%8E2%E6%88%963%E5%85%86%E5%83%8F%E7%B4%A0%E7%9A%84%E7%9B%B8%E6%9C%BA%E5%8D%B3%E5%8F%AF%E4%BB%A5%E5%AE%8C%E6%88%90%E6%89%80%E6%9C%89%E7%9A%84%E5%B7%A5%E4%BD%9C%E3%80%82%E6%89%80%E6%9C%89%E7%9A%84%E2%80%9C%E6%80%9D%E7%BB%B4%E2%80%9D%E9%83%BD%E5%9C%A8%E6%88%91%E4%BB%AC%E8%BF%99%E8%BE%B9%E3%80%82&pic=&ralateUid=&language=zh_cn&rnd=1442496130240" frameborder="0" scrolling="no" allowtransparency="true">摘要:對(duì)于Blippar,其創(chuàng)始人Omar Tayeb 表示其目標(biāo)是將任一照相機(jī)均轉(zhuǎn)變?yōu)橹悄茉O(shè)備,不論其連接了高端智能手機(jī)與否。我們只需要一個(gè)不低于2或3兆像素的相機(jī)即可以完成所有的工作。所有的“思維”都在我們這邊。
谷歌的?DeepDream——一個(gè)可以幫助人們了解神經(jīng)網(wǎng)絡(luò)的可視化工具——這不僅是當(dāng)前十分火熱的項(xiàng)目,這在一定程度上凸顯了圖像識(shí)別領(lǐng)域所面臨的挑戰(zhàn)。圖像處理顯然不是簡(jiǎn)單地將一幅圖片與數(shù)據(jù)庫(kù)相對(duì)比得出結(jié)果那么簡(jiǎn)單。實(shí)際上,圖像處理是一個(gè)很復(fù)雜的問(wèn)題。世界上有很多大公司正在圖像處理上面大展拳腳。
NDTV Gadgets(一家媒體)對(duì)Omar Tayeb十分關(guān)注,當(dāng)時(shí)這位Blippar (擴(kuò)增實(shí)境公司)的創(chuàng)始人兼CTO連同合伙人兼CEO Ambarish Mitra正從位于英國(guó)的公司辦事處出發(fā)一道訪問(wèn)Delhi,同時(shí)NDTV Gadgets也了解了blippar是如何理解圖像識(shí)別的概念,對(duì)其運(yùn)作原理有了基本的認(rèn)識(shí)。
Blippar連同其他創(chuàng)業(yè)公司,比如Wowsome 和Times Internet's Alive公司,對(duì)AR的使用主要集中在市場(chǎng)營(yíng)銷(xiāo)方面。Alive推出了智能婚禮卡片,與此同時(shí)其他公司,在雜志和報(bào)紙廣告,也試圖使用AR,電子商務(wù)網(wǎng)站同樣利用其作為虛擬購(gòu)物體驗(yàn)。
然而,事情才剛開(kāi)始,Mitra告訴NDTV Gadgets:“現(xiàn)在,當(dāng)你啟動(dòng)Blippar應(yīng)用程序時(shí),它不會(huì)告訴你前方有個(gè)椅子,或者是你的桌上有個(gè)蘋(píng)果,但它能識(shí)別出一瓶可樂(lè)【可口可樂(lè)】,也可以識(shí)別一個(gè)運(yùn)動(dòng)品牌或者其他類(lèi)似的物體。”
在未來(lái)的5-6個(gè)月里,Blippar將會(huì)推出一個(gè)“視覺(jué)網(wǎng)絡(luò)”,在該網(wǎng)絡(luò)中,Blippar應(yīng)用程序?qū)⒛軌蜃R(shí)別目錄中不必要的對(duì)象,并顯示用戶這些對(duì)象的相關(guān)信息。
“如果你看一輛車(chē),即使在此之前你從來(lái)沒(méi)見(jiàn)過(guò)那種型號(hào),你也能夠說(shuō)出它是哪一種車(chē)型,”Blippar的CTO Omar Tayeb說(shuō)到,“ Blippar現(xiàn)在還不能做到那樣。它必須在此之前已經(jīng)了解此類(lèi)型的車(chē),然后才能識(shí)別,否則將不會(huì)識(shí)別出。”
“這是一個(gè)極限,但通過(guò)深度學(xué)習(xí),在迭代的過(guò)程中,系統(tǒng)確實(shí)開(kāi)始學(xué)習(xí),”他解釋到。“機(jī)器學(xué)習(xí)意味著系統(tǒng)所知道的越多,它最終就變得越精確。這有點(diǎn)像嬰兒的學(xué)習(xí)—作為嬰兒你會(huì)看到數(shù)以百萬(wàn)計(jì)的不同面孔,從而使得你學(xué)會(huì)識(shí)別面部特征。該系統(tǒng)是用相同的方式,當(dāng)越多人使用它時(shí),它就會(huì)變的越發(fā)智能。”
從本質(zhì)上講,這個(gè)過(guò)程有它的基礎(chǔ),稱之為模式識(shí)別。為此,計(jì)算機(jī)把圖像分成若干層,然后嘗試著從這些集合中去識(shí)別個(gè)體數(shù)據(jù),而非識(shí)別整個(gè)圖像。這有點(diǎn)像搜索引擎———你輸入越多的檢索詞,你得到的結(jié)果越準(zhǔn)確,根據(jù)Tayeb所說(shuō),模式識(shí)別的目標(biāo)是將圖像打破成足夠多的數(shù)據(jù)點(diǎn),以便在問(wèn)題中建立一個(gè)很容易理解的認(rèn)識(shí)對(duì)象。
“顯然,你不可能擁有一個(gè)包含所有你需要的圖像的數(shù)據(jù)庫(kù),”Tayeb說(shuō)“所以僅能識(shí)別特殊圖像是遠(yuǎn)不夠的;你需要能夠看到它然后說(shuō)出這是一把椅子,而不是只識(shí)別一個(gè)特定的椅子。
機(jī)器學(xué)習(xí)比模式識(shí)別更進(jìn)一步,它嘗試用邏輯分組的模式,以便更快速、更準(zhǔn)確地識(shí)別對(duì)象。通過(guò)使用大量的復(fù)雜的數(shù)學(xué)公式,計(jì)算機(jī)正在通過(guò)機(jī)器學(xué)習(xí)而變得更為聰明,但是再進(jìn)一步,使計(jì)算機(jī)更加接近人類(lèi)的思維方式,就是所謂的深度學(xué)習(xí)。
這些也被描述為神經(jīng)網(wǎng)絡(luò),它們以神經(jīng)元命名,因?yàn)檫@些系統(tǒng)(特別是大腦)是建立在動(dòng)物的中樞神經(jīng)系統(tǒng)的基礎(chǔ)上。神經(jīng)網(wǎng)絡(luò)就是讓電腦以人類(lèi)的方式思考問(wèn)題, Tayeb 解釋道。
“沒(méi)有目錄——這是不可能的-所以你必須提取出來(lái)結(jié)構(gòu)。這也是人類(lèi)大腦所做的,”他解釋到。“當(dāng)你看到某些事物時(shí),你的眼睛中的會(huì)接受大量的數(shù)據(jù),但數(shù)據(jù)對(duì)眼睛本身來(lái)說(shuō)沒(méi)有任何意義。你的大腦必須處理你眼所接受的9-10百萬(wàn)數(shù)據(jù)點(diǎn),來(lái)判斷這些對(duì)象是如何形成的,在分析這些對(duì)象是什么、并判斷出它們的屬性。”
2014年,微軟、谷歌和Facebook均發(fā)布了各自的圖像識(shí)別軟件。從中你就可以發(fā)現(xiàn)不同公司對(duì)圖像識(shí)別的側(cè)重點(diǎn)存在差異——用過(guò)Picasa和Facebook的人會(huì)對(duì)其軟件中的標(biāo)記功能印象深刻;相對(duì)而言谷歌和必應(yīng)在識(shí)別圖像上做的更加出色。如果你閱讀了這三家公司關(guān)于這方面的相關(guān)研究文獻(xiàn),你就會(huì)了解他們是如何利用神經(jīng)網(wǎng)絡(luò)的-------多次遍歷原圖像以便確認(rèn)其圖像身份的。深度學(xué)習(xí)是實(shí)現(xiàn)這樣一個(gè)過(guò)程的基礎(chǔ)前提。
他補(bǔ)充道:“對(duì)我們來(lái)說(shuō),這款A(yù)PP的核心在于收集數(shù)據(jù),無(wú)論何時(shí)你因?yàn)檫@樣或那樣的原因打開(kāi)這款A(yù)pp的同時(shí),數(shù)據(jù)就已經(jīng)自動(dòng)存入了。它從你看到的每一件事開(kāi)始學(xué)習(xí)。首先,他可能需要人工識(shí)別。一旦有足夠的用戶顯示給他椅子并告訴它這是椅子時(shí),這個(gè)過(guò)程就變得自動(dòng)了。然后這款A(yù)pp開(kāi)始能夠自行識(shí)別凳子甚至于沒(méi)有任何提示。這同樣適用于其他對(duì)象。在某個(gè)時(shí)候,你可能會(huì)得到一個(gè)蘋(píng)果,然后得到它的營(yíng)養(yǎng)數(shù)據(jù),或看到一個(gè)電話,可以看到你能在哪里購(gòu)買(mǎi)。”
對(duì)于Blippar,Tayeb 解釋道:目標(biāo)是將任一照相機(jī)均轉(zhuǎn)變?yōu)橹悄茉O(shè)備,不論其連接了高端智能手機(jī)與否。我們只需要一個(gè)不低于2或3兆像素的相機(jī)即可以完成所有的工作。所有的“思維”都在我們這邊,因此也就不存在其他限制,我們想要得到的結(jié)果是其能成為任一相機(jī)的“大腦”。
總結(jié)
以上是生活随笔為你收集整理的深度学习:让电脑像人一样看世界的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 基于Python的卷积神经网络和特征提取
- 下一篇: 深度学习在自然语言处理的应用