深度学习:让电脑像人一样看世界
深度學習:讓電腦像人一樣看世界
發表于2015-08-28 09:33| 5269次閱讀| 來源NDTV Gadgets| 4 條評論| 作者Gopal Sathe
云計算人工智能深度學習 width="22" height="16" src="http://hits.sinajs.cn/A1/weiboshare.html?url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F2015-08-28%2F2825564&type=3&count=&appkey=&title=%E5%AF%B9%E4%BA%8EBlippar%EF%BC%8C%E5%85%B6%E5%88%9B%E5%A7%8B%E4%BA%BAOmar%20Tayeb%20%E8%A1%A8%E7%A4%BA%E5%85%B6%E7%9B%AE%E6%A0%87%E6%98%AF%E5%B0%86%E4%BB%BB%E4%B8%80%E7%85%A7%E7%9B%B8%E6%9C%BA%E5%9D%87%E8%BD%AC%E5%8F%98%E4%B8%BA%E6%99%BA%E8%83%BD%E8%AE%BE%E5%A4%87%EF%BC%8C%E4%B8%8D%E8%AE%BA%E5%85%B6%E8%BF%9E%E6%8E%A5%E4%BA%86%E9%AB%98%E7%AB%AF%E6%99%BA%E8%83%BD%E6%89%8B%E6%9C%BA%E4%B8%8E%E5%90%A6%E3%80%82%E6%88%91%E4%BB%AC%E5%8F%AA%E9%9C%80%E8%A6%81%E4%B8%80%E4%B8%AA%E4%B8%8D%E4%BD%8E%E4%BA%8E2%E6%88%963%E5%85%86%E5%83%8F%E7%B4%A0%E7%9A%84%E7%9B%B8%E6%9C%BA%E5%8D%B3%E5%8F%AF%E4%BB%A5%E5%AE%8C%E6%88%90%E6%89%80%E6%9C%89%E7%9A%84%E5%B7%A5%E4%BD%9C%E3%80%82%E6%89%80%E6%9C%89%E7%9A%84%E2%80%9C%E6%80%9D%E7%BB%B4%E2%80%9D%E9%83%BD%E5%9C%A8%E6%88%91%E4%BB%AC%E8%BF%99%E8%BE%B9%E3%80%82&pic=&ralateUid=&language=zh_cn&rnd=1442496130240" frameborder="0" scrolling="no" allowtransparency="true">摘要:對于Blippar,其創始人Omar Tayeb 表示其目標是將任一照相機均轉變為智能設備,不論其連接了高端智能手機與否。我們只需要一個不低于2或3兆像素的相機即可以完成所有的工作。所有的“思維”都在我們這邊。
谷歌的?DeepDream——一個可以幫助人們了解神經網絡的可視化工具——這不僅是當前十分火熱的項目,這在一定程度上凸顯了圖像識別領域所面臨的挑戰。圖像處理顯然不是簡單地將一幅圖片與數據庫相對比得出結果那么簡單。實際上,圖像處理是一個很復雜的問題。世界上有很多大公司正在圖像處理上面大展拳腳。
NDTV Gadgets(一家媒體)對Omar Tayeb十分關注,當時這位Blippar (擴增實境公司)的創始人兼CTO連同合伙人兼CEO Ambarish Mitra正從位于英國的公司辦事處出發一道訪問Delhi,同時NDTV Gadgets也了解了blippar是如何理解圖像識別的概念,對其運作原理有了基本的認識。
Blippar連同其他創業公司,比如Wowsome 和Times Internet's Alive公司,對AR的使用主要集中在市場營銷方面。Alive推出了智能婚禮卡片,與此同時其他公司,在雜志和報紙廣告,也試圖使用AR,電子商務網站同樣利用其作為虛擬購物體驗。
然而,事情才剛開始,Mitra告訴NDTV Gadgets:“現在,當你啟動Blippar應用程序時,它不會告訴你前方有個椅子,或者是你的桌上有個蘋果,但它能識別出一瓶可樂【可口可樂】,也可以識別一個運動品牌或者其他類似的物體?!?/p>
在未來的5-6個月里,Blippar將會推出一個“視覺網絡”,在該網絡中,Blippar應用程序將能夠識別目錄中不必要的對象,并顯示用戶這些對象的相關信息。
“如果你看一輛車,即使在此之前你從來沒見過那種型號,你也能夠說出它是哪一種車型,”Blippar的CTO Omar Tayeb說到,“ Blippar現在還不能做到那樣。它必須在此之前已經了解此類型的車,然后才能識別,否則將不會識別出?!?/p>
“這是一個極限,但通過深度學習,在迭代的過程中,系統確實開始學習,”他解釋到?!皺C器學習意味著系統所知道的越多,它最終就變得越精確。這有點像嬰兒的學習—作為嬰兒你會看到數以百萬計的不同面孔,從而使得你學會識別面部特征。該系統是用相同的方式,當越多人使用它時,它就會變的越發智能?!?/p>
從本質上講,這個過程有它的基礎,稱之為模式識別。為此,計算機把圖像分成若干層,然后嘗試著從這些集合中去識別個體數據,而非識別整個圖像。這有點像搜索引擎———你輸入越多的檢索詞,你得到的結果越準確,根據Tayeb所說,模式識別的目標是將圖像打破成足夠多的數據點,以便在問題中建立一個很容易理解的認識對象。
“顯然,你不可能擁有一個包含所有你需要的圖像的數據庫,”Tayeb說“所以僅能識別特殊圖像是遠不夠的;你需要能夠看到它然后說出這是一把椅子,而不是只識別一個特定的椅子。
機器學習比模式識別更進一步,它嘗試用邏輯分組的模式,以便更快速、更準確地識別對象。通過使用大量的復雜的數學公式,計算機正在通過機器學習而變得更為聰明,但是再進一步,使計算機更加接近人類的思維方式,就是所謂的深度學習。
這些也被描述為神經網絡,它們以神經元命名,因為這些系統(特別是大腦)是建立在動物的中樞神經系統的基礎上。神經網絡就是讓電腦以人類的方式思考問題, Tayeb 解釋道。
“沒有目錄——這是不可能的-所以你必須提取出來結構。這也是人類大腦所做的,”他解釋到?!爱斈憧吹侥承┦挛飼r,你的眼睛中的會接受大量的數據,但數據對眼睛本身來說沒有任何意義。你的大腦必須處理你眼所接受的9-10百萬數據點,來判斷這些對象是如何形成的,在分析這些對象是什么、并判斷出它們的屬性?!?/p>
2014年,微軟、谷歌和Facebook均發布了各自的圖像識別軟件。從中你就可以發現不同公司對圖像識別的側重點存在差異——用過Picasa和Facebook的人會對其軟件中的標記功能印象深刻;相對而言谷歌和必應在識別圖像上做的更加出色。如果你閱讀了這三家公司關于這方面的相關研究文獻,你就會了解他們是如何利用神經網絡的-------多次遍歷原圖像以便確認其圖像身份的。深度學習是實現這樣一個過程的基礎前提。
他補充道:“對我們來說,這款APP的核心在于收集數據,無論何時你因為這樣或那樣的原因打開這款App的同時,數據就已經自動存入了。它從你看到的每一件事開始學習。首先,他可能需要人工識別。一旦有足夠的用戶顯示給他椅子并告訴它這是椅子時,這個過程就變得自動了。然后這款App開始能夠自行識別凳子甚至于沒有任何提示。這同樣適用于其他對象。在某個時候,你可能會得到一個蘋果,然后得到它的營養數據,或看到一個電話,可以看到你能在哪里購買?!?/p>
對于Blippar,Tayeb 解釋道:目標是將任一照相機均轉變為智能設備,不論其連接了高端智能手機與否。我們只需要一個不低于2或3兆像素的相機即可以完成所有的工作。所有的“思維”都在我們這邊,因此也就不存在其他限制,我們想要得到的結果是其能成為任一相機的“大腦”。
總結
以上是生活随笔為你收集整理的深度学习:让电脑像人一样看世界的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于Python的卷积神经网络和特征提取
- 下一篇: 深度学习在自然语言处理的应用