人工智能、机器学习、深度学习的关系,终于有人讲明白了
作者:史丹青
來源:大數據DT(ID:hzdashuju)
2012年以后,信息爆炸帶來的數據量猛增、計算機算力的高速提升、深度學習的出現以及運用,使人工智能的研究領域不斷擴展,迎來大爆發。除了傳統的專家系統、機器學習等,進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統也接二連三有了里程碑式的成果[1],見圖1-10。
▲圖1-10 人工智能的分支
機器學習屬于人工智能的分支之一,且處于核心地位。顧名思義,機器學習的研究旨在讓計算機學會學習,能夠模擬人類的學習行為,建立學習能力,實現識別和判斷。機器學習使用算法來解析海量數據,從中找出規律,并完成學習,用學習出來的思維模型對真實事件做出決策和預測。這種方式也稱為“訓練”。
深度學習是機器學習的一種實現技術,在2006年被Hinton等人首次提出。深度學習遵循仿生學,源自神經元以及神經網絡的研究,能夠模仿人類神經網絡傳輸和接收信號的方式,進而達到學習人類的思維方式的目的[2]。
簡而言之,機器學習是一種實現人工智能的方法,深度學習是一種實現機器學習的技術,而生成對抗網絡則是深度學習中的一種分類。它們之間的關系可以通過圖1-11清晰地表示。
▲圖1-11 人工智能、機器學習、深度學習與生成對抗網絡四者的關系
01 機器學習分類
在機器學習或者人工智能領域,有幾種主要的學習方式:監督式學習、無監督式學習、強化學習。監督式學習主要用于回歸和分類,無監督式學習主要用于聚類。
1.?監督式學習
監督式學習[3]是從有標簽訓練集中學到或建立一個模式,并根據此模式推斷新的實例。訓練集由輸入數據(通常是向量)和預期輸出標簽所組成。當函數的輸出是一個連續的值時稱為回歸分析,當預測的內容是一個離散標簽時,稱為分類。
2.?無監督式學習
無監督式學習[4]是另外一種比較常用的學習方法,與監督式學習不同的是,它沒有準確的樣本數據進行訓練。
舉個例子,比如我們去看畫展,如果我們對藝術一無所知,是很難直接區分出藝術品的流派的。但當我們瀏覽完所有的畫作,則可以有一個大概的分類,即使不知道這些分類對應的準確繪畫風格是什么,也可以把觀看過的某兩個作品歸為一個類型。
這就是無監督式學習的流程,并不需要人力來輸入標簽,適用于聚類,把相似的東西聚在一起,而無須考慮這一類到底是什么。
3.?強化學習
強化學習[5]是另外一種重要的機器學習方法,強調如何基于環境而行動,以取得最大化的預期利益。在這種模式下,輸入的樣本數據也會對模型進行反饋,不過不像監督式學習那樣直接告訴正確的分類,強化學習的反饋僅僅檢查模型的對錯,模型會在接收到類似于獎勵或者懲罰的刺激后,逐步做出調整。
相比于監督式學習,強化學習更加專注于規劃,需要在探索未知領域和遵從現有知識之間找到一個合理的平衡點。
圖1-12展示了監督式學習、無監督式學習和強化學習之間的區別。
▲圖1-12 監督式學習、無監督式學習和強化學習的區別
02 神經網絡與深度學習
神經網絡是一種實現機器學習的技術,旨在模擬人腦神經網絡的運作機制。
1943年,抽象的神經元模型被首次提出。1949年,心理學家Hebb提出了“學習率”這一概念,即信息在人腦神經細胞的突觸上傳遞時,強度是可以變化的。于是研究人員開始用調整權值的方法進化機器學習算法。1958年,計算科學家Rosenblatt提出了由兩層神經元組成的單層神經網絡,它可以完成線性分類任務。
1986年,BP算法的提出解決了兩層神經網絡所需要的復雜計算量問題。這個算法在兩層神經網絡(輸入層和輸出層)中增加了一個中間層。但盡管使用了BP算法,一次神經網絡的訓練仍然耗時太久,局部最優解作為困擾訓練優化的一大問題,使得神經網絡的優化較為困難。
2006年,Hinton在Science和相關期刊上發表了論文,首次提出了深度學習的概念,并增加了兩種優化技術——“預訓練”(pre-training)和“微調”(fine-tunin)。這兩種技術的運用可以讓神經網絡的權值找到一個接近最優解的值,并大幅減少對整個網絡進行優化訓練的學習時間[6]。
圖1-13中展示了單層、兩層和多層神經網絡。
▲圖1-13 從單層、兩層和多層神經網絡
深度學習實際上指的是深度神經網絡學習,普通神經網絡由于訓練代價較高,一般只有3~4層,而深度神經網絡由于采用了特殊的訓練方法和一些技術算法,可以達到8~10層。深度神經網絡能夠捕捉到數據中的深層聯系,從而能夠得到更精準的模型,而這些聯系不容易被普通的機器學習方法所發覺。
03 深度學習的應用
目前,深度神經網絡學習(見圖1-14)在人工智能界占據統治地位。但凡有關人工智能的產業報道,必然離不開深度學習。深度學習的引入也確實讓使用傳統機器學習方法的各個領域都取得了突破性的進展。
▲圖1-14 深度神經網絡學習
自2000年開始,人們開始用機器學習解決計算機視覺問題——可以很好地實現車牌識別、安防、人臉識別等技術。在深度學習出現以前,大多數識別任務要經過手工特征提取和分類器判斷兩個基本步驟,而深度學習可以自動地從訓練樣本中學習特征。深度學習的發展使其應用場景不斷擴大,如無人車、電商等領域。
Mobileye及NVIDIA公司把基于深度卷積神經網絡的方法用于汽車的視覺系統中,率先將深度學習應用于無人駕駛領域,為無人駕駛提供了硬件基礎。2018年2月2日,谷歌宣布將于2018年啟動無人駕駛出租車服務,無人駕駛首次開啟商業運營(見圖1-15)。除此之外,通用、特斯拉、百度、Uber、蘋果等公司也進入無人駕駛賽道[7]。
▲圖1-15 谷歌無人駕駛車
在語音技術上,2010年后深度學習的廣泛應用使語音識別的準確率大幅提升,成熟產品如蘋果的Siri、亞馬遜的Echo(見圖1-16)等,可以很輕松地識別出用戶說出的一段話,并可以協助用戶完成一些任務,比如開關應用、搜索,甚至幫助預訂晚餐座位。
▲圖1-16 亞馬遜智能音箱Echo
與圖像相比,語音的識別更加復雜,不同語言、不同口音,甚至充滿暗喻的內容,這些對機器的理解能力提出很高的要求[8]。
在自然語言處理上,目前取得最大突破的成熟產品就是機器翻譯。谷歌的翻譯系統可以理解原文的連貫語義,給出完整的翻譯結果,這是人工智能的一個標桿性事件。2016年,谷歌翻譯升級成谷歌神經網絡翻譯系統(Google Neural Machine Translation),在機器翻譯上實現顛覆性突破。
相關參考:
[1]https://www.msra.cn/zh-cn/news/features/ai-hot-words-20171010?
[2]https://blog.csdn.net/Michaelwubo/article/details/79625212?
[3]https://zh.wikipedia.org/wiki/監督式學習
[4]https://zh.wikipedia.org/wiki/非監督式學習
[5]https://zh.wikipedia.org/wiki/強化學習
[6]計算機的潛意識,
https://www.cnblogs.com/subconscious/p/5058741.html
[7]http://www.sohu.com/a/226424941_465591?
[8]https://blog.csdn.net/qq_41020134/article/details/80612872?
關于作者:史丹青,語憶科技聯合創始人兼技術負責人,畢業于同濟大學電子信息工程系。擁有多年時間的AI領域創業與實戰經驗,具備深度學習、自然語言處理以及數據可視化等相關知識與技能。是AI技術的愛好者,并擁抱一切新興科技,始終堅信技術分享和開源精神的力量。
本文摘編自《生成對抗網絡入門指南》(第2版),經出版方授權發布。
延伸閱讀《生成對抗網絡入門指南》(第2版)
點擊上圖了解及購買
轉載請聯系微信:DoctorData
推薦語:揭秘AI如何生成逼真人臉圖像,追蹤GAN前沿技術更新。
劃重點👇
干貨直達👇
首次公開,用了三年的 pandas 速查表!
盤點數據治理的6個價值
3.14圓周率節,這5本書帶你領略數學的魅力
終于有人把辛普森悖論講明白了
更多精彩👇
在公眾號對話框輸入以下關鍵詞
查看更多優質內容!
讀書?|?書單?|?干貨?|?講明白?|?神操作?|?手把手
大數據?|?云計算?|?數據庫?|?Python?|?爬蟲?|?可視化
AI?|?人工智能?|?機器學習?|?深度學習?|?NLP
5G?|?中臺?|?用戶畫像?|?數學?|?算法?|?數字孿生
據統計,99%的大咖都關注了這個公眾號
👇
總結
以上是生活随笔為你收集整理的人工智能、机器学习、深度学习的关系,终于有人讲明白了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [zz]母牛生牛问题解析
- 下一篇: 很火的深度学习框架PyTorch怎么用?