你绝对能懂的“机器学习”(三)
很多人對機器學習的邊界范圍似是而非,機器學習是人工智能嗎?機器學習與大數據、云計算有什么關系?機器學習是不是就是數據挖掘?機器學習是不是就是算法,就是統計學?深度學習是不是機器學習的升級版?
還記得以前的中關村開會的例子嗎:你住在北京南4環以外,明天周一早上9點需要在北4環的中關村開個會,你給計算機輸入出發地點,開會時間和開會地點,計算機根據很長一段時間內周一到周日每個時間段北京各條道路的堵車指數數據,經過學習后,自動計算輸出:幾點幾分出發。
看到這里,很多人就會說,這不就是“人工智能”嗎!計算機學習過往的經驗數據,自己判斷、自己決策什么是最優的出發時間。那么它同時也是“深度學習”嗎?
沒錯,這是人工智能(Artificial Intelligence, AI),但是不是“深度學習”現在還不好說,關于“深度學習”以后會再講。這里要說明的是,人工智能是一個涵蓋范圍非常廣的概念,或者說是一個非常寬泛的概念。
可以這樣說:
深度學習屬于機器學習,機器學習又屬于人工智能。
畫成圖就是這樣:
你可以這樣理解:人工智能就如同是北京的房子,我們都知道北京的房子貴,也知道人工智能很高級,但都是寬泛的概念。北京的房子有學區房、商住房、兩限房,經濟適用房等,還要分區域,是東城區的房子還是豐臺區的房子。我們只有圍繞具體的環境、具體的應用談論北京的房子才有意義,是門頭溝區的經濟適用房,還是海淀區的學區房。
因此:
如果把人工智能比作北京的房子,那機器學習就是北京的學區房,而深度學習就是學區房中的西城區學區房。
注:西城區是北京核心區,故宮和中南海所在地,北京最好的中小學都在西城區。
稍微拓展下話題。從上面的圖中可以看出,我故意把機器學習占人工智能范圍的比例畫的比較大,而深度學習又占了機器學習非常大的比例,這不是沒有緣由的。
事實上,人工智能領域近些年來突然熱門起來,毫不客氣的說是機器學習尤其是深度學習的發展而帶動的。自上世紀50年代人工智能提出后,其發展就一直非常緩慢,半個多世紀都沒有看到足夠震撼的技術進步,我在十多年前所學專業就是人工智能方向,那時雖不是冷門專業,但也談不上是熱門專業。
直到近些年機器學習在一些專業領域,例如語音識別、產品推薦、圖像識別、棋類游戲等達到了跟人類相當甚至遠遠超出的程度,才使得計算機終于有了接近人類智能的水平。
而這些震撼成果的取得,幾乎都離不開機器學習或者說離不開“深度學習”。深度學習簡單說就是基于深度神經網絡的學習,由于其模擬了人類大腦的神經網絡構成,極有可能是真正實現人工智能夢想的關鍵所在。像科大訊飛的語音識別輸入法,著名的Google圍棋程序AlphaGo,無人駕駛汽車等都是基于深度學習的。
近些年深度學習的發展極大的提升了機器學習的地位,更進一步的,促進了整個人工智能水平的提高,使得人工智能重新站在了時代的浪潮之巔。關于深度學習以后專題再聊,現在你只需要知道“深度學習”是“機器學習”的一個分支或者說重要組成部分。
再回到最前面,機器學習與大數據、云計算、數據挖掘、模式識別、統計學等有什么關系?
以前我們提到,機器學習有一個必要前提:必須有過往的經驗,或者說有過往的數據。如果這個過往的經驗或者說數據非常龐大,就涉及到“大數據”的處理。
大數據,顧名思義,就是非常大的數據,而“云計算”又可以簡單理解為利用互聯網的分布式并行處理、分布式數據庫和異地存儲、虛擬化等技術進行“大數據”處理的工具,而且是“大數據”必然要使用的工具。
機器學習需要用到的數據,可以是少量數據,也可以是很大的數據。如果是很大的數據,那機器學習和大數據就緊密結合了,但是兩者并不等同。而云計算和大數據,你可以理解為一個硬幣的正反2面,云計算就是為大數據而生的,而大數據也必須要用云計算來處理。
對于數據挖掘,你可以認為:數據挖掘現在約等同于機器學習。但是,數據挖掘是更寬泛的概念,就像“發消息”,可以“用短信發消息”,也可以“用微信發消息”,只不過現在“發消息”默認是“用微信發消息”,就像“數據挖掘”現在默認是用機器學習的方法來挖掘數據一樣,以前可以自制圖表挖掘,也可以用excel數據表格挖掘,這些方法現在看來比較low了。也許將來某一天,機器學習也變low了,數據挖掘用了更高級的方法。
對于模式識別,十幾年前我所學的專業就是這個,當時的專業名稱叫“模式識別與智能系統”。模式識別,顧名思義就是識別事物中的模式、規律,你可以認為:模式識別等同于機器學習。只不過模式識別源自工業界的叫法,機器學習源自計算機業界的叫法。當然,模式識別這個詞現在用的比較少了,作為一個術語而言,在上世紀80、90年代比較流行,現在已經有點過時了,你可以用機器學習代替它。
對于統計學,你可以理解為:統計學是機器學習的基礎,就像數學是物理學的基礎一樣。機器學習中的大多數方法都來自于統計學,就像物理學中的大多數方法來自于數學,區別就在于統計學(數學)更偏重理論,機器學習(物理學)更偏重應用。
總結
以上是生活随笔為你收集整理的你绝对能懂的“机器学习”(三)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 你绝对能懂的“机器学习”(二)
- 下一篇: 你绝对能懂的“机器学习”(四)