学习机器学习:这10年我们能在各自的领域做点什么?
機器學習在這幾年都非常熱,被冠以人工智能 AI 之名,非常吸引眼球。大家都在談?wù)摶蛩伎妓降滓馕吨裁?#xff0c;會給我們帶來什么樣的影響?
硅谷著名科技投資家及分析師 Benedict Evans 6月發(fā)表了一篇 Ways to think about machine learning 的文章(鏈接可點閱讀原文),分享了他如何看待和理解機器學習的,非常務(wù)實。36kr 也編譯了中文版,推薦給大家。
為什么要學習和了解機器學習?
Benedict Evans?認為,最終幾乎所有的東西都會有機器學習,到那時人們對機器學習已經(jīng)是習以為常、見怪不怪了。到這一步還有多久呢?10-15年。
這不禁讓人思考:這10年,我們能利用這個契機在各自的領(lǐng)域做點什么呢?正如以往的各種技術(shù)浪潮興起時,比如工業(yè)革命、電力革命、互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng),還有作者在文中說到的關(guān)系數(shù)據(jù)庫技術(shù)等,那時各領(lǐng)域的創(chuàng)新者們都是如何響應(yīng)的呢?
如果希望10年后能在自己的領(lǐng)域有所影響力的,利用機器學習應(yīng)該是一個好的機會。跟自己相關(guān)的是學習領(lǐng)域,所以如何利用機器學習來提升學習的效率,是這一年多來在探索的命題。
假若10年機器學習技術(shù)真的對人類的學習方式、方法及效率帶了本質(zhì)的改變,希望其中能有一點自己的貢獻。
下面是學習 Benedict Evans 這篇文章記的筆記以及自己的一點思考。
討論機器學習務(wù)實方式
機器學習又被稱作“人工智能 (AI)”。這個名字有好有不好。好的方面是,很容易抓眼球,獲得大家(包括投資人)的注意力。不好的是,容易跑偏。大家容易想象成一種具有通用智能的東西。
作者舉了很好的例子:
在自動化的每一波浪潮中,我們都想象我們正在創(chuàng)造一些擬人化的東西或具有通用智能的東西。在上世紀20、30年代,我們想象鋼鐵俠拿著錘子在工廠里走來走去,在50年代,我們想象人形機器人在廚房里走來走去做家務(wù)。但我們沒有機器人仆人,我們有用來清洗的機器。
所以“人工智能將接管所有的工作” “數(shù)據(jù)是新的石油” 類似的話題都過于高屋建瓴,對深入理解機器學習并無益處。
更務(wù)實且有助于理解和解決問題的方式應(yīng)該是:機器學習可以看作是另一種意義上的自動化,在概念上跟傳送帶或取放機并沒有什么不同。它每次只能解決一個單一問題,每個問題都需要不同的實現(xiàn)方式、不同的數(shù)據(jù)、不同的路徑,而且往往需要不同的公司。洗碗機洗碗,洗衣機洗衣服,機器學習跟它們一樣,都是自動化的一部分。
找到機器學習應(yīng)用場景的兩套工具
作者在文中提供了兩個思維角度,來尋找具體產(chǎn)品中機器學習的應(yīng)用場景。
工具一:從數(shù)據(jù)和要解決的問題的類型上來思考,主要有三類:
(1)如果你有相關(guān)數(shù)據(jù),機器學習可以提供更好的結(jié)果(數(shù)據(jù)分析)
比如:Instacar 公司建立了一個系統(tǒng),來優(yōu)化個人購物者在超市中的路線,結(jié)果是相關(guān)超市有50%的提升。這是由三名工程師利用谷歌的開源工具 Keras 和 Tensorflow 建立的。
(2)機器學習可以對已有數(shù)據(jù)提出新的問題(數(shù)據(jù)挖掘)
比如:就像正在找線索的律師,可以通過尋找有關(guān)“憤怒的”或“焦慮的”以及其他異常的線索,帶來新的發(fā)現(xiàn)。
(3)機器學習可以用來直接分析音頻、圖像或視頻數(shù)據(jù),以前無法做到。這意味著圖像傳感器和麥克風變成了一種全新的輸入機制(增加可分析數(shù)據(jù)類型)
比如:一家為汽車公司提供座椅的公司,在一個便宜的DSP芯片上安裝了一個神經(jīng)網(wǎng)絡(luò),并配有一個便宜的智能手機圖像傳感器,用來檢測面料是否有褶皺。?
作者還特意指出,這個識別面料是否有褶皺,跟識別一張圖是否是貓并不是同一個問題。我想他的意思應(yīng)該是,用于工業(yè)界和實際產(chǎn)品中技術(shù),并不需要像識別一張照片是否是貓這種認知層面的技術(shù)。能低成本地解決環(huán)節(jié)中任何一個哪怕是細小的問題,都是好的。至于能不能叫“人工智能”又有什么關(guān)系,它的本質(zhì)是將以前無法自動化的任務(wù)給自動化了。
工具二:自動化的感覺(上面講的這種自動化)
這個似乎有點虛無渺茫。你要想象這種自動化是一種低層次的自動化,并不需要像有20年經(jīng)驗的專家那樣。
作者打了一個比方,還挺有意思的。他說有了機器學習這個工具,就像是給了你無數(shù)個可以用的實習生,或者是10歲的孩子。
5年前,機器能區(qū)分只能是照片的大小。一位10歲的孩子,可以分出男女。一位15歲的青少年可以分出酷或者不酷。一位實習生則能區(qū)分出有趣的人或無趣的人。現(xiàn)在的機器學習,已經(jīng)可以達到10歲孩子甚至是15歲青少年的能力,但也許永遠達不到實習生的水平。
那么問題來了:在這種情況下,如果你有一百萬15歲青少年(即機器學習)來幫忙看照片,你會怎么做呢?同理,你會怎么通過他們來聽電話,來識別圖片,來監(jiān)測信用卡轉(zhuǎn)賬信息呢?
(也許可以想一想再看答案...)
我們可以要求“他們” 聽完所有的電話,找出其中聽起來有些生氣的那些;讀完所有的郵件找到顯得“焦慮”的那些;看完所有照片,找出酷的(至少是‘有點怪’)的,而在這之后的事情可以交給人來處理。所以,機器學習并不需要成為專家本身。
而這本質(zhì)上就自動化一直在做的事,就像是 Excel 和 Photoshop 一直在為我們做的事情一樣。
將一個重復多次的獨立任務(wù)自動化,這同樣是機器學習要做的。
當然上面這個比喻也有不適用的時候,比如機器在有的領(lǐng)域會超越人類,比如圍棋。AlphaGo 就是一個很好的例子。但是這種領(lǐng)域足夠狹窄,有具體且有限的規(guī)則,機器通過規(guī)則推演可以看到全部數(shù)據(jù),而人類反而做不到的情況,是非常少見的。所以絕大多數(shù)的機器學習應(yīng)用,還是上面說的“自動化”。
最后,結(jié)合自己的一點實際經(jīng)驗,說一說自己的體會,主要有兩個方面。
第一,先摘低垂的果實
“低垂的果實” 是從萬維鋼的得到專欄《精英日課》聽來的譯法,英文是low hanging fruit,指的是相對不需要費太大力氣就能獲得的。
不是所有的人或公司都要追求10倍創(chuàng)新,那些讓希望賦予機器認知能力的事情可以由大公司來做。對于一個直接面向用戶的產(chǎn)品來說,什么能提升體驗、能創(chuàng)造新的用戶價值,就用什么。不為所謂“人工智能”之名所累,一切以解決問題和提升效率為優(yōu)先,是更務(wù)實的態(tài)度。
第二,機器學習在用戶量級大的系統(tǒng)解決方案型產(chǎn)品中更能發(fā)揮出效能
一是因為機器學習是靠數(shù)據(jù)驅(qū)動,用戶量級大,收集的數(shù)據(jù)多,訓練和迭代模型都更有利。另一個原因是,因為機器學習優(yōu)化的可能是整個體系的一個環(huán)節(jié),其效能需要在多次重復使用中發(fā)揮出來。這種回報后置要求,一在獲得成效前要有長遠眼光,二在取得成效后,需要系統(tǒng)將其效能放大。
比如,一個自適應(yīng)的英語水平測評做得非常精準,但人們不一定愿意持續(xù)為測評付費。更好的情況是,測評后面還有一整體套提升英語水平的付費課程。
總之,機器學習是一個我們不想也不能忽視的趨勢。它已經(jīng)被應(yīng)用于各行各業(yè)的各個環(huán)節(jié),也將被應(yīng)用于更多的場景,以此來提升效率。
所以這10年,我們都可以在各自的領(lǐng)域做點什么呢?這是一個好問題。
(全文完)
作者:紫蘇和魚
鏈接:https://www.jianshu.com/p/12114bd4a7b8
?
總結(jié)
以上是生活随笔為你收集整理的学习机器学习:这10年我们能在各自的领域做点什么?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Discuz验证码识别(编码篇)-写给程
- 下一篇: 想转行到机器学习,学到什么程度,才能找到