【科普】一文把数据科学、人工智能与机器学习讲清楚
目錄
什么是數(shù)據(jù)科學(xué)?
什么是人工智能?
什么是機(jī)器學(xué)習(xí)?
數(shù)據(jù)科學(xué)、人工智能、機(jī)器學(xué)習(xí)的關(guān)系
數(shù)據(jù)科學(xué)、人工智能、機(jī)器學(xué)習(xí)的區(qū)別
數(shù)據(jù)科學(xué)、人工智能、機(jī)器學(xué)習(xí)工作
盡管"數(shù)據(jù)科學(xué)"、人工智能 (AI) 和機(jī)器學(xué)習(xí)屬于同一領(lǐng)域,彼此相互聯(lián)系,但是它們也有特定的應(yīng)用背景和意義。它們有時也會有重疊,但基本上它們都有自己的特定的用途。
什么是數(shù)據(jù)科學(xué)?
數(shù)據(jù)科學(xué)是指與數(shù)據(jù)系統(tǒng)和數(shù)據(jù)處理有關(guān)的研究領(lǐng)域,它旨在維護(hù)數(shù)據(jù)并從中推導(dǎo)出數(shù)據(jù)蘊(yùn)含的意義。數(shù)據(jù)科學(xué)家將工具、應(yīng)用、理論和算法結(jié)合在一起來理解數(shù)據(jù)。由于現(xiàn)在全球各個組織或系統(tǒng)都在生成指數(shù)級的數(shù)據(jù)量,因此很難監(jiān)視和存儲這些數(shù)據(jù)。數(shù)據(jù)科學(xué)側(cè)重于數(shù)據(jù)建模和數(shù)據(jù)倉庫,以跟蹤不斷增長的數(shù)據(jù),通過數(shù)據(jù)科學(xué)軟件提取信息來指導(dǎo)業(yè)務(wù)并實(shí)現(xiàn)特定目標(biāo)。
數(shù)據(jù)科學(xué)范圍
數(shù)據(jù)科學(xué)直接影響的領(lǐng)域之一是商業(yè)智能。數(shù)據(jù)科學(xué)家主要處理大數(shù)據(jù),以分析模式、趨勢等。編寫數(shù)據(jù)分析報告,以幫助之后的推理。商業(yè)智能專家會接手?jǐn)?shù)據(jù)科學(xué)家的工作——– 使用數(shù)據(jù)分析報告了解任何特定業(yè)務(wù)的數(shù)據(jù)趨勢,并根據(jù)這些信息進(jìn)行預(yù)測并制定行動方案。另外一個與數(shù)據(jù)科學(xué)和商業(yè)智能相關(guān)的領(lǐng)域 —— 業(yè)務(wù)分析師。業(yè)務(wù)分析師將兩者結(jié)合一點(diǎn),以幫助公司做出基于數(shù)據(jù)驅(qū)動的決策。數(shù)據(jù)科學(xué)家根據(jù)不同的要求分析歷史數(shù)據(jù),采用不同的形式,如:
預(yù)測性因果分析:數(shù)據(jù)科學(xué)家使用此模型來預(yù)測業(yè)務(wù)。預(yù)測模型以度量方式展示各種決策的結(jié)果。對于試圖了解新業(yè)務(wù)的企業(yè)來說,這可能是一種有效的模式。
規(guī)范分析:這種分析通過預(yù)測最有可能成功的行為,幫助企業(yè)設(shè)定商業(yè)目標(biāo)。規(guī)范性分析使用預(yù)測模型進(jìn)行推理,并通過給出實(shí)現(xiàn)這些目標(biāo)的最佳方式來幫助企業(yè)。
數(shù)據(jù)科學(xué)大量地使用面向數(shù)據(jù)的技術(shù),包括SQL、Python、R和 Hadoop 等。并且它還廣泛使用統(tǒng)計(jì)分析、數(shù)據(jù)可視化、分布式體系結(jié)構(gòu)等從數(shù)據(jù)集中提取信息。
數(shù)據(jù)科學(xué)家是能夠熟練運(yùn)用專業(yè)技能的人士,他們的專業(yè)知識使他們能夠在數(shù)據(jù)科學(xué)項(xiàng)目的任何階段快速轉(zhuǎn)換角色。他們可以使用 AI 和機(jī)器學(xué)習(xí)等技術(shù)輕松地工作。事實(shí)上,數(shù)據(jù)科學(xué)家需要機(jī)器學(xué)習(xí)技能來實(shí)現(xiàn)特定要求,例如:
用于預(yù)測的機(jī)器學(xué)習(xí):數(shù)據(jù)科學(xué)家使用機(jī)器學(xué)習(xí)算法來研究數(shù)據(jù),以便做出有價值的預(yù)測。也稱為監(jiān)督學(xué)習(xí),這些模型可以為企業(yè)提出最有效的行動方案。
用于模式發(fā)現(xiàn)的機(jī)器學(xué)習(xí):通過機(jī)器學(xué)習(xí)發(fā)現(xiàn)一些商業(yè)模式,這對于企業(yè)非常有用。這基本上屬于無監(jiān)督的學(xué)習(xí),沒有預(yù)先決定的參數(shù)。模式發(fā)現(xiàn)最常用的算法是聚類。
什么是人工智能?
AI,是一個相當(dāng)“黑客化”的技術(shù)術(shù)語,在流行文化中經(jīng)常講其與未來的機(jī)器人或者以機(jī)器為主的世界聯(lián)系在一起。然而,在現(xiàn)實(shí)中,人工智能遠(yuǎn)非如此。簡單地說,人工智能旨在通過復(fù)現(xiàn)人類智能,使得機(jī)器能夠進(jìn)行推理。
由于 AI 的主要目標(biāo)是用經(jīng)驗(yàn)知識訓(xùn)練機(jī)器,因此提供正確的經(jīng)驗(yàn)信息和自我校正至關(guān)重要。AI 專家依靠深度學(xué)習(xí)和自然語言處理來幫助機(jī)器識別模式和推理。
人工智能的范圍
AI 自動化:您可以通過建立可靠系統(tǒng),讓AI自動執(zhí)行重復(fù)的、繁雜的任務(wù)。
智能產(chǎn)品:人工智能可以將傳統(tǒng)產(chǎn)品轉(zhuǎn)化為智能商品。對話平臺、機(jī)器人和其他AI技術(shù)使得科技不斷進(jìn)步。
漸進(jìn)式學(xué)習(xí):AI 算法可以訓(xùn)練機(jī)器執(zhí)行任何所需的功能。算法主要包含預(yù)測器和分類器。
分析數(shù)據(jù):由于機(jī)器從我們提供的數(shù)據(jù)集中學(xué)習(xí),分析和收集正確的數(shù)據(jù)集就變得非常重要。而神經(jīng)網(wǎng)絡(luò)使得訓(xùn)練變得更加容易。
什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)是指系統(tǒng)可以從經(jīng)驗(yàn)中自動學(xué)習(xí)和改進(jìn),它是人工智能的一部分。AI 的這一特殊分支旨在研發(fā)獨(dú)立的學(xué)習(xí)技術(shù),從而不必特意去編程來實(shí)現(xiàn)這些技術(shù)。
機(jī)器學(xué)習(xí)包括觀測和研究數(shù)據(jù)或經(jīng)驗(yàn),以確定模式并建立推理系統(tǒng)。機(jī)器學(xué)習(xí)包括:
有監(jiān)督機(jī)器學(xué)習(xí):此模型使用歷史數(shù)據(jù)來理解行為并建立對未來的預(yù)測。這種學(xué)習(xí)算法可以分析任何給定的訓(xùn)練數(shù)據(jù)集,以推理出有效的輸出。監(jiān)督學(xué)習(xí)的參數(shù)對于結(jié)果至關(guān)重要。
無監(jiān)督機(jī)器學(xué)習(xí):這種類型的 ML 算法不使用任何分類或標(biāo)簽參數(shù)。它側(cè)重于從未標(biāo)記的數(shù)據(jù)中發(fā)現(xiàn)隱藏結(jié)構(gòu),以幫助系統(tǒng)推斷出正確的分布函數(shù)。無監(jiān)督學(xué)習(xí)算法既可使用生成學(xué)習(xí)模型,也可以使用基于檢索的方法。
半監(jiān)督機(jī)器學(xué)習(xí):此模型結(jié)合了有監(jiān)督和無監(jiān)督學(xué)習(xí),但卻和它們都不同。它的工作原理是使用標(biāo)記和未標(biāo)記的數(shù)據(jù)來提高學(xué)習(xí)的準(zhǔn)確性。當(dāng)標(biāo)簽數(shù)據(jù)成本高昂時,半監(jiān)督學(xué)習(xí)可能是一種經(jīng)濟(jì)高效的解決方案。
強(qiáng)化機(jī)器學(xué)習(xí):這種學(xué)習(xí)不使用任何訓(xùn)練數(shù)據(jù),而是從經(jīng)驗(yàn)中來學(xué)習(xí)。不斷地試驗(yàn)和錯誤導(dǎo)致強(qiáng)化學(xué)習(xí)的回報周期比較長。
機(jī)器學(xué)習(xí)通過分析海量數(shù)據(jù)集提供準(zhǔn)確的結(jié)果。將 AI 技術(shù)應(yīng)用于 ML 系統(tǒng)可以更有效地處理數(shù)據(jù)和信息。數(shù)據(jù)科學(xué)、人工智能與機(jī)器學(xué)習(xí)的關(guān)系
人工智能,就像數(shù)據(jù)科學(xué)一樣,也是一個應(yīng)用廣泛的領(lǐng)域,它旨在通過機(jī)器復(fù)現(xiàn)人類的智能。人工智能中可以用行動、計(jì)劃、感知、反饋來描述。
感知> 計(jì)劃> 行動 > 感知反饋。數(shù)據(jù)科學(xué)中使用此模式或這樣的循環(huán)來解決特定問題。例如,在第一步感知中,數(shù)據(jù)科學(xué)家嘗試在數(shù)據(jù)的幫助下識別模式。同樣地,計(jì)劃包括:
尋找所有可能的解決方案
在所有解決方案中尋找最佳解決方案
數(shù)據(jù)科學(xué)創(chuàng)造了一個系統(tǒng),將上述要素相互關(guān)聯(lián),幫助企業(yè)向前發(fā)展。
盡管可以通過將機(jī)器學(xué)習(xí)作為獨(dú)立主題來解釋,但更好的還是在某種背景中去理解它。簡而言之,機(jī)器學(xué)習(xí)是連接數(shù)據(jù)科學(xué)和 AI 的紐帶。這是因?yàn)闄C(jī)器學(xué)習(xí)是從數(shù)據(jù)中不斷學(xué)習(xí)的過程。因此,AI 是幫助數(shù)據(jù)科學(xué)獲得結(jié)果和解決用于特定問題的方案的工具。機(jī)器學(xué)習(xí)有助于實(shí)現(xiàn)這一目標(biāo)。谷歌的搜索引擎就是一個真實(shí)的例子。谷歌的搜索引擎是數(shù)據(jù)科學(xué)的產(chǎn)物
它使用預(yù)測分析(AI系統(tǒng))向用戶提供智能結(jié)果
例如,如果一個人在谷歌的搜索引擎上鍵入"紐約最好的夾克",那么 AI 會通過機(jī)器學(xué)習(xí)收集此信息
現(xiàn)在,一旦此人在搜索欄中輸入"最佳購買地點(diǎn)",AI 就會開始,并且通過預(yù)測分析將句子描述為"在紐約購買夾克的最佳地點(diǎn)",這可能是用戶最想要的搜索結(jié)果。
人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的關(guān)系
因此確切地說,數(shù)據(jù)科學(xué)涵蓋 AI,包括機(jī)器學(xué)習(xí)。然而,機(jī)器學(xué)習(xí)有另一個子技術(shù) ——深度學(xué)習(xí)。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種形式,其不同之處在深度學(xué)習(xí)使用了神經(jīng)網(wǎng)絡(luò)這一仿生技術(shù):當(dāng)我們看到數(shù)據(jù)時,數(shù)據(jù)會刺激大腦中的神經(jīng)元,神經(jīng)元的層次結(jié)構(gòu)會識別有用的模式。
數(shù)據(jù)科學(xué)、人工智能與機(jī)器學(xué)習(xí)的區(qū)別
數(shù)據(jù)科學(xué)和商業(yè)分析的區(qū)別
數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)工作
數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)都是高收入行業(yè)。然而,這三個領(lǐng)域并不是相互排斥的。這些領(lǐng)域所需的專業(yè)技能通常會相互重疊。
數(shù)據(jù)科學(xué)崗位需求(如數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)工程師和數(shù)據(jù)科學(xué)家)在相當(dāng)長的一段時間內(nèi)呈上升趨勢。這些工作不僅提供了高薪,而且有很大的上升空間。
數(shù)據(jù)科學(xué)的技能要求
編程知識
數(shù)據(jù)可視化和報告
統(tǒng)計(jì)分析和數(shù)學(xué)
風(fēng)險分析
機(jī)器學(xué)習(xí)技術(shù)
數(shù)據(jù)倉儲和結(jié)構(gòu)
無論是報表制作還是將這些報告拆分給其他人,這一領(lǐng)域的工作并不僅限于編程或數(shù)據(jù)挖掘。數(shù)據(jù)科學(xué)專家是連接技術(shù)部門和運(yùn)營部門之間的橋梁,除了技術(shù)要求之外,優(yōu)秀的人際交往能力也是至關(guān)重要的。
同樣,人工智能和機(jī)器學(xué)習(xí)正在從市場上吸收大量人才。機(jī)器學(xué)習(xí)工程師、人工智能架構(gòu)師、人工智能研究專家等都屬于此領(lǐng)域。
AI-ML 所需的技術(shù)和技能精通編程語言,如Python、C++、Java
數(shù)據(jù)建模和評估
概率和統(tǒng)計(jì)
分布式計(jì)算
機(jī)器學(xué)習(xí)算法
如您所見,兩個領(lǐng)域的技能集要求重疊。在大多數(shù)情況下,數(shù)據(jù)科學(xué)和AI-ML 除了各自的專業(yè)外,還要有其他領(lǐng)域的基本知識。
盡管數(shù)據(jù)科學(xué)、人工智能和機(jī)器學(xué)習(xí)相互重疊,但它們的具體功能也不同,并且有各自的應(yīng)用領(lǐng)域。數(shù)據(jù)科學(xué)市場不斷地壯大,為這一領(lǐng)域的專家創(chuàng)造了機(jī)會。
掌握這些領(lǐng)域的任何技能都會使你的事業(yè)領(lǐng)先一步。探索人工智能的事業(yè) .
deephub翻譯組:zhangzc
本文作者:
往期精彩回顧適合初學(xué)者入門人工智能的路線及資料下載機(jī)器學(xué)習(xí)在線手冊深度學(xué)習(xí)在線手冊AI基礎(chǔ)下載(pdf更新到25集)本站qq群1003271085,加入微信群請回復(fù)“加群”獲取一折本站知識星球優(yōu)惠券,請回復(fù)“知識星球”喜歡文章,點(diǎn)個在看 與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖
總結(jié)
以上是生活随笔為你收集整理的【科普】一文把数据科学、人工智能与机器学习讲清楚的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【算法知识】详解选择排序算法
- 下一篇: 关于SVM,面试官们都怎么问