大数据是什么?大数据可以做什么?大数据实际做了什么?大数据要怎么做?
“大數(shù)據(jù)”一詞時(shí)下的熱門(mén)程度無(wú)需贅言,這一兩年來(lái)互聯(lián)網(wǎng)相關(guān)的任何活動(dòng)、會(huì)議必不可少“大數(shù)據(jù)”板塊。
對(duì)于任何一個(gè)大數(shù)據(jù)的從業(yè)者或初接觸者,或許都會(huì)有個(gè)共同的感觸:大數(shù)據(jù)很有用!大數(shù)據(jù)該怎么用?
關(guān)于大數(shù)據(jù)的著作和文章鋪天蓋地,似乎也共同在傳遞一個(gè)信息:越來(lái)越多的行業(yè)、人士開(kāi)始關(guān)注并實(shí)際探索大數(shù)據(jù)的應(yīng)用,我們正在一起描繪著大數(shù)據(jù)巨大效用的藍(lán)圖,但在實(shí)踐的路上,我們都還在起步階段小步前行。
大數(shù)據(jù)根基于互聯(lián)網(wǎng),數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘、云計(jì)算等互聯(lián)網(wǎng)技術(shù)的發(fā)展為大數(shù)據(jù)的應(yīng)用奠定了基礎(chǔ)。然而實(shí)踐應(yīng)用尚處于在探索中前進(jìn)。同樣作為探索學(xué)習(xí),我想從我個(gè)人的理解角度,分享并與大家探討四個(gè)問(wèn)題:大數(shù)據(jù)是什么?大數(shù)據(jù)可以做什么?大數(shù)據(jù)實(shí)際做了什么?大數(shù)據(jù)要怎么做?
引用3個(gè)比較常用的大數(shù)據(jù)定義:
(1)需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。
—— Gartner
(2)海量的數(shù)據(jù)規(guī)模(Volume)、快速的數(shù)據(jù)流轉(zhuǎn)和動(dòng)態(tài)的數(shù)據(jù)體系(Velocity)、多樣的數(shù)據(jù)類(lèi)型(Variety)、巨大的數(shù)據(jù)價(jià)值(Value)。
—— IDC
(3)或稱(chēng)巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指所涉及的數(shù)據(jù)量規(guī)模巨大到無(wú)法通過(guò)人工,在合理時(shí)間內(nèi)達(dá)到截取、管理、處理、并整理成為人類(lèi)所能解讀的信息。
—— Wiki
其他關(guān)于大數(shù)據(jù)的定義也大抵類(lèi)似,我們可以用幾個(gè)關(guān)鍵詞對(duì)大數(shù)據(jù)做一個(gè)界定。
首先,“規(guī)模大”,這種規(guī)模可以從兩個(gè)維度來(lái)衡量,一是從時(shí)間序列累積大量的數(shù)據(jù),二是在深度上更加細(xì)化的數(shù)據(jù)。
其次,“多樣化”,可以是不同的數(shù)據(jù)格式,如文字、圖片、視頻等,可以是不同的數(shù)據(jù)類(lèi)別,如人口數(shù)據(jù),經(jīng)濟(jì)數(shù)據(jù)等,還可以有不同的數(shù)據(jù)來(lái)源,如互聯(lián)網(wǎng)、傳感器等。
第三,“動(dòng)態(tài)化”。數(shù)據(jù)是不停地變化的,可以隨著時(shí)間快速增加大量數(shù)據(jù),也可以是在空間上不斷移動(dòng)變化的數(shù)據(jù)。
這三個(gè)關(guān)鍵詞對(duì)大數(shù)據(jù)從形象上做了界定。
但還需要一個(gè)關(guān)鍵能力,就是“處理速度快”。如果這么大規(guī)模、多樣化又動(dòng)態(tài)變化的數(shù)據(jù)有了,但需要很長(zhǎng)的時(shí)間去處理分析,那不叫大數(shù)據(jù)。從另一個(gè)角度,要實(shí)現(xiàn)這些數(shù)據(jù)快速處理,靠人工肯定是沒(méi)辦法實(shí)現(xiàn)的,因此,需要借助于機(jī)器實(shí)現(xiàn)。
最終,我們借助機(jī)器,通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行快速的處理分析,獲取想要的信息或者應(yīng)用的整套體系,才能稱(chēng)為大數(shù)據(jù)。
我們可以用下面的圖示給大數(shù)據(jù)定義:
想要應(yīng)用大數(shù)據(jù),從流程上來(lái)說(shuō),大概是這樣。
首先我們要有數(shù)據(jù)源,然后對(duì)數(shù)據(jù)進(jìn)行收集和存儲(chǔ),在這基礎(chǔ)上,再進(jìn)行分析和應(yīng)用,形成我們的產(chǎn)品和服務(wù),而產(chǎn)品和服務(wù)也會(huì)產(chǎn)生新的數(shù)據(jù),這些新數(shù)據(jù)會(huì)循環(huán)進(jìn)入我們的流程中。
當(dāng)這整個(gè)循環(huán)體系成為一個(gè)智能化的體系,通過(guò)機(jī)器可以實(shí)現(xiàn)自動(dòng)化,那也許就會(huì)成為一種新的模式,不管是商業(yè)的,或者是其他。
然后具體到實(shí)際的應(yīng)用中,我認(rèn)為,大數(shù)據(jù)能夠?qū)崿F(xiàn)的應(yīng)用,可以概括為兩個(gè)方向,一是精準(zhǔn)化定制,二是預(yù)測(cè)。
首先,精準(zhǔn)化定制。
主要是針對(duì)供需兩方的,獲取需方的個(gè)性化需求,幫助供方定準(zhǔn)定位目標(biāo),然后依據(jù)需求提供產(chǎn)品,最終實(shí)現(xiàn)供需雙方的最佳匹配。
具體應(yīng)用舉例,也可以歸納為三類(lèi)。
一是個(gè)性化產(chǎn)品,比如智能化的搜索引擎,搜索同樣的內(nèi)容,每個(gè)人的結(jié)果都不同。或者是一些定制化的新聞服務(wù),或者是網(wǎng)游等。
第二種是精準(zhǔn)營(yíng)銷(xiāo),現(xiàn)在已經(jīng)比較常見(jiàn)的互聯(lián)網(wǎng)營(yíng)銷(xiāo),百度的推廣,淘寶的網(wǎng)頁(yè)推廣等,或者是基于地理位置的信息推送,當(dāng)我到達(dá)某個(gè)地方,會(huì)自動(dòng)推送周邊的消費(fèi)設(shè)施等。
第三種是選址定位,包括零售店面的選址,或者是公共基礎(chǔ)設(shè)施的選址。
這些全都是通過(guò)對(duì)用戶(hù)需求的大數(shù)據(jù)分析,然后供方提供相對(duì)定制化的服務(wù)。
應(yīng)用的第二個(gè)方向,預(yù)測(cè)。
預(yù)測(cè)主要是圍繞目標(biāo)對(duì)象,基于它過(guò)去、未來(lái)的一些相關(guān)因素和數(shù)據(jù)分析,從而提前做出預(yù)警,或者是實(shí)時(shí)動(dòng)態(tài)的優(yōu)化。
從具體的應(yīng)用上,也大概可以分為三類(lèi)。
一是決策支持類(lèi)的,小到企業(yè)的運(yùn)營(yíng)決策,證券投資決策,醫(yī)療行業(yè)的臨床診療支持,以及電子政務(wù)等。
二是風(fēng)險(xiǎn)預(yù)警類(lèi)的,比如疫情預(yù)測(cè),日常健康管理的疾病預(yù)測(cè),設(shè)備設(shè)施的運(yùn)營(yíng)維護(hù),公共安全,以及金融業(yè)的信用風(fēng)險(xiǎn)管理等。
第三種是實(shí)時(shí)優(yōu)化類(lèi)的,比如智能線路規(guī)劃,實(shí)時(shí)定價(jià)等。
以上呢,是各種文獻(xiàn)資料里,對(duì)于大數(shù)據(jù)可以用來(lái)做什么的一些暢想,事實(shí)上也許大數(shù)據(jù)可以做的事情,可以擴(kuò)展到方方面面。
但是,我們?cè)倏船F(xiàn)實(shí)中,大數(shù)據(jù)實(shí)際應(yīng)用到了什么程度呢?
我認(rèn)為,目前大數(shù)據(jù)真正實(shí)現(xiàn)了商業(yè)化的應(yīng)用,只有一種,就是互聯(lián)網(wǎng)營(yíng)銷(xiāo)。
其他我們前面列舉的方向,會(huì)有些初步的應(yīng)用,但基本都還停留在探索的階段。比如疫情預(yù)測(cè),無(wú)抵押信用貸款等,對(duì)于準(zhǔn)確性、精細(xì)度、可推廣性等方面還有待推敲。
造成大數(shù)據(jù)實(shí)際應(yīng)用與目標(biāo)藍(lán)圖之間差距的主要原因是什么,我認(rèn)為是數(shù)據(jù)源的問(wèn)題。
你必須先獲得數(shù)據(jù),然后才能應(yīng)用數(shù)據(jù)。
因此,數(shù)據(jù)的可獲取性,成為大數(shù)據(jù)在具體行業(yè)應(yīng)用性評(píng)價(jià)的一個(gè)重要維度。
可以從數(shù)據(jù)的標(biāo)準(zhǔn)化、開(kāi)放性和集中度幾個(gè)維度衡量數(shù)據(jù)可獲取性
同時(shí),獲取了數(shù)據(jù)之后,在應(yīng)用數(shù)據(jù)方面,可以從大數(shù)據(jù)應(yīng)用的潛在價(jià)值維度來(lái)衡量,包括效率的提升、成本降低或者是新模式的產(chǎn)生。
此外,還可以從大數(shù)據(jù)行業(yè)應(yīng)用的可復(fù)制/推廣性的角度來(lái)衡量,不僅包括在本行業(yè)內(nèi)的推廣,同時(shí)也包括跨行業(yè)的推廣性。
從三個(gè)維度,我個(gè)人對(duì)大數(shù)據(jù)在各行業(yè)應(yīng)用的可能性做了一個(gè)定位,但這個(gè)定位還是非常定性和粗略的,具體可能還需要對(duì)行業(yè)有更多的大數(shù)據(jù)應(yīng)用的探討和探索。
我認(rèn)為可以從兩個(gè)維度發(fā)展,首先一個(gè)重點(diǎn)任務(wù)就是要累積數(shù)據(jù),以自身?yè)碛械幕ヂ?lián)網(wǎng)數(shù)據(jù)及大數(shù)據(jù)技術(shù)兩個(gè)資源為基礎(chǔ),從一些細(xì)分應(yīng)用切入,比如可以先從企業(yè)角度,繼而擴(kuò)展到行業(yè)甚至跨行業(yè)的角度,從細(xì)分應(yīng)用先有一些產(chǎn)品的產(chǎn)出,這會(huì)成為獲取更多數(shù)據(jù)的入口,同時(shí)也為大數(shù)據(jù)更廣應(yīng)用提供了方向借鑒。
但還有一點(diǎn),對(duì)于平臺(tái)型的互聯(lián)網(wǎng)企業(yè),在確定與哪些企業(yè)或者行業(yè)數(shù)據(jù)結(jié)合、應(yīng)用大數(shù)據(jù)時(shí),可以有一些篩選條件,比如,是不是發(fā)揮了平臺(tái)屬性,另外,這種應(yīng)用是不是具有可復(fù)制或推廣性,不是只局限于某一個(gè)企業(yè)內(nèi),至少是可以應(yīng)用到整個(gè)行業(yè)中的。
以上,是我個(gè)人對(duì)大數(shù)據(jù)的一些思考,也希望可以跟更多的朋友對(duì)于大數(shù)據(jù)實(shí)際應(yīng)用上有些探討和學(xué)習(xí)。
本文為36大數(shù)據(jù)會(huì)員“Dakka”的原創(chuàng)投稿。轉(zhuǎn)載請(qǐng)標(biāo)明作者、來(lái)源及原文鏈接。
?End?
閱讀排行榜/精華推薦1入門(mén)學(xué)習(xí)如果有人質(zhì)疑大數(shù)據(jù)?不妨把這兩個(gè)視頻轉(zhuǎn)給他?
視頻:大數(shù)據(jù)到底是什么 都說(shuō)干大數(shù)據(jù)掙錢(qián) 1分鐘告訴你都在干什么
人人都需要知道 關(guān)于大數(shù)據(jù)最常見(jiàn)的10個(gè)問(wèn)題
2進(jìn)階修煉從底層到應(yīng)用,那些數(shù)據(jù)人的必備技能
如何高效地學(xué)好 R?
一個(gè)程序員怎樣才算精通Python?
3數(shù)據(jù)源爬取/收集排名前50的開(kāi)源Web爬蟲(chóng)用于數(shù)據(jù)挖掘
33款可用來(lái)抓數(shù)據(jù)的開(kāi)源爬蟲(chóng)軟件工具
在中國(guó)我們?nèi)绾问占瘮?shù)據(jù)?全球數(shù)據(jù)收集大教程
4干貨教程PPT:數(shù)據(jù)可視化,到底該用什么軟件來(lái)展示數(shù)據(jù)?
干貨|電信運(yùn)營(yíng)商數(shù)據(jù)價(jià)值跨行業(yè)運(yùn)營(yíng)的現(xiàn)狀與思考
大數(shù)據(jù)分析的集中化之路 建設(shè)銀行大數(shù)據(jù)應(yīng)用實(shí)踐PPT
【實(shí)戰(zhàn)PPT】看工商銀行如何利用大數(shù)據(jù)洞察客戶(hù)心聲?? ? ? ? ? ? ??
六步,讓你用Excel做出強(qiáng)大漂亮的數(shù)據(jù)地圖
?數(shù)據(jù)商業(yè)的崛起 解密中國(guó)大數(shù)據(jù)第一股——國(guó)雙
雙11剁手幕后的阿里“黑科技” OceanBase/金融云架構(gòu)/ODPS/dataV
金融行業(yè)大數(shù)據(jù)用戶(hù)畫(huà)像實(shí)踐
“講述大數(shù)據(jù)在金融、電信、工業(yè)、商業(yè)、電子商務(wù)、網(wǎng)絡(luò)游戲、移動(dòng)互聯(lián)網(wǎng)等多個(gè)領(lǐng)域的應(yīng)用,以中立、客觀、專(zhuān)業(yè)、可信賴(lài)的態(tài)度,多層次、多維度地影響著最廣泛的大數(shù)據(jù)人群
36大數(shù)據(jù)
長(zhǎng)按識(shí)別二維碼,關(guān)注36大數(shù)據(jù)
搜索「36大數(shù)據(jù)」或輸入36dsj.com查看更多內(nèi)容。
投稿/商務(wù)/合作:dashuju36@qq.com
↓↓↓
總結(jié)
以上是生活随笔為你收集整理的大数据是什么?大数据可以做什么?大数据实际做了什么?大数据要怎么做?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 用计算机说早上好,早上好的问候语简短 高
- 下一篇: 如何本地发布网站