大数据时代的10个重大变化(长篇神文)
大數(shù)據(jù)時代的到來改變了人們的生活方式、思維模式和研究范式,我們可以總結出 10 個重大變化,如圖 1 所示。
圖 1??大數(shù)據(jù)時代的 10 個重大變化
對研究范式的新認識:從第三范式到第四范式
2007 年 1 月,圖靈獎得主、關系型數(shù)據(jù)庫鼻祖 JimGray 發(fā)表演講,他憑著自己對于人類科學發(fā)展特征的深刻洞察,敏銳地指出科學的發(fā)展正在進入“數(shù)據(jù)密集型科學發(fā)現(xiàn)范式”——科學史上的“第四范式”。
在他看來,人類科學研究活動已經(jīng)歷過三種不同范式的演變過程。
“第一范式”是指原始社會的“實驗科學范式”。18 世紀以前的科學進步均屬于此列,其核心特征是對有限的客觀對象進行觀察、總結、提煉,用歸納法找出其中的科學規(guī)律,如伽利略提出的物理學定律。
“第二范式”是指 19 世紀以來的理論科學階段,以模型和歸納為特征的“理論科學范式”。其核心特征是以演繹法為主,憑借科學家的智慧構建理論大廈,如愛因斯坦提出的相對論、麥克斯方程組、量子理論和概率論等。
“第三范式”是指 20 世紀中期以來的計算科學階段的“計算科學范式”。面對大量過于復雜的現(xiàn)象,歸納法和演繹法都難以滿足科學研究的需求,人類開始借助計算機的高級運算能力對復雜現(xiàn)象進行建模和預測,如天氣、地震、核試驗、原子的運動等。
然而,隨著近年來人類采集數(shù)據(jù)量的爆炸性增長,傳統(tǒng)的計算科學范式已經(jīng)越來越無力駕馭海量的科研數(shù)據(jù)了。例如,歐洲的大型粒子對撞機、天文領域的 Pan-STARRS 望遠鏡每天產生的數(shù)據(jù)多達幾千萬億字節(jié)(PB)。很明顯,這些數(shù)據(jù)已經(jīng)突破了“第三范式”的處理極限,無法被科學家有效利用。
正因為如此,目前正在從“計算科學范式”轉向“數(shù)據(jù)密集型科學發(fā)現(xiàn)范式”。
“第四范式”的主要特點是科學研究人員只需要從大數(shù)據(jù)中查找和挖掘所需要的信息和知識,無須直接面對所研究的物理對象。例如,在大數(shù)據(jù)時代,天文學家的研究方式發(fā)生了新的變化,其主要研究任務變?yōu)閺暮A繑?shù)據(jù)庫中發(fā)現(xiàn)所需的物體或現(xiàn)象的照片,而不再需要親自進行太空拍照。
對數(shù)據(jù)重要性的新認識:從數(shù)據(jù)資源到數(shù)據(jù)資產
在大數(shù)據(jù)時代,數(shù)據(jù)不僅是一種“資源”,更是一種重要的“資產”。因此,數(shù)據(jù)科學應把數(shù)據(jù)當作一種“資產”來管理,而不能僅僅當作“資源”來對待。也就是說,與其他類型的資產相似,數(shù)據(jù)也具有財務價值,且需要作為獨立實體進行組織與管理。
大數(shù)據(jù)時代的到來,讓“數(shù)據(jù)即資產”成為最核心的產業(yè)趨勢。在這個“數(shù)據(jù)為王”的時代,回首信息產業(yè)發(fā)展的起起伏伏,我們發(fā)現(xiàn)產業(yè)興衰的決定性因素,已不是土地、人力、技術、資本這些傳統(tǒng)意義上的生產要素,而是曾經(jīng)被一度忽視的“數(shù)據(jù)資產”。
世界經(jīng)濟論壇報告曾經(jīng)預測稱,“未來的大數(shù)據(jù)將成為新的財富高地,其價值可能會堪比石油”,而大數(shù)據(jù)之父維克托也樂觀地表示,“數(shù)據(jù)列入企業(yè)資產負債表只是時間問題”。
“數(shù)據(jù)成為資產”是互聯(lián)網(wǎng)泛在化的一種資本體現(xiàn),它讓互聯(lián)網(wǎng)不僅具有應用和服務本身的價值,而且具有了內在的“金融”價值。數(shù)據(jù)不再只是體現(xiàn)于“使用價值”方面的產品,而成為實實在在的“價值”。
目前,作為數(shù)據(jù)資產先行者的 IT 企業(yè),如蘋果、谷歌、IBM、阿里、騰訊、百度等,無不想盡各種方式,挖掘多種形態(tài)的設備及軟件功能,收集各種類型的數(shù)據(jù),發(fā)揮大數(shù)據(jù)的商業(yè)價值,將傳統(tǒng)意義上的 IT 企業(yè),打造成為“終端+應用+平臺+數(shù)據(jù)”四位一體的泛互聯(lián)網(wǎng)化企業(yè),以期在大數(shù)據(jù)時代獲取更大的收益。
大數(shù)據(jù)資產的價值的衡量尺度主要有以下 3 個方面的標準。
1)獨立擁有及控制數(shù)據(jù)資產
目前,數(shù)據(jù)的所有權問題在業(yè)界還比較模糊。從擁有和控制的角度來看,數(shù)據(jù)可以分為 Ⅰ 型數(shù)據(jù)、Ⅱ 型數(shù)據(jù)和 Ⅲ 型數(shù)據(jù)。
Ⅰ 型數(shù)據(jù)主要是指數(shù)據(jù)的生產者自己生產出來的各種數(shù)據(jù),例如,百度對使用其搜索引擎的用戶的各種行為進行收集、整理和分析,這類數(shù)據(jù)雖然由用戶產生,但產權卻屬于生產者,并最大限度地發(fā)揮其商業(yè)價值。
Ⅱ 型數(shù)據(jù)又稱為入口數(shù)據(jù),例如,各種電子商務營銷公司通過將自身的工具或插件植入電商平臺,來為其提供統(tǒng)計分析服務,并從中獲取各類經(jīng)營數(shù)據(jù)。雖然這些數(shù)據(jù)的所有權并不屬于這些公司,在使用時也有一些規(guī)則限制,但是它們卻有著對數(shù)據(jù)實際的控制權。
相比于前兩類數(shù)據(jù),Ⅲ 型數(shù)據(jù)的產權情況比較復雜,它們主要依靠網(wǎng)絡爬蟲,甚至是黑客手段獲取數(shù)據(jù)。與 Ⅰ 型和 Ⅱ 型數(shù)據(jù)不同的是,這些公司流出的內部數(shù)據(jù)放在網(wǎng)上供人付費下載。這種數(shù)據(jù)在當前階段,還不能和資產完全畫等號。
2)計量規(guī)則與貨幣資本類似
大數(shù)據(jù)要實現(xiàn)真正的資產化,用貨幣對海量數(shù)據(jù)進行計量是一個大問題。盡管很多企業(yè)都意識到數(shù)據(jù)作為資產的可能性,但除了極少數(shù)專門以數(shù)據(jù)交易為主營業(yè)務的公司外,大多數(shù)公司都沒有為數(shù)據(jù)的貨幣計量做出適當?shù)馁~務處理。
雖然數(shù)據(jù)作為資產尚未在企業(yè)財務中得到真正的引用,但將數(shù)據(jù)列入無形資產比較有利。
考慮到研發(fā)因素,很多高科技企業(yè)都具有較長的投入產出期,可以讓那些存儲在硬盤上的數(shù)據(jù)直接進入資產負債表。對于通過交易手段獲得的數(shù)據(jù),可以按實際支付價款作為入賬價值計入無形資產,從而為企業(yè)形成有效稅盾,降低企業(yè)實際稅負。
3)具有資本一般的增值屬性
資本區(qū)別于一般產品的特征在于,它具有不斷增值的可能性。只有能夠利用數(shù)據(jù)、組合數(shù)據(jù)、轉化數(shù)據(jù)的企業(yè),他們手中的大數(shù)據(jù)資源才能成為數(shù)據(jù)資產。
目前,直接利用數(shù)據(jù)為企業(yè)帶來經(jīng)濟利益的方法主要有數(shù)據(jù)租售、信息租售、數(shù)據(jù)使能三種模式。
- 數(shù)據(jù)租售主要通過對業(yè)務數(shù)據(jù)進行收集、整理、過濾、校對、打包、發(fā)布等一系列操作,實現(xiàn)數(shù)據(jù)內在的價值。
- 信息租售則通過聚焦行業(yè)焦點,收集相關數(shù)據(jù),深度整合、萃取及分析,形成完整數(shù)據(jù)鏈條,實現(xiàn)數(shù)據(jù)的資產轉化。
- 數(shù)據(jù)使能是指類似于阿里這樣的互聯(lián)網(wǎng)公司通過提供大量的金融數(shù)據(jù)挖掘及分析服務,為傳統(tǒng)金融行業(yè)難以下手的小額貸款業(yè)務開創(chuàng)新的行業(yè)增長點。
總而言之,作為信息時代核心的價值載體,大數(shù)據(jù)必然具有朝向價值本體轉化的趨勢,而它的“資產化”,或者未來更進一步的“資本化”蛻變,將為未來完全信息化、泛互聯(lián)網(wǎng)化的商業(yè)模式打下基礎。
對方法論的新認識:從基于知識到基于數(shù)據(jù)
傳統(tǒng)的方法論往往是“基于知識”的,即從“大量實踐(數(shù)據(jù))”中總結和提煉出一般性知識(定理、模式、模型、函數(shù)等)之后,用知識去解決(或解釋)問題。因此,傳統(tǒng)的問題解決思路是“問題→知識→問題”,即根據(jù)問題找“知識”,并用“知識”解決“問題”。
然而,數(shù)據(jù)科學中興起了另一種方法論——“問題→數(shù)據(jù)→問題”,即根據(jù)“問題”找“數(shù)據(jù)”,并直接用“數(shù)據(jù)”(在不需要把“數(shù)據(jù)”轉換成“知識”的前提下)解決“問題”,如圖 2 所示。
圖 2??傳統(tǒng)思維與大數(shù)據(jù)思維的比較
對數(shù)據(jù)分析的新認識:從統(tǒng)計學到數(shù)據(jù)科學
在傳統(tǒng)科學中,數(shù)據(jù)分析主要以數(shù)學和統(tǒng)計學為直接理論工具。但是,云計算等計算模式的出現(xiàn)及大數(shù)據(jù)時代的到來,提升了我們對數(shù)據(jù)的獲取、存儲、計算與管理能力,進而對統(tǒng)計學理論與方法產生了深遠影響。大數(shù)據(jù)帶給我們 4 個顛覆性的觀念轉變。
1)不是隨機樣本,而是全體數(shù)據(jù)
在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關的所有數(shù)據(jù),而不再依賴于隨機采樣。
以前我們通常把隨機采樣看成是理所應當?shù)南拗?#xff0c;但是真正的大數(shù)據(jù)時代是指不用隨機分析法這樣的捷徑,而采用對所有數(shù)據(jù)進行分析的方法,通過觀察所有數(shù)據(jù),來尋找異常值進行分析。
例如,信用卡詐騙是通過異常情況來識別的,只有掌握了所有數(shù)據(jù)才能做到這一點。在這種情況下,異常值是最有用的信息,可以把它與正常交易情況作對比從而發(fā)現(xiàn)問題。
2)不是純凈性,而是混雜性
數(shù)據(jù)量的大幅增加會造成一些錯誤的數(shù)據(jù)混進數(shù)據(jù)集。但是,正因為我們掌握了幾乎所有的數(shù)據(jù),所以我們不再擔心某個數(shù)據(jù)點對整套分析的不利影響。
我們要做的就是要接受這些紛繁的數(shù)據(jù)并從中受益,而不是以高昂的代價消除所有的不確定性。這就是由“小數(shù)據(jù)”到“大數(shù)據(jù)”的改變。
3)不是精確性,而是趨勢
研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度。之前需要分析的數(shù)據(jù)很少,所以我們必須盡可能精確地量化我們的記錄,但隨著規(guī)模的擴大,對精確度的癡迷將減弱。
擁有了大數(shù)據(jù),我們不再需要對一個現(xiàn)象刨根問底,只要掌握了大體的發(fā)展方向即可,適當忽略微觀層面上的精確度,會讓我們在宏觀層面擁有更好的洞察力。
例如,微信朋友圈中朋友發(fā)動態(tài)的時間,在一小時以內的會顯示多少分鐘之前,在一小時以外的就只顯示幾小時前;微信公眾號中顯示的閱讀量,超過十萬以后顯示的就是 100000+,而不是具體數(shù)據(jù),因為超過十萬的閱讀量已經(jīng)讓我們覺得這篇文章很優(yōu)秀了,沒必要精確。
4)不是因果關系,而是相關關系
在數(shù)據(jù)科學中,廣泛應用“基于數(shù)據(jù)”的思維模式,重視對“相關性”的分析,而不是等到發(fā)現(xiàn)“真正的因果關系”之后才解決問題。
在大數(shù)據(jù)時代,人們開始重視相關分析,而不僅僅是因果分析。我們無須再緊盯事物之間的因果關系,而應該尋找事物之間的相關關系。相關關系也許不能準確地告訴我們某件事情為何會發(fā)生,但是它會告訴我們某件事情已經(jīng)發(fā)生了。
在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己發(fā)聲。知道是什么就夠了,沒必要知道為什么。例如,知道用戶對什么感興趣即可,沒必要去研究用戶為什么感興趣。
相關關系的核心是量化兩個數(shù)據(jù)值之間的數(shù)據(jù)關系。相關關系強是指當一個數(shù)據(jù)值增加時,其他數(shù)據(jù)值很有可能也會隨之增加。相關關系是通過識別關聯(lián)物來幫助我們分析某一現(xiàn)象的,而不是揭示其內部的運作。
通過找到一個現(xiàn)象良好的關聯(lián)物,相關關系可以幫助我們捕捉現(xiàn)在和預測未來。例如,如果川和萬經(jīng)常一起發(fā)生,我們只需要注意方是否發(fā)生,就可以預測力是否也發(fā)生了。
對計算智能的新認識:從復雜算法到簡單算法
“只要擁有足夠多的數(shù)據(jù),我們可以變得更聰明”是大數(shù)據(jù)時代的一個新認識。因此,在大數(shù)據(jù)時代,原本復雜的“智能問題”變成簡單的“數(shù)據(jù)問題”。
只要對大數(shù)據(jù)進行簡單查詢就可以達到“基于復雜算法的智能計算的效果”。為此,很多學者曾討論過一個重要話題——“大數(shù)據(jù)時代需要的是更多的數(shù)據(jù)還是更好的模型?”
機器翻譯是傳統(tǒng)自然語言技術領域的難點,雖曾提出過很多種算法,但應用效果并不理想。IBM 有能力將《人民日報》歷年的文本輸入電腦,試圖破譯中文的語言結構。
例如,實現(xiàn)中文的語音輸入或者中英互譯,這項技術在 20 世紀 90 年代就取得突破,但進展緩慢,在應用中還是有很多問題。近年來,Google 翻譯等工具改變了“實現(xiàn)策略”,不再依靠復雜算法進行翻譯,而是通過對他們之前收集的跨語言語料庫進行簡單查詢的方式,提升了機器翻譯的效果和效率。
他們并不教給電腦所有的語言規(guī)則,而是讓電腦自己去發(fā)現(xiàn)這些規(guī)則。電腦通過分析經(jīng)過人工翻譯的數(shù)以千萬計的文件來發(fā)現(xiàn)其中的規(guī)則。這些翻譯結果源自圖書、各種機構(如聯(lián)合國)及世界各地的網(wǎng)站。
他們的電腦會掃描這些語篇,從中尋找在統(tǒng)計學上非常重要的模式,即翻譯結果和原文之間并非偶然產生的模式。一旦電腦找到了這些模式,今后它就能使用這些模式來翻譯其他類似的語篇。
通過數(shù)十億次重復使用,就會得出數(shù)十億種模式及一個異常聰明的電腦程序。但是對于某些語言來說,他們能夠使用到的已翻譯完成的語篇非常少,因此 Google 的軟件所探測到的模式就相對很少。這就是為什么 Google 的翻譯質量會因語言對的不同而不同。
通過不斷向電腦提供新的翻譯語篇,Google 就能讓電腦更加聰明,翻譯結果更加準確。
對管理目標的新認識:從業(yè)務數(shù)據(jù)化到數(shù)據(jù)業(yè)務化
在傳統(tǒng)數(shù)據(jù)管理中,企業(yè)更加關注的是業(yè)務的數(shù)據(jù)化問題,即如何將業(yè)務活動以數(shù)據(jù)方式記錄下來,以便進行業(yè)務審計、分析與挖掘。
在大數(shù)據(jù)時代,企業(yè)需要重視一個新的課題——數(shù)據(jù)業(yè)務化,即如何“基于數(shù)據(jù)”動態(tài)地定義、優(yōu)化和重組業(yè)務及其流程,進而提升業(yè)務的敏捷性,降低風險和成本。業(yè)務數(shù)據(jù)化是前提,而數(shù)據(jù)業(yè)務化是目標。
電商的經(jīng)營模式與實體店最本質的區(qū)別是,電商每賣出一件產品,都會留存一條詳盡的數(shù)據(jù)記錄。也正是因為可以用數(shù)字化的形式保留每一筆銷售的明細,電商可以清楚地掌握每一件商品到底賣給了誰。
此外,依托互聯(lián)網(wǎng)這個平臺,電商還可以記錄每一個消費者的鼠標單擊記錄、網(wǎng)上搜索記錄。所有這些記錄形成了一個關于消費者行為的實時數(shù)據(jù)閉環(huán),通過這個閉環(huán)中源源不斷產生的新鮮數(shù)據(jù),電商可以更好地洞察消費者,更及時地預測其需求的變化,經(jīng)營者和消費者之間因此產生了很強的黏性。
線下實體商店很難做到這一點,他們可能只知道一個省、一個市或者一個地區(qū)賣了多少商品,但是,他們很難了解到所生產、經(jīng)營的每一件商品究竟賣到了哪一個具體的地方、哪一個具體的人,這個人還買了其他什么東西、查看了哪些商品、可能會喜歡什么樣的商品。
也就是說,線下實體店即使收集了一些數(shù)據(jù),但其數(shù)據(jù)的粒度、寬度、廣度和深度都非常有限。由于缺乏足夠的數(shù)據(jù),實體店對自己的經(jīng)營行為,對消費者的洞察力,以及和消費者之間的黏性都十分有限。
就此而言,一家電商和一家線下實體店最本質的區(qū)別就是是否保存了足夠的數(shù)據(jù)。其實,這正是互聯(lián)網(wǎng)化的核心和本質,即“數(shù)據(jù)化”。這并不是一個簡單的數(shù)據(jù)化,而是所有業(yè)務的過程都要數(shù)據(jù)化,即把所有的業(yè)務過程記錄下來,形成一個數(shù)據(jù)的閉環(huán),這個閉環(huán)的實時性和效率是關鍵的指標。這個思想就是一切業(yè)務都要數(shù)據(jù)化。
在大數(shù)據(jù)時代,企業(yè)不僅僅是把業(yè)務數(shù)據(jù)化,更重要的是把數(shù)據(jù)業(yè)務化,也就是把數(shù)據(jù)作為直接生產力,將數(shù)據(jù)價值直接通過前臺產品作用于消費者。
數(shù)據(jù)可以反映用戶過去的行為軌跡,也可以預測用戶將來的行為傾向。比較好理解的一個實例就是關聯(lián)推薦,當用戶買了一個商品之后,可以給用戶推薦一個最有可能再買的商品。個性化是數(shù)據(jù)作為直接生產力的一個具體體現(xiàn)。
隨著數(shù)據(jù)分析工具與數(shù)據(jù)挖掘渠道的日益豐富與多樣化,數(shù)據(jù)存量越來越大,數(shù)據(jù)對企業(yè)也越來越重要。數(shù)據(jù)業(yè)務化能夠給企業(yè)帶來的業(yè)務價值主要包括以下幾點:提高生產過程的資源利用率,降低生產成本;根據(jù)商業(yè)分析提高商業(yè)智能的準確率,降低傳統(tǒng)“憑感覺”做決策的業(yè)務風險;動態(tài)價格優(yōu)化利潤和增長;獲取優(yōu)質客戶。
目前,越來越多的企業(yè)級用戶已經(jīng)考慮從批量分析向近實時分析發(fā)展,從而提高 IT 創(chuàng)造價值的能力。同時,數(shù)據(jù)分析在快速從商業(yè)智能向用戶智能發(fā)展。數(shù)據(jù)業(yè)務化可以讓數(shù)據(jù)給企業(yè)創(chuàng)造額外收益和價值。
對決策方式的新認識:從目標驅動型到數(shù)據(jù)驅動型
傳統(tǒng)科學思維中,決策制定往往是“目標”或“模型”驅動的,也就是根據(jù)目標(或模型)進行決策。然而,大數(shù)據(jù)時代出現(xiàn)了另一種思維模式,即數(shù)據(jù)驅動型決策,數(shù)據(jù)成為決策制定的主要“觸發(fā)條件”和“重要依據(jù)”。
小數(shù)據(jù)時代,企業(yè)討論什么事情該做不該做,許多時候是憑感覺來決策的,流程如圖 3 所示,由兩個環(huán)節(jié)組成:一個是拍腦袋,另一個是研發(fā)功能。
圖 3? 產品迭代的錯誤流程
基本上就是產品經(jīng)理通過一些調研,想了一個功能,做了設計。下一步就是把這個功能研發(fā)出來,然后看一下效果如何,再做下一步。
整個過程都是憑一些感覺來決策。這種方式總是會出現(xiàn)問題,很容易走一些彎路,很有可能做出錯誤的決定。
數(shù)據(jù)驅動型決策加入了數(shù)據(jù)分析環(huán)節(jié),如圖 4 所示。
基本流程就是企業(yè)有一些點子,通過點子去研發(fā)這些功能,之后要進行數(shù)據(jù)收集,然后進行數(shù)據(jù)分析。基于數(shù)據(jù)分析得到一些結論,然后基于這些結論,再去進行下一步的研發(fā)。整個過程就形成了一個循環(huán)。在這種決策流程中,人為的因素影響越來越少,而主要是用一種科學的方法來進行產品的迭代。
圖 4? 數(shù)據(jù)驅動的產品迭代流程
例如,一個產品的界面到底是綠色背景好還是藍色背景好,從設計的層面考慮,兩者是都有可能的。那么就可以做一下 A/B 測試。
可以讓 50% 的人顯示綠色背景,50% 的人顯示藍色背景,然后看用戶點擊量。哪個點擊比較多,就選擇哪個。這就是數(shù)據(jù)驅動,這樣就轉變成不是憑感覺,而是通過數(shù)據(jù)去決策。
相比于基于本能、假設或認知偏見而做出的決策,基于證據(jù)的決策更可靠。通過數(shù)據(jù)驅動的方法,企業(yè)能夠判斷趨勢,從而展開有效行動,幫助自己發(fā)現(xiàn)問題,推動創(chuàng)新或解決方案的出現(xiàn)。
對產業(yè)競合關系的新認識:從以戰(zhàn)略為中心到以數(shù)據(jù)為中心
在大數(shù)據(jù)時代,企業(yè)之間的競合關系發(fā)生了變化,原本相互競爭,甚至不愿合作的企業(yè),不得不開始合作,形成新的業(yè)態(tài)和產業(yè)鏈。
所謂競合關系,即在競爭中合作,在合作中競爭。它的核心思想主要體現(xiàn)在兩個方面:創(chuàng)造價值與爭奪價值。創(chuàng)造價值是個體之間相互合作、共創(chuàng)價值的過程;爭奪價值則是個體之間相互競爭、分享價值的過程。
競合的思想就是要求所有參與者共同把蛋糕做大,每個參與者最終分得的部分都會相應增加。
傳統(tǒng)的競合關系以戰(zhàn)略為中心,德國寶馬汽車公司和戴姆勒公司旗下的奔馳品牌在整車制造領域存在著品牌競爭,但雙方不僅共同開發(fā)、生產及采購汽車零部件,而且在混合動力技術——領域進行研究合作。
為了能夠在激烈的市場競爭中獲取優(yōu)勢,兩家公司通過競合戰(zhàn)略,互通有無、共享資源,從而在汽車業(yè)整體利潤下滑的趨勢下獲得相對較好的收益,最終取得雙贏。
在大數(shù)據(jù)時代,競合關系是以數(shù)據(jù)為中心的。數(shù)據(jù)產業(yè)就是從信息化過程累積的數(shù)據(jù)資源中提取有用信息進行創(chuàng)新,并將這些數(shù)據(jù)創(chuàng)新賦予商業(yè)模式。
這種由大數(shù)據(jù)創(chuàng)新所驅動的產業(yè)化過程具有“提升其他產業(yè)利潤”的特征,除了能探索新的價值發(fā)現(xiàn)、創(chuàng)造與獲取方式以謀求本身發(fā)展外,還能幫助傳統(tǒng)產業(yè)突破瓶頸、升級轉型,是一種新的競合關系,而非一般觀點的“新興科技催生的經(jīng)濟業(yè)態(tài)與原有經(jīng)濟業(yè)態(tài)存在競爭關系”。
所以,數(shù)據(jù)產業(yè)培育圍繞傳統(tǒng)經(jīng)濟升級轉型,依附傳統(tǒng)行業(yè)企業(yè)共生發(fā)展,是最好的發(fā)展策略。例如,近年來發(fā)展火熱的團購,就是數(shù)據(jù)產業(yè)幫助傳統(tǒng)餐飲業(yè)、旅游業(yè)和交通行業(yè)的升級轉型。提供團購業(yè)務的企業(yè)在獲得收益的同時,也提高了其他傳統(tǒng)行業(yè)的效益。
但是,傳統(tǒng)企業(yè)與團購企業(yè)也存在著一定的競爭關系。傳統(tǒng)企業(yè)在與團購企業(yè)合作的過程中,也盡力防止自己的線下業(yè)務全部轉為自己不能掌控的團購企業(yè)。
團購網(wǎng)站為了能獲得更廣的用戶群、更大的流量來提升自己的市場地位,除了自身擴展商戶和培養(yǎng)網(wǎng)民習慣之外,還紛紛采取了合縱連橫的發(fā)展戰(zhàn)略。
聚劃算、京東團購、當當團購、58 團購等紛紛開放平臺,吸引了千品網(wǎng)、高朋、滿座、窩窩等團購網(wǎng)站的入駐,投奔平臺正在成為行業(yè)共識。
對于獨立團購網(wǎng)站來說,入駐電商平臺不僅能帶來流量,電商平臺在實物銷售上的積累對其實物團購也有一定的促進作用。
對數(shù)據(jù)復雜性的新認識:從不接受到接受數(shù)據(jù)的復雜性
在傳統(tǒng)科學看來,數(shù)據(jù)需要徹底“凈化”和“集成”,計算目的是需要找出“精確答案”,而其背后的哲學是“不接受數(shù)據(jù)的復雜性”。
然而,大數(shù)據(jù)中更加強調的是數(shù)據(jù)的動態(tài)性、異構性和跨域等復雜性,開始把“復雜性”當作數(shù)據(jù)的一個固有特征來對待,組織數(shù)據(jù)生態(tài)系統(tǒng)的管理目標開始轉向將組織處于混沌邊緣狀態(tài)。
在小數(shù)據(jù)時代,對于數(shù)據(jù)的存儲與檢索一直依賴于分類法和索引法的機制,這種機制是以預設場域為前提的。這種結構化數(shù)據(jù)庫的預設場域能夠卓越地展示數(shù)據(jù)的整齊排列與準確存儲,與追求數(shù)據(jù)的精確性目標是完全一致的。
在數(shù)據(jù)稀缺與問題清晰的年代,這種基于預設的結構化數(shù)據(jù)庫能夠有效地回答人們的問題,并且這種數(shù)據(jù)庫在不同的時間能夠提供一致的結果。
面對大數(shù)據(jù),數(shù)據(jù)的海量、混雜等特征會使預設的數(shù)據(jù)庫系統(tǒng)崩潰。其實,數(shù)據(jù)的紛繁雜亂才真正呈現(xiàn)出世界的復雜性和不確定性特征,想要獲得大數(shù)據(jù)的價值,承認混亂而不是避免混亂才是一種可行的路徑。
為此,伴隨著大數(shù)據(jù)的涌現(xiàn),出現(xiàn)了非關系型數(shù)據(jù)庫,它不需要預先設定記錄結構,而且允許處理各種各樣形形色色參差不齊的數(shù)據(jù)。
因為包容了結構的多樣性,這些無須預設的非關系型數(shù)據(jù)庫設計能夠處理和存儲更多的數(shù)據(jù),成為大數(shù)據(jù)時代的重要應對手段。
在大數(shù)據(jù)時代,海量數(shù)據(jù)的涌現(xiàn)一定會增加數(shù)據(jù)的混亂性且會造成結果的不準確性,如果仍然依循準確性,那么將無法應對這個新的時代。
大數(shù)據(jù)通常都用概率說話,與數(shù)據(jù)的混雜性可能帶來的結果錯誤性相比,數(shù)據(jù)量的擴張帶給我們的新洞察、新趨勢和新價值更有意義。
因此,與致力于避免錯誤相比,對錯誤的包容將會帶給我們更多信息。其實,允許數(shù)據(jù)的混雜性和容許結果的不精確性才是我們擁抱大數(shù)據(jù)的正確態(tài)度,未來我們應當習慣這種思維。
對數(shù)據(jù)處理模式的新認識:從小眾參與到大眾協(xié)同
在傳統(tǒng)科學中,數(shù)據(jù)的分析和挖掘都是具有很高專業(yè)素養(yǎng)的“企業(yè)核心員工”的事情,企業(yè)管理的重要目的是如何激勵和考核這些“核心員工”。
但是,在大數(shù)據(jù)時代,基于“核心員工”的創(chuàng)新工作成本和風險越來越大,而基于“專家余(Pro-AmT 的大規(guī)模協(xié)作日益受到重視,正成為解決數(shù)據(jù)規(guī)模與形式化之間矛盾的重要手段。
大規(guī)模生產讓數(shù)以百計的人買得起商品,但商品本身卻是一模一樣的。
企業(yè)面臨這樣一個矛盾:定制化的產品更能滿足用戶的需求,但卻非常昂貴;與此同時,量產化的商品價格低廉,但無法完全滿足用戶的需求。
如果能夠做到大規(guī)模定制,為大量用戶定制產品和服務,則能使產品成本低,又兼具個性化,從而使企業(yè)有能力滿足要求,但價格又不至于像手工制作那般讓人無法承擔。
因此,在企業(yè)可以負擔得起大規(guī)模定制帶來的高成本的前提下,要真正做到個性化產品和服務,就必須對用戶需求有很好的了解,這就需要用戶提前參與到產品設計中。
在大數(shù)據(jù)時代,用戶不再僅僅熱衷于消費,他們更樂于參與到產品的創(chuàng)造過程中,大數(shù)據(jù)技術讓用戶參與創(chuàng)造與分享成果的需求得到實現(xiàn)。
市場上傳統(tǒng)的著名品牌越來越重視從用戶的反饋中改進產品的后續(xù)設計和提高用戶體驗,例如,“小米”這樣的新興品牌建立了互聯(lián)網(wǎng)用戶粉絲論壇,讓用戶直接參與到新產品的設計過程之中,充分發(fā)揮用戶豐富的想象力,企業(yè)也能直接了解他們的需求。
大眾協(xié)同的另一個方面就是企業(yè)可以利用用戶完成數(shù)據(jù)的采集,如實時車輛交通數(shù)據(jù)采集商 Inrix。該公司目前有一億個手機端用戶,Inrix 的軟件可以幫助用戶避開堵車,為用戶呈現(xiàn)路的熱量圖。
提供數(shù)據(jù)并不是這個產品的特色,但值得一提的是,Inrix 并沒有用交警的數(shù)據(jù),這個軟件的每位用戶在使用過程中會給服務器發(fā)送實時數(shù)據(jù),如速度和位置,這樣每個用戶都是探測器。使用該服務的用戶越多,Inrix 獲得的數(shù)據(jù)就越多,從而可以提供更好的服務。
轉自:http://www.ryxxff.com/9267.html
總結
以上是生活随笔為你收集整理的大数据时代的10个重大变化(长篇神文)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java77-GUL下拉菜单框和滚动条
- 下一篇: Velocity模板语言VTL