火热的数据中台对企业的价值是什么?
數(shù)據(jù)實際上是一個非常傳統(tǒng)的行業(yè)。
?
有軟件開始的那一天起,數(shù)據(jù)這個行業(yè)就存在了。比如說原來最早的時候,有非常多的數(shù)據(jù)報表數(shù)據(jù)可視化,然后到后來,有了商業(yè)智能,有了Data Warehouse(就是數(shù)據(jù)倉庫),然后數(shù)據(jù)挖掘,并且在數(shù)據(jù)這個行業(yè)里面是有非常多的巨頭的,比如teradata、cognos,biee、microstrategy等。
?
數(shù)據(jù)這個行業(yè)不僅僅是軟件,它還有管理的部分,也就是說數(shù)據(jù)治理,即如何讓企業(yè)的數(shù)據(jù)治理的質(zhì)量更好。所以數(shù)據(jù)這個行業(yè)本身是一個非常傳統(tǒng)的行業(yè)。每個大型一點的企業(yè)都有自己的數(shù)據(jù)分析部門,數(shù)據(jù)倉庫部門。
?
那么為什么數(shù)據(jù)湖也好,數(shù)據(jù)平臺也好,在過去都沒有像今年數(shù)據(jù)中臺這么熱門。而且關(guān)注數(shù)據(jù)中臺的還不僅僅是技術(shù)部門,很多都是業(yè)務(wù)部門。那么業(yè)務(wù)部門為什么這么熱衷于數(shù)據(jù)中臺,業(yè)務(wù)部門以前不是特別關(guān)注這些技術(shù)的數(shù)據(jù)平臺和這些技術(shù)的概念。
?
大概在04,05年,我就開始從事一些跟數(shù)據(jù)相關(guān)的工作,在06年的時候做過一個數(shù)據(jù)倉庫的項目。
講到數(shù)據(jù)中臺,我們就要提到平臺化。我們現(xiàn)在所講的SAAS也好,所講的PAAS也好,所講的數(shù)據(jù)中臺也好,所講的業(yè)務(wù)中臺也好,它實際上根本的思想來源是來自于平臺化,就是Platform
平臺化的概念
舉個例子,我們拿一個飲料廠的產(chǎn)品線來講,那么他可以生產(chǎn)果汁,可以生產(chǎn)飲料,還可以生產(chǎn)其他的產(chǎn)品,它可能是三四條不同的生產(chǎn)線。從原材料加工成飲料,它有很多環(huán)節(jié),雖然品種不一樣,但是它很多環(huán)節(jié)是類似的,比如裝瓶、攪拌。
?
那么這幾個不同的生產(chǎn)流程、生產(chǎn)線,我們可以把那些公共的部分合并起來,更加專業(yè)化,然后并且讓他們獨立去維護,之后把那些不同的產(chǎn)品面向客戶,使客戶體驗不同的產(chǎn)品,使它獨立出來,這就是平臺化的思路。
所以,平臺化的思路很重要的就是把那些有共性的資源,有共性的能力合并在一起,然后把那些面向客戶的價值獨立出來。
?
這樣的話,專業(yè)的人做專業(yè)的事情,并且對于企業(yè)的績效也非常的有利,不揉在一塊了,更加的清晰,所以這就是平臺化的思路。
?
那么不管什么中臺,它實際上都是平臺思想的一個體現(xiàn),一種具象。
所以從軟件角度來看,那么這個圖是十幾年前,所謂的EAI,即企業(yè)應(yīng)用集成。
?
最早的時候企業(yè)的應(yīng)用集成是一種點對點的形式,以前沒有前后臺之分,比如說所有的業(yè)務(wù)系統(tǒng)可能最后都要結(jié)賬,都要算賬,那就叫財務(wù)系統(tǒng)。然后所有的財務(wù)系統(tǒng)在結(jié)賬的時候,WBS code,我們所講的項目編碼,叫項目系統(tǒng)。所以這樣的話在這里面有很多的系統(tǒng),它的功能要被多個其他的系統(tǒng)所調(diào)用,原來的網(wǎng)狀點對點集成結(jié)構(gòu)很復(fù)雜而且一團麻,摩擦非常多,經(jīng)常搞不清楚,數(shù)據(jù)不統(tǒng)一、規(guī)則也不一致。
?
這種情況下,平臺化思路怎么解決?
?
以前我們稱ESB,為企業(yè)的服務(wù)總線,然后將多個服務(wù),用SOA的方式,把多個這種會復(fù)用的服務(wù),抽象出來,變成企業(yè)級的service。ESB上可以提供其他的服務(wù)消費者所調(diào)用。中間的ESB,實際上它也是一個平臺。所以平臺化的優(yōu)勢就是能力復(fù)用,減少摩擦。
?
所有的這種無論是你的信息技術(shù)系統(tǒng)還是業(yè)務(wù)系統(tǒng),只要它能夠抽象出來,能夠被復(fù)用,則復(fù)用的這一層,那我們都可以把它理解為是中臺。
?
中臺是介于前臺和后臺之間的一個系統(tǒng)。那么后臺實際上對我們現(xiàn)在來講的話,大部分情況下指的就是企業(yè)里的SAP,后臺的財務(wù),hr系統(tǒng),客戶距離市場跟進的系統(tǒng)。
?
中臺里面很重要的兩個中臺,一個是業(yè)務(wù)中臺,一個是數(shù)據(jù)中臺。業(yè)務(wù)中臺是提供可復(fù)用的業(yè)務(wù),API數(shù)據(jù)中臺是提供數(shù)據(jù)洞察和智能的。
?
我們前面介紹了一下背景,從平臺化到中臺,我們下面進入到數(shù)據(jù)中臺。
數(shù)據(jù)中臺為什么這么火?
數(shù)據(jù)中臺和傳統(tǒng)的數(shù)據(jù)系統(tǒng)出發(fā)點不一樣
這里舉個例子,原來的數(shù)據(jù)平臺也好,數(shù)據(jù)湖也好,數(shù)據(jù)倉庫也好,它們的出發(fā)點很多時候有局限性,應(yīng)該說更是一個支撐性的技術(shù)系統(tǒng),即一定要去考慮我先有什么數(shù)據(jù),然后我能干什么,這是傳統(tǒng)的數(shù)據(jù)平臺,數(shù)據(jù)湖,依賴于現(xiàn)有數(shù)據(jù)的質(zhì)量,現(xiàn)有數(shù)據(jù)的狀況來做的這樣的一個支撐性的技術(shù)平臺。
?
但是數(shù)據(jù)中臺在我們現(xiàn)在所講的概念里面,它更多的是從業(yè)務(wù)出發(fā),比如說我們現(xiàn)在所設(shè)計的一套精益數(shù)據(jù)的方法,它就是從業(yè)務(wù)出發(fā),一開始都不用看你系統(tǒng)里面有什么數(shù)據(jù),重點的是去解決你的業(yè)務(wù)需要什么樣的數(shù)據(jù)服務(wù)?
?
作為第一出發(fā)點,作為切入點。然后再來看這些業(yè)務(wù),你需要這些數(shù)據(jù)服務(wù),它有什么價值?至于說這些數(shù)據(jù)服務(wù)所依賴的數(shù)據(jù)有沒有,那是我們的實現(xiàn)方式,只要這個服務(wù)有價值,那我們就去想辦法去拿到數(shù)據(jù),如果沒有能力,我們?nèi)ソ夹g(shù)能力,去完成數(shù)據(jù)服務(wù)的提供。
?
所以數(shù)據(jù)中臺最重要區(qū)別于傳統(tǒng)數(shù)據(jù)平臺,技術(shù)類平臺的區(qū)別在于數(shù)據(jù)中臺的思維是業(yè)務(wù)思維,他從業(yè)務(wù)問題出發(fā),這也就是為什么業(yè)務(wù)部門對數(shù)據(jù)中臺會這么歡迎。
我們的目標(biāo)是哪怕我的數(shù)據(jù)只有50%的準(zhǔn)確性,那么在我提高數(shù)據(jù)質(zhì)量同時,我也希望這50%準(zhǔn)確的數(shù)據(jù)也能為我產(chǎn)生業(yè)務(wù)價值。
?
這句話是我們現(xiàn)在正在嘗試的,也是用來做的。
在過去,業(yè)務(wù)部門跟技術(shù)部門同數(shù)據(jù)倉庫的人提需求,數(shù)據(jù)倉庫的人說不行,沒有數(shù)據(jù),數(shù)據(jù)質(zhì)量不好,現(xiàn)在做不到,現(xiàn)在我們只有這些數(shù)據(jù),然后看看在這些數(shù)據(jù)里面,你們能干點啥,這是原來的思路。
?
但是我們所講的數(shù)據(jù)中臺指的是業(yè)務(wù)需要什么,我們就用數(shù)據(jù)中臺提供什么,哪怕說現(xiàn)在可能你連數(shù)據(jù)庫都沒有,但是只要業(yè)務(wù)需要這樣的數(shù)據(jù)服務(wù),我們手工的去錄入構(gòu)建這樣的一個API也要讓它實現(xiàn),也要為業(yè)務(wù)產(chǎn)生價值。然后慢慢的我們再來完善數(shù)據(jù)服務(wù),把它自動化。
?
所以這就是我們所講的業(yè)務(wù)中臺第一個最大的區(qū)別,一定是從業(yè)務(wù)價值出發(fā),所以業(yè)務(wù)部門過去這么多年里,實際上對數(shù)據(jù)的需求和業(yè)務(wù)的需求從來沒有發(fā)生過變化。從來沒有說原來因為數(shù)據(jù)平臺沒有數(shù)據(jù)中臺的概念,所以我提的需求少一點。業(yè)務(wù)對于數(shù)據(jù)的需求沒有變化,但是它需要一種新的思維方式,一種新的技術(shù)平臺,幫他去快速解決從數(shù)據(jù)到業(yè)務(wù)價值到業(yè)務(wù)服務(wù)的這個過程。所以這是第一點,數(shù)據(jù)中臺是面向業(yè)務(wù)的,它不依賴于你現(xiàn)在數(shù)據(jù)中臺的建設(shè)方法,不依賴于你現(xiàn)在有什么數(shù)據(jù)。
度量不同
為什么在過去我們所講的數(shù)據(jù)治理這么火,而現(xiàn)在,實際上我們越來越覺得數(shù)據(jù)治理可能是一種企業(yè)級的大而全的數(shù)據(jù)治理,但這可能是個偽命題,因為它數(shù)據(jù)質(zhì)量是不可能同你的真實的業(yè)務(wù)百分之百一致。但是數(shù)據(jù)的系統(tǒng)數(shù)據(jù)平臺,數(shù)據(jù)倉庫,很多時候是以你的數(shù)據(jù)質(zhì)量作為度量標(biāo)準(zhǔn)的,即現(xiàn)在這個數(shù)據(jù)平臺存儲了多少數(shù)據(jù),數(shù)據(jù)報表開發(fā)了多少張報表,這個是你的價值。但是在數(shù)據(jù)中臺層面上,我們所講的數(shù)據(jù)中臺的價值度量,是它為你的業(yè)務(wù)提供了多少有價值的數(shù)據(jù)服務(wù)。至于說這個數(shù)據(jù)服務(wù)后面的數(shù)據(jù)質(zhì)量可能不是那么的好,但是只要它能夠給業(yè)務(wù)帶來價值,這個就是好的數(shù)據(jù)服務(wù)。
?
?
所以我們很快地拆解一下,從數(shù)據(jù)中臺這四個字上來看,實際上它也能夠快速的讓我們大家理解什么是數(shù)據(jù)中臺,首先是數(shù)據(jù),數(shù)據(jù)讓業(yè)務(wù)更智慧。數(shù)據(jù)中臺提供數(shù)據(jù)分析,數(shù)據(jù)挖掘,將數(shù)據(jù)提供給前臺,是以數(shù)據(jù)為核心,它介于前臺與后臺之間。
?
在某種角度上來講,大家會問是不是也會有數(shù)據(jù)后臺?
?
是的,在有的維度里面,我們把傳統(tǒng)的數(shù)據(jù)湖作為數(shù)據(jù)后臺,前臺中也有數(shù)據(jù),提供消費數(shù)據(jù)服務(wù)的就是數(shù)據(jù)前臺。中臺是為多個業(yè)務(wù)系統(tǒng)提供服務(wù)的,能夠使一個系統(tǒng)變成一個數(shù)據(jù)服務(wù)的生態(tài),它是不斷演進的。
?
用一句話來概括數(shù)據(jù)中臺,我們把數(shù)據(jù)中臺理解為是企業(yè)的數(shù)據(jù)服務(wù)工廠。所謂的數(shù)據(jù)服務(wù)工廠在我看來,以后所有的企業(yè)中的本質(zhì)就是加工處理數(shù)據(jù),產(chǎn)生數(shù)字化世界里的產(chǎn)品,然后把它連接到物理世界,生產(chǎn)出來,銷售出去。所以數(shù)據(jù)中臺對企業(yè)來講,它是數(shù)據(jù)服務(wù)的工廠。
過去那么多年,建設(shè)的系統(tǒng)是把業(yè)務(wù)數(shù)據(jù)化,現(xiàn)在我們很多的企業(yè)在后臺系統(tǒng)建設(shè)好以后,在做的業(yè)務(wù)系統(tǒng)實際上是把數(shù)據(jù)業(yè)務(wù)化,而且有一點也是我們現(xiàn)在行業(yè)里面重點強調(diào)的,原來我們講先有業(yè)務(wù),后有數(shù)據(jù),先有應(yīng)用系統(tǒng),后有數(shù)據(jù)系統(tǒng),這個觀點從今年開始要發(fā)生改變了,在業(yè)務(wù)系統(tǒng)還沒有建立起來的時候,我們就要有數(shù)據(jù)思維,就要把數(shù)據(jù)集成到業(yè)務(wù)系統(tǒng)的架構(gòu)里面去。
?
?
原來我們所講的業(yè)務(wù)系統(tǒng)叫OLTP,即在線交易系統(tǒng),然后數(shù)據(jù)類的系統(tǒng)叫OLAP,即在線分析性系統(tǒng)。
?
現(xiàn)在可以看到一個趨勢,這個趨勢就是OLTP和OLAP在融合,也就是很多企業(yè)所講的P流一體,即為批處理和實時流數(shù)據(jù)處理一體化。原來我們的OLTP、OLAP是平行的關(guān)系,先要通過OLTP系統(tǒng)產(chǎn)生數(shù)據(jù),然后ETL,然后抽取到OLAP里面,再把多個OLTP的系統(tǒng)抽在一起,之后在OLTP、OLAP的系統(tǒng)里面產(chǎn)生洞見,變成數(shù)據(jù)可視化報表給業(yè)務(wù)部門去看,再去改變你的OLTP的做法,這里的OLTP和OLAP是平行的關(guān)系。
?
我們現(xiàn)在提到得是OLAP和OLAP的融合,每個業(yè)務(wù)系統(tǒng)都會需要都會趨于具有大數(shù)據(jù)處理能力,智慧能力的交易系統(tǒng),之前把它叫做在線交易系統(tǒng)和在線分析系統(tǒng),我們現(xiàn)在把它叫做在線分析型交易系統(tǒng),它是有跨域的,有歷史的集成數(shù)據(jù)分析交易系統(tǒng)。
?
這樣的話,原來的數(shù)據(jù)百分之七八十在企業(yè)里的應(yīng)用都是數(shù)據(jù)可視化,都是BI,都是data house報表,讓人看,這叫人機接口,這個是人看完數(shù)據(jù)以后,然后再去提取,之后去做你的決策,改變你的行為,去看數(shù)據(jù)。
?
從今年開始,數(shù)據(jù)中臺更多強調(diào)的是機器與機器的接口,就是我的數(shù)據(jù)分析出來的結(jié)果,不僅僅以報表可視化的形式讓人看,而更多的是把這些API這樣的一些數(shù)據(jù)服務(wù)直接地嵌入到交易系統(tǒng)里面產(chǎn)生影響,變成你的價格策略,變成你的推薦引擎,變成你的風(fēng)險管控。
?
那么我們所講數(shù)據(jù)中臺,它不僅僅是一個技術(shù)平臺,它還是一個體系。
?
數(shù)據(jù)中臺會對應(yīng)到一個企業(yè)里的一個部門一個組織,也要有數(shù)據(jù)戰(zhàn)略的支撐,要有數(shù)據(jù)治理,數(shù)據(jù)中臺上面生長一個數(shù)據(jù)服務(wù),數(shù)據(jù)服務(wù)提供給我們業(yè)務(wù)系統(tǒng),提供給我們業(yè)務(wù)中臺,然后我們所接收到的數(shù)據(jù)消費者,就都生長在數(shù)據(jù)中臺之上,數(shù)據(jù)中臺是一個生態(tài),是一個平臺,是一個數(shù)據(jù)服務(wù),是生產(chǎn)、加工、交易、度量、運營的平臺,所以我們把數(shù)據(jù)中臺實際上叫做一個體系。?
這張圖,我們認為未來所有的企業(yè)都是一個數(shù)據(jù)工廠,看上去現(xiàn)在華為在生產(chǎn)的是手機、電腦、電信設(shè)備,但是只要他掌握了用戶的數(shù)據(jù),B端、C端,它知道用戶喜歡什么,行為模式,消費模式,它完全可以在現(xiàn)有的用戶數(shù)據(jù)基礎(chǔ)上開發(fā)出產(chǎn)品,然后至于說這個產(chǎn)品可能是農(nóng)業(yè)的,可能是汽車的,然后它快速的把用戶產(chǎn)品的畫像連接到供應(yīng)鏈上,讓行業(yè)里幫它生產(chǎn)出這樣的產(chǎn)品。所以未來的企業(yè)都會是數(shù)據(jù)工廠,都是加工生產(chǎn)數(shù)據(jù)的工廠。
?
這樣的一個數(shù)據(jù)工廠需要什么東西,需要什么樣的結(jié)構(gòu),我們可以看到它需要有數(shù)據(jù)員,就是原材料的加工,然后把原材料取過來過磅,原材料經(jīng)過質(zhì)檢檢驗,進入到原材料倉庫,這就是我們所講的數(shù)據(jù)湖。然后不同的數(shù)據(jù)產(chǎn)品它會有不同的生產(chǎn)線,這就是我們所講的data plan數(shù)據(jù)流水線,然后數(shù)據(jù)流水線生產(chǎn)出數(shù)據(jù)服務(wù),這個數(shù)據(jù)模型就放到數(shù)據(jù)集市里面,它就是半成品的數(shù)據(jù)的服務(wù)。
?
生產(chǎn)數(shù)據(jù)的廠房會有創(chuàng)新實驗室,專門研發(fā)新產(chǎn)品,會有治理數(shù)據(jù)的管理辦公室,去保證工廠整個運營的效率,也有控制中心,監(jiān)控中心,保證整個data pipeline、數(shù)據(jù)處理的性能,安全性和穩(wěn)定性,然后最頂上是你的數(shù)據(jù)服務(wù)商店,把這個數(shù)據(jù)產(chǎn)品,一個一個的數(shù)據(jù)服務(wù),一個一個的智能模型,算法模型放到這個商店里面,供數(shù)據(jù)消費者去調(diào)用和使用,所以我們把這個理解為成廣義的數(shù)據(jù)中臺。
數(shù)據(jù)中臺對企業(yè)的價值
應(yīng)用開發(fā)要快于數(shù)據(jù)開發(fā)的速度
原來我們在做一張報表,或者是在業(yè)務(wù)系統(tǒng)里面需要查詢一個數(shù)據(jù)結(jié)果的時候,它的過程是比較麻煩的,而且它的測試往往也是比較復(fù)雜的,因為業(yè)務(wù)系統(tǒng)是有業(yè)務(wù)屬性的,但是數(shù)據(jù)是跨業(yè)務(wù)的,是融合的。在OLAP領(lǐng)域中,很多這種情況,比如說我的企業(yè),Java開發(fā)工程師很好找,做應(yīng)用的人很好找,懂data,知道如何做數(shù)據(jù)建模,如何做算法的人相對來講是比較少的。但是在我們應(yīng)用開發(fā)過程當(dāng)中,我們會發(fā)現(xiàn)有太多的數(shù)據(jù)需求,這種情況下應(yīng)用開發(fā)的速度是快于數(shù)據(jù)開發(fā)的速度。
加速從數(shù)據(jù)到價值的服務(wù)產(chǎn)生過程
在很多時候我們會發(fā)現(xiàn)不同的應(yīng)用開發(fā)項目組,他們都會調(diào)用同樣的數(shù)據(jù)模型,同樣的數(shù)據(jù)服務(wù),但是由于不了解數(shù)據(jù),并且他們也不知道底層的數(shù)據(jù)結(jié)構(gòu),所以他們不同的項目組可能對同樣的數(shù)據(jù)處理會用不同的方法,自己做自己的,然后出來的結(jié)果不一樣。有的是錯誤的,所以開發(fā)速度慢,并且數(shù)據(jù)結(jié)果不準(zhǔn)確,質(zhì)量低,這就是過去應(yīng)用開發(fā)和數(shù)據(jù)開發(fā)所面臨的矛盾。
?
但是現(xiàn)在數(shù)據(jù)中臺就要解決這個問題,數(shù)據(jù)中臺要把那些復(fù)用的數(shù)據(jù)模型,要把那些數(shù)據(jù)模型data派對中一些數(shù)據(jù)復(fù)用的能力,變成一個數(shù)據(jù)的能力平臺,讓那些做數(shù)據(jù)的人專注在做數(shù)據(jù),把數(shù)據(jù)變成一個樂高積木,數(shù)據(jù)服務(wù)提供給應(yīng)用開發(fā),然后不同的應(yīng)用開發(fā)項目組可以共同的去調(diào)用唯一的SARS數(shù)據(jù)服務(wù),去保證它的數(shù)據(jù)質(zhì)量和一致性,加速從數(shù)據(jù)到價值的服務(wù)產(chǎn)生過程,打造高響應(yīng)力且更加智慧的業(yè)務(wù)。
總結(jié)
以上是生活随笔為你收集整理的火热的数据中台对企业的价值是什么?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: GAN总结
- 下一篇: Mac上使用OpenCV【Xcode】