在谈数据治理和数字化的时候,别忘了数据标准
標(biāo)準(zhǔn)的重要性,自然不言而喻
數(shù)據(jù)標(biāo)準(zhǔn),同樣重要!
我們經(jīng)常聽到XX數(shù)據(jù)不一致,異構(gòu)系統(tǒng)集成難,數(shù)據(jù)分析不準(zhǔn)確,大數(shù)據(jù)預(yù)測都是騙人的等等數(shù)據(jù)管理和使用上問題,80%都是數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一造成的。
— 01 —
DAMA的數(shù)據(jù)標(biāo)準(zhǔn)在哪里?
數(shù)據(jù)標(biāo)準(zhǔn)如此重要,為什么在被譽(yù)為數(shù)據(jù)管理界"葵花寶典"的DAMA體系中偏偏沒有數(shù)據(jù)標(biāo)準(zhǔn)?我們來看下DAMA的數(shù)據(jù)管理體系中都包含了哪些內(nèi)容:
在這兩個(gè)版本中,的確都沒有“數(shù)據(jù)標(biāo)準(zhǔn)”這個(gè)數(shù)據(jù)管理域。
但事實(shí)的真相真的是這樣嗎?難道DAMA不知道數(shù)據(jù)標(biāo)準(zhǔn)的重要性嗎?
答案顯然是否定的!
雖然我們看到在DAMA的體系中沒有單獨(dú)講數(shù)據(jù)標(biāo)準(zhǔn),但是數(shù)據(jù)標(biāo)準(zhǔn)是含在了每個(gè)知識(shí)領(lǐng)域當(dāng)中的。其實(shí)只要仔細(xì)閱讀你就會(huì)發(fā)現(xiàn)DAMA提到的每一個(gè)數(shù)據(jù)管理職能,都離不開數(shù)據(jù)標(biāo)準(zhǔn),甚至很多數(shù)據(jù)管理的過程本身就是在做數(shù)據(jù)的標(biāo)準(zhǔn)化,例如:設(shè)計(jì)數(shù)據(jù)模型和元數(shù)據(jù)、梳理數(shù)據(jù)分類分級(jí)體系、定義數(shù)據(jù)質(zhì)量規(guī)則和檢核標(biāo)準(zhǔn)、設(shè)計(jì)數(shù)據(jù)存儲(chǔ)模型和規(guī)則、定義主數(shù)據(jù)分類和編碼規(guī)則等等,這都是數(shù)據(jù)標(biāo)準(zhǔn)的內(nèi)容。
— 02 —數(shù)據(jù)標(biāo)準(zhǔn)的作用和特性
數(shù)據(jù)標(biāo)準(zhǔn)與企業(yè)數(shù)據(jù)管理的每個(gè)域都相關(guān),是數(shù)據(jù)治理工作的最基礎(chǔ)內(nèi)容。
主數(shù)據(jù)管理中,需要明確主數(shù)據(jù)定義、分類、編碼、模型;元數(shù)據(jù)管理中,需要從業(yè)務(wù)屬性、技術(shù)屬性、管理屬性三個(gè)方面定義數(shù)據(jù)標(biāo)準(zhǔn);
數(shù)據(jù)質(zhì)量管理中,需要定義數(shù)據(jù)模型、質(zhì)量規(guī)則的標(biāo)準(zhǔn);
數(shù)據(jù)安全管理中,敏感信息的識(shí)別、數(shù)據(jù)的分類分級(jí)都是對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化過程;
數(shù)據(jù)倉庫與BI中,需要定義數(shù)據(jù)模型、數(shù)據(jù)指標(biāo)、維度、度量等數(shù)據(jù)的標(biāo)準(zhǔn);
數(shù)據(jù)集成中,數(shù)據(jù)標(biāo)準(zhǔn)讓不同主體擁有了系統(tǒng)之間交換標(biāo)準(zhǔn)化數(shù)據(jù)的能力;
數(shù)據(jù)存儲(chǔ)中,存儲(chǔ)格式,存儲(chǔ)位置,數(shù)據(jù)結(jié)構(gòu)等都離不開數(shù)據(jù)標(biāo)準(zhǔn);
……
數(shù)據(jù)標(biāo)準(zhǔn)的作用還有很多,但最核心的作用是為各部門、各系統(tǒng)建立了一個(gè)溝通的橋梁。
除此之外,數(shù)據(jù)標(biāo)準(zhǔn)還具有如下特性,企業(yè)在實(shí)施數(shù)據(jù)標(biāo)準(zhǔn)化的過程中,應(yīng)予以關(guān)注:
開放性:在標(biāo)準(zhǔn)制定過程中,誰提出需求,誰負(fù)責(zé)起草,誰提供建議,誰負(fù)責(zé)決定,以及標(biāo)準(zhǔn)的權(quán)利歸屬等在組織范圍內(nèi)應(yīng)當(dāng)是開放的,每個(gè)人都可以參與進(jìn)來,每個(gè)人都有權(quán)利提出數(shù)據(jù)標(biāo)準(zhǔn)的需求和建議。
透明性:數(shù)據(jù)標(biāo)準(zhǔn)所涉及的標(biāo)準(zhǔn)規(guī)劃、標(biāo)準(zhǔn)制定、標(biāo)準(zhǔn)發(fā)布、標(biāo)準(zhǔn)執(zhí)行、標(biāo)準(zhǔn)變更、標(biāo)準(zhǔn)維護(hù)等程序應(yīng)是公開透明的,所有技術(shù)討論、會(huì)議紀(jì)要都存檔并可供決策參考。
可用性:企業(yè)制定數(shù)據(jù)標(biāo)準(zhǔn)的目的是讓數(shù)據(jù)更好的使用,而不是單純?yōu)榱藢?duì)數(shù)據(jù)增加約束或條件。能夠讓企業(yè)用起來的數(shù)據(jù)標(biāo)準(zhǔn)才是好標(biāo)準(zhǔn),否則就只是一個(gè)無用的文件。
維護(hù)性:企業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)的維護(hù)是一個(gè)制定、測試、發(fā)布、執(zhí)行、修訂、永久訪問的持續(xù)過程。
— 03 —
企業(yè)的哪些數(shù)據(jù)需要建標(biāo)準(zhǔn)?
數(shù)據(jù)標(biāo)準(zhǔn)并不是一個(gè)“專有名詞”,而是對(duì)數(shù)據(jù)的一系列“規(guī)范性約束”的抽象。——《數(shù)據(jù)標(biāo)準(zhǔn)管理實(shí)踐白皮書》
這句話也印證了為什么DAMA體系中沒有將數(shù)據(jù)標(biāo)準(zhǔn)獨(dú)立出來。數(shù)據(jù)標(biāo)準(zhǔn)是一系列的“規(guī)范性約束”,它作用于數(shù)據(jù)管理的每個(gè)關(guān)鍵過程和活動(dòng)中,也就是說數(shù)據(jù)標(biāo)準(zhǔn)貫穿于企業(yè)數(shù)據(jù)管理和應(yīng)用的全過程當(dāng)中。
還有一種常見的數(shù)據(jù)標(biāo)準(zhǔn)分類方式,是分為基礎(chǔ)類數(shù)據(jù)標(biāo)準(zhǔn)和指標(biāo)類數(shù)據(jù)標(biāo)準(zhǔn)兩大類,其中基礎(chǔ)數(shù)據(jù)是指業(yè)務(wù)過程中直接產(chǎn)生的,未經(jīng)加工的基礎(chǔ)業(yè)務(wù)信息;而指標(biāo)類數(shù)據(jù)是指由一個(gè)或多個(gè)基礎(chǔ)數(shù)據(jù)根據(jù)一定的計(jì)算規(guī)則進(jìn)行加工計(jì)算得到的。例如,《數(shù)據(jù)標(biāo)準(zhǔn)管理實(shí)踐白皮書》對(duì)數(shù)據(jù)標(biāo)準(zhǔn)的分類就是這兩大類。
另外,也有按照數(shù)據(jù)的屬性要素組成來進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)分類的,從數(shù)據(jù)的業(yè)務(wù)屬性、技術(shù)屬性、管理屬性三個(gè)維度定義數(shù)據(jù)標(biāo)準(zhǔn)。這種分類方式本質(zhì)上就是元數(shù)據(jù)管理,也可以說通過元數(shù)據(jù)管理落地?cái)?shù)據(jù)標(biāo)準(zhǔn)。
— 04 —
企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)該如何建立?
提到建立標(biāo)準(zhǔn),你可能還會(huì)想到要參考國際標(biāo)準(zhǔn),國家標(biāo)準(zhǔn),行業(yè)標(biāo)準(zhǔn)等等。沒錯(cuò),這是制定企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)的第一步。收集現(xiàn)行的國家標(biāo)準(zhǔn)或行業(yè)標(biāo)準(zhǔn),在根據(jù)企業(yè)需求確定數(shù)據(jù)標(biāo)準(zhǔn)的范圍。但由于每個(gè)行業(yè)、每個(gè)企業(yè)都有自己的特點(diǎn),真正能夠參考的數(shù)據(jù)標(biāo)準(zhǔn)其實(shí)并不多。
那么,企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)到底該如何建立?
一般來說,數(shù)據(jù)標(biāo)準(zhǔn)的建立有5個(gè)步驟,分別是:數(shù)據(jù)標(biāo)準(zhǔn)規(guī)劃,數(shù)據(jù)標(biāo)準(zhǔn)制定,數(shù)據(jù)標(biāo)準(zhǔn)發(fā)布、數(shù)據(jù)標(biāo)準(zhǔn)落地和數(shù)據(jù)標(biāo)準(zhǔn)維護(hù)。
1、數(shù)據(jù)標(biāo)準(zhǔn)規(guī)劃
上邊我們說的收集現(xiàn)行的國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)就是標(biāo)準(zhǔn)規(guī)劃階段的內(nèi)容。除此之外,這個(gè)階段重點(diǎn)是對(duì)企業(yè)業(yè)務(wù)和數(shù)據(jù)進(jìn)行調(diào)研和分析,結(jié)合企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)和需求和現(xiàn)狀,明確數(shù)據(jù)標(biāo)準(zhǔn)的范圍和數(shù)據(jù)標(biāo)準(zhǔn)體系框架。
2、數(shù)據(jù)標(biāo)準(zhǔn)制定
在數(shù)據(jù)標(biāo)準(zhǔn)體系框架下,按照數(shù)據(jù)標(biāo)準(zhǔn)范圍要求進(jìn)行業(yè)務(wù)域、業(yè)務(wù)主題的劃分,針對(duì)每個(gè)業(yè)務(wù)主題所涉及的數(shù)據(jù)進(jìn)行建模,定義每個(gè)數(shù)據(jù)實(shí)體的業(yè)務(wù)屬性、技術(shù)屬性和管理屬性。這個(gè)過程如果現(xiàn)行的數(shù)據(jù)標(biāo)準(zhǔn)存在能夠滿足要求的數(shù)據(jù)元子集、代碼表,則可以直接采用。如果沒有就需要從業(yè)務(wù)屬性、技術(shù)屬性和管理屬性三個(gè)方面定義新的數(shù)據(jù)標(biāo)準(zhǔn)。
關(guān)于如何劃分業(yè)務(wù)域,業(yè)務(wù)主題,之前的文章中有過介紹,本次重點(diǎn)介紹下如何制定一個(gè)數(shù)據(jù)模型的標(biāo)準(zhǔn)。
一個(gè)數(shù)據(jù)模型可以包含多個(gè)數(shù)據(jù)實(shí)體組成,每個(gè)實(shí)體包含多個(gè)屬性,而每個(gè)屬性至少包含1個(gè)或多個(gè)數(shù)據(jù)元。每個(gè)數(shù)據(jù)元對(duì)象有且只能有一個(gè)特性,每個(gè)特性也只能有一個(gè)數(shù)據(jù)表示。例如:在“人員”數(shù)據(jù)模型中,“人員”為數(shù)據(jù)實(shí)體,他包含了姓名、性別、年齡、民族、學(xué)歷、婚姻狀況、職務(wù)等屬性。拿性別這個(gè)屬性來講,包含了“男、女、未知”三個(gè)數(shù)據(jù)元對(duì)象,其中“男”這個(gè)數(shù)據(jù)元可以用數(shù)字“1”表示。
注:數(shù)據(jù)元是組成數(shù)據(jù)的最小單元,在數(shù)據(jù)標(biāo)準(zhǔn)制定過程中需要對(duì)數(shù)據(jù)模型涉及的每個(gè)數(shù)據(jù)元進(jìn)行標(biāo)準(zhǔn)化。
3、數(shù)據(jù)標(biāo)準(zhǔn)發(fā)布
數(shù)據(jù)標(biāo)準(zhǔn)發(fā)布是在標(biāo)準(zhǔn)制定完成后,向公司各相關(guān)部門征集意見,并根據(jù)各部門意見完成標(biāo)準(zhǔn)修訂后,在公司范圍內(nèi)正式發(fā)布。數(shù)據(jù)標(biāo)準(zhǔn)一經(jīng)發(fā)布,各部門、各系統(tǒng)應(yīng)按數(shù)據(jù)標(biāo)準(zhǔn)要求執(zhí)行,如果需要對(duì)發(fā)布后的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行修改,需要走正式的數(shù)據(jù)標(biāo)準(zhǔn)變更流程。
4、數(shù)據(jù)標(biāo)準(zhǔn)執(zhí)行
數(shù)據(jù)標(biāo)準(zhǔn)執(zhí)行涉及到新建系統(tǒng)和現(xiàn)有運(yùn)行系統(tǒng)的貫標(biāo)。原則上,新建信息系統(tǒng)必須嚴(yán)格按照發(fā)布的數(shù)據(jù)標(biāo)準(zhǔn)執(zhí)行;對(duì)于現(xiàn)有在運(yùn)行的系統(tǒng),應(yīng)按照數(shù)據(jù)標(biāo)準(zhǔn)要求進(jìn)行整改或建立映射關(guān)系,以滿足公司數(shù)據(jù)統(tǒng)一的要求。
強(qiáng)調(diào)一下:數(shù)據(jù)標(biāo)準(zhǔn)要想能夠用起來,在數(shù)據(jù)標(biāo)準(zhǔn)的制定、發(fā)布、執(zhí)行的每個(gè)階段都需要做大量的宣貫和培訓(xùn)工作,以便促進(jìn)全公司對(duì)數(shù)據(jù)標(biāo)準(zhǔn)達(dá)成共識(shí),更好的應(yīng)用到實(shí)踐中去。
5、數(shù)據(jù)標(biāo)準(zhǔn)維護(hù)
由于業(yè)務(wù)運(yùn)行與發(fā)展需要,或引用的國家標(biāo)準(zhǔn)等外部標(biāo)準(zhǔn)的變化,需要對(duì)已發(fā)布的數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行修訂或變更。
有一點(diǎn)需要注意:在對(duì)數(shù)據(jù)標(biāo)準(zhǔn)修訂或變更之前應(yīng)充分做好變更難易程度,對(duì)業(yè)務(wù)影響程度的評(píng)估,并制定出詳細(xì)的解決方案方可執(zhí)行變更。
— 05 —
如何讓數(shù)據(jù)標(biāo)準(zhǔn)真正發(fā)揮作用?
要讓數(shù)據(jù)標(biāo)準(zhǔn)能夠用起來,在企業(yè)的數(shù)字化中真正發(fā)揮作用,在標(biāo)準(zhǔn)的建設(shè)和執(zhí)行過程中應(yīng)注意以下幾個(gè)事項(xiàng):
1、全面的數(shù)據(jù)盤點(diǎn)
基于企業(yè)業(yè)務(wù)架構(gòu),從滿足企業(yè)經(jīng)營管理、數(shù)據(jù)分析、數(shù)據(jù)共享、數(shù)據(jù)集成等需求入手,對(duì)各個(gè)系統(tǒng)的數(shù)據(jù)資源進(jìn)行盤點(diǎn)。
通過梳理數(shù)據(jù)現(xiàn)狀,厘清業(yè)務(wù)開展過程中業(yè)務(wù)流、單據(jù)流以及數(shù)據(jù)流,明確數(shù)據(jù)資產(chǎn)分布,數(shù)據(jù)的質(zhì)量情況、數(shù)據(jù)集成情況、數(shù)據(jù)管理情況等問題;明確各基礎(chǔ)數(shù)據(jù)和指標(biāo)數(shù)據(jù)的業(yè)務(wù)含義、數(shù)據(jù)口徑、適用場景、數(shù)據(jù)來源、數(shù)據(jù)關(guān)系等信息。
2、精細(xì)的標(biāo)準(zhǔn)規(guī)則
從數(shù)據(jù)域、數(shù)據(jù)分類、數(shù)據(jù)實(shí)體、數(shù)據(jù)屬性四個(gè)層次構(gòu)建企業(yè)數(shù)據(jù)標(biāo)準(zhǔn)體系。
數(shù)據(jù)域是按業(yè)務(wù)領(lǐng)域劃分的頂級(jí)數(shù)據(jù)分類,例如:財(cái)務(wù)域、人力域、生產(chǎn)域、營銷域等。
數(shù)據(jù)分類是按照業(yè)務(wù)主題對(duì)數(shù)據(jù)域的細(xì)分,例如:財(cái)務(wù)域又可以分為盈利能力主題、企業(yè)發(fā)展主題、資金管理主題、運(yùn)營管控主題等。
數(shù)據(jù)實(shí)體是每一類數(shù)據(jù)對(duì)象的個(gè)體,是數(shù)據(jù)標(biāo)準(zhǔn)化的主體,需要規(guī)范數(shù)據(jù)實(shí)體的定義、標(biāo)識(shí)、表示和允許值的數(shù)據(jù)單元。
數(shù)據(jù)屬性是描述數(shù)據(jù)實(shí)體的性質(zhì)和特征的數(shù)據(jù),從不同的視角,數(shù)據(jù)屬性可分為業(yè)務(wù)屬性、技術(shù)屬性和管理屬性。
業(yè)務(wù)屬性:定義數(shù)據(jù)與企業(yè)業(yè)務(wù)相關(guān)聯(lián)的特性和用途,統(tǒng)一業(yè)務(wù)描述和理解,包括:命名規(guī)則、編碼規(guī)則、業(yè)務(wù)定義、業(yè)務(wù)規(guī)則、值集、維度、粒度等。
技術(shù)屬性:定義數(shù)據(jù)與IT技術(shù)實(shí)現(xiàn)相關(guān)聯(lián)的特性,對(duì)IT實(shí)施形成必要的指引和約束,包括:字段名稱、數(shù)據(jù)類型、數(shù)據(jù)格式、數(shù)據(jù)長度、度量單位、枚舉值的限定等。
管理屬性:定義數(shù)據(jù)標(biāo)準(zhǔn)在管理和使用方面各部門承擔(dān)的責(zé)任,對(duì)數(shù)據(jù)歸屬進(jìn)行確權(quán)認(rèn)知,明確數(shù)據(jù)所屬部門、數(shù)據(jù)管理部門、數(shù)據(jù)使用部門、標(biāo)準(zhǔn)發(fā)布日期等管理屬性做出規(guī)范。
3、全域的覆蓋范圍
數(shù)據(jù)標(biāo)準(zhǔn)夠不夠成熟一個(gè)非常簡單的衡量標(biāo)準(zhǔn)就是看它的覆蓋范圍夠不夠廣。一般來說,覆蓋范圍越大,數(shù)據(jù)標(biāo)準(zhǔn)越成熟!
數(shù)據(jù)標(biāo)準(zhǔn)覆蓋范圍有三個(gè)方面:
1)組織范圍,即,數(shù)據(jù)標(biāo)準(zhǔn)適用的組織范圍,部門級(jí)、公司級(jí),集團(tuán)級(jí)還是行業(yè)級(jí)。
2)業(yè)務(wù)應(yīng)用范圍,即數(shù)據(jù)標(biāo)準(zhǔn)都哪些業(yè)務(wù)部門會(huì)使用,例如,一個(gè)“客戶”數(shù)據(jù)標(biāo)準(zhǔn),就會(huì)被市場、銷售、生產(chǎn)、采購、倉儲(chǔ)、物流、售后等多個(gè)部門使用。
3)落地系統(tǒng)范圍,即該標(biāo)準(zhǔn)需要在哪些系統(tǒng)中貫徹執(zhí)行,例如:我們上邊舉的“客戶”數(shù)據(jù)標(biāo)準(zhǔn),落地系統(tǒng)范圍可能包括ERP、CRM、WMS等。
4、規(guī)范的業(yè)務(wù)流程
數(shù)據(jù)治理過程中,有一個(gè)比較常見的問題:企業(yè)花費(fèi)了大量精力建立起來的數(shù)據(jù)標(biāo)準(zhǔn),在實(shí)際業(yè)務(wù)中沒有很難使用起來。當(dāng)然,造成這個(gè)問題的因素有很多,例如:標(biāo)準(zhǔn)本身制定的不合理,歷史系統(tǒng)的改造難度大,標(biāo)準(zhǔn)沒有得到廣泛的普及等等。
在眾多的因素中,有一個(gè)因素我們不能忽略,那就是“業(yè)務(wù)流程的優(yōu)化”。只有將數(shù)據(jù)標(biāo)準(zhǔn)與業(yè)務(wù)流程進(jìn)行深度融合,融為一體的時(shí)候,才是真正意義上實(shí)現(xiàn)了數(shù)據(jù)標(biāo)準(zhǔn)的落地。
數(shù)據(jù)很重要,但我們不能只關(guān)注數(shù)據(jù)而忽視了業(yè)務(wù)流程。事實(shí)上,數(shù)據(jù)標(biāo)準(zhǔn)和流程優(yōu)化,相互依存、互為支撐,沒有規(guī)范化的業(yè)務(wù)流程,就不會(huì)有標(biāo)準(zhǔn)化的數(shù)據(jù)。
原文來源:談數(shù)據(jù)
總結(jié)
以上是生活随笔為你收集整理的在谈数据治理和数字化的时候,别忘了数据标准的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。