数据仓库——元数据、主数据
什么是元數(shù)據(jù)、主數(shù)據(jù)
元數(shù)據(jù)的定義:描述數(shù)據(jù)的數(shù)據(jù),對(duì)數(shù)據(jù)及信息資源的描述性信息。
主數(shù)據(jù)的定義:系統(tǒng)內(nèi)或系統(tǒng)之間的共享數(shù)據(jù)。 例如,客戶、供應(yīng)商、賬戶和組織部門相關(guān)數(shù)據(jù)。
元數(shù)據(jù)(Meta data)是描述其它數(shù)據(jù)的數(shù)據(jù),或者說(shuō)是用于提供某種資源的有關(guān)信息的結(jié)構(gòu)數(shù)據(jù)。元數(shù)據(jù)是描述信息資源或數(shù)據(jù)等對(duì)象的數(shù)據(jù),其使用目的在于:識(shí)別資源;評(píng)價(jià)資源;追蹤資源在使用過(guò)程中的變化;實(shí)現(xiàn)簡(jiǎn)單高效地管理大量網(wǎng)絡(luò)化數(shù)據(jù);實(shí)現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對(duì)使用資源的有效管理。在本系統(tǒng)中,元數(shù)據(jù)用于描述設(shè)備檔案的數(shù)據(jù)模型。
如果將一部電影看作數(shù)據(jù),那么你在該電影海報(bào)上看到的所有信息,如電影名、導(dǎo)演、演員、制片人、電影類型等,都可以認(rèn)為是這部電影的元數(shù)據(jù)。
對(duì)于企業(yè)而言,元數(shù)據(jù)是跟企業(yè)所使用的物理數(shù)據(jù)、業(yè)務(wù)流程、數(shù)據(jù)結(jié)構(gòu)等有關(guān)的信息,描述了數(shù)據(jù)(如數(shù)據(jù)庫(kù)、數(shù)據(jù)模型)、概念(如業(yè)務(wù)流程、應(yīng)用系統(tǒng)、技術(shù)架構(gòu))以及它們之間的關(guān)系。
主數(shù)據(jù)的定義:主數(shù)據(jù)(MD-Master Data)指系統(tǒng)內(nèi)或系統(tǒng)之間的共享數(shù)據(jù)。 主數(shù)據(jù)與記錄業(yè)務(wù)活動(dòng),如交易數(shù)據(jù)等波動(dòng)較大的數(shù)據(jù)相比,主數(shù)據(jù)(也稱基準(zhǔn)數(shù)據(jù))變化緩慢。在本系統(tǒng)(設(shè)備檔案管理系統(tǒng))中,主數(shù)據(jù)就是設(shè)備“理想模型”的檔案信息數(shù)據(jù)集合。
主數(shù)據(jù)是具有共享性的基礎(chǔ)數(shù)據(jù),可以在企業(yè)內(nèi)跨越各個(gè)業(yè)務(wù)部門被重復(fù)使用的,因此通常長(zhǎng)期存在且應(yīng)用于多個(gè)系統(tǒng)。由于主數(shù)據(jù)是企業(yè)基準(zhǔn)數(shù)據(jù),數(shù)據(jù)來(lái)源單一、準(zhǔn)確、權(quán)威,具有較高的業(yè)務(wù)價(jià)值,因此是企業(yè)執(zhí)行業(yè)務(wù)操作和決策分析的數(shù)據(jù)標(biāo)準(zhǔn)。
元數(shù)據(jù)管理
我們對(duì)Markdown編輯器進(jìn)行了一些功能拓展與語(yǔ)法支持,除了標(biāo)準(zhǔn)的Markdown編輯器功能,我們?cè)黾恿巳缦聨c(diǎn)新功能,幫助你用它寫博客:
主數(shù)據(jù)管理
主數(shù)據(jù)管理的四大要素:
集成、共享、數(shù)據(jù)質(zhì)量、數(shù)據(jù)治理
主數(shù)據(jù)管理要做的就是從企業(yè)的多個(gè)業(yè)務(wù)系統(tǒng)中整合最核心的、最需要共享的數(shù)據(jù)(主數(shù)據(jù)),集中進(jìn)行數(shù)據(jù)的清洗和豐富,并且以服務(wù)的方式把統(tǒng)一的、完整的、準(zhǔn)確的、具有權(quán)威性的主數(shù)據(jù)分發(fā)給全企業(yè)范圍內(nèi)需要使用這些數(shù)據(jù)的操作型應(yīng)用和分析型應(yīng)用,包括各個(gè)業(yè)務(wù)系統(tǒng)、業(yè)務(wù)流程和決策支持系統(tǒng)等。
主數(shù)據(jù)管理應(yīng)用價(jià)值
使得企業(yè)能夠集中化管理數(shù)據(jù),在分散的系統(tǒng)間保證主數(shù)據(jù)的一致性,改進(jìn)數(shù)據(jù)合規(guī)性、快速部署新應(yīng)用、充分了解客戶、加速推出新產(chǎn)品的速度。從 IT 建設(shè)的角度,主數(shù)據(jù)管理可以增強(qiáng) IT 結(jié)構(gòu)的靈活性,構(gòu)建覆蓋整個(gè)企業(yè)范圍內(nèi)的數(shù)據(jù)管理基礎(chǔ)和相應(yīng)規(guī)范,并且更靈活地適應(yīng)企業(yè)業(yè)務(wù)需求的變化。
以客戶主數(shù)據(jù)為例,客戶主數(shù)據(jù)是目前企業(yè)級(jí)客戶普遍面臨的一個(gè)問(wèn)題,在大多數(shù)企業(yè)中,客戶信息通常分散于 CRM 等各個(gè)業(yè)務(wù)系統(tǒng)中,而每個(gè)業(yè)務(wù)系統(tǒng)中都只有客戶信息的片斷,即不完整的客戶信息,但卻缺乏企業(yè)級(jí)的完整、統(tǒng)一的單一客戶視圖,結(jié)果導(dǎo)致企業(yè)不能完全了解客戶,無(wú)法協(xié)調(diào)統(tǒng)一的市場(chǎng)行為,導(dǎo)致客戶滿意度下降,市場(chǎng)份額減少。
因此,建立客戶主數(shù)據(jù)系統(tǒng)的目的在于:
整合并存儲(chǔ)所有業(yè)務(wù)系統(tǒng)和渠道的客戶及潛在客戶的信息:一方面從相關(guān)系統(tǒng)中抽取客戶信息,并完成客戶信息的清洗和整合工作,建立企業(yè)級(jí)的客戶統(tǒng)一視圖;另一方面,客戶主數(shù)據(jù)管理系統(tǒng)將形成的統(tǒng)一客戶信息以廣播的形式同步到其他各個(gè)系統(tǒng),從而確??蛻粜畔⒌囊恢?#xff1b;
為相關(guān)的應(yīng)用系統(tǒng)提供聯(lián)機(jī)交易支持,提供客戶信息的唯一訪問(wèn)入口點(diǎn),為所有應(yīng)用系統(tǒng)提供及時(shí)和全面的客戶信息;服務(wù)于 OCRM 系統(tǒng),充分利用數(shù)據(jù)的價(jià)值,在所有客戶接觸點(diǎn)上提供更多具有附加價(jià)值的服務(wù);
實(shí)現(xiàn) SOA 的體系結(jié)構(gòu):建立客戶主數(shù)據(jù)系統(tǒng)之前,數(shù)據(jù)被鎖定在每一個(gè)應(yīng)用系統(tǒng)和流程中,建立主數(shù)據(jù)管理系統(tǒng)之后,數(shù)據(jù)從應(yīng)用系統(tǒng)中被釋放出來(lái),并且被處理成為一組可重用的服務(wù),被各個(gè)應(yīng)用系統(tǒng)調(diào)用
主數(shù)據(jù)管理系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的關(guān)系
主數(shù)據(jù)管理系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是相輔相成的兩個(gè)系統(tǒng),但二者絕不是重復(fù)的,也不是互斥的。它們有很多共同之處:
首先二者對(duì)企業(yè)都具有相同的價(jià)值,可以減少數(shù)據(jù)冗余和不一致性、提升對(duì)數(shù)據(jù)的洞察力,二者都是跨部門的集中式系統(tǒng);
其次二者都依賴很多相同的技術(shù)手段,都會(huì)涉及到 ETL 技術(shù)、都需要元數(shù)據(jù)管理、都強(qiáng)調(diào)數(shù)據(jù)質(zhì)量;
第三就是二者建設(shè)手段類似,都需要數(shù)據(jù)治理的規(guī)范作為指導(dǎo)、都需要不同系統(tǒng)、不同部門的協(xié)作、需要統(tǒng)一的安全策略。
總結(jié)
以上是生活随笔為你收集整理的数据仓库——元数据、主数据的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 什么是数据、元数据、主数据和参考数据?
- 下一篇: Eureka的元数据