数据中台(二)数据质量分析及提升
一般情況下,企業(yè)都有多套的業(yè)務(wù)系統(tǒng),一些大型企業(yè)甚至?xí)猩习偬椎臉I(yè)務(wù)系統(tǒng)。這些業(yè)務(wù)在不同時(shí)期由不同的團(tuán)隊(duì)開發(fā)完成。因此,這些業(yè)務(wù)系統(tǒng)都參考著不同的標(biāo)準(zhǔn)生產(chǎn)各自數(shù)據(jù)。由于濫用縮寫詞,慣用語(yǔ),數(shù)據(jù)輸入錯(cuò)誤,重復(fù)記錄,丟失值,拼寫變化,不同的計(jì)量單位,大量應(yīng)用系統(tǒng)產(chǎn)生的大量數(shù)據(jù)是臟數(shù)據(jù)。這些臟數(shù)據(jù)是沒(méi)有意義的,根本就不可能為以后的數(shù)據(jù)挖掘決策分析提供任何支持。這就是數(shù)據(jù)質(zhì)量問(wèn)題的由來(lái)。
一般來(lái)說(shuō)數(shù)據(jù)質(zhì)量問(wèn)題有四個(gè)因素造成:
從上述的四因素來(lái)說(shuō),管理因素和流程因素屬于組織管理范疇,信息因素和技術(shù)因素屬于技術(shù)范疇。所以,要改進(jìn)數(shù)據(jù)質(zhì)量問(wèn)題,要從組織管理和技術(shù)兩方面入手,才能從根本上,最佳地解決數(shù)據(jù)質(zhì)量問(wèn)題。
從方法論的角度,從組織管理上去改進(jìn)質(zhì)量,我們能做的是:
-
確立組織數(shù)據(jù)質(zhì)量改進(jìn)目標(biāo)
-
評(píng)估組織流程
-
制定組織流程改善計(jì)劃
-
實(shí)施改進(jìn)
-
評(píng)估改善效果
從技術(shù)上去改進(jìn)數(shù)據(jù)質(zhì)量,我們能做的是?
總結(jié)
以上是生活随笔為你收集整理的数据中台(二)数据质量分析及提升的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 深度学习核心技术精讲100篇(十九)--
- 下一篇: Leetcode每日必刷题库第5题,如何