数据中台(二)数据质量分析及提升
生活随笔
收集整理的這篇文章主要介紹了
数据中台(二)数据质量分析及提升
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一般情況下,企業都有多套的業務系統,一些大型企業甚至會有上百套的業務系統。這些業務在不同時期由不同的團隊開發完成。因此,這些業務系統都參考著不同的標準生產各自數據。由于濫用縮寫詞,慣用語,數據輸入錯誤,重復記錄,丟失值,拼寫變化,不同的計量單位,大量應用系統產生的大量數據是臟數據。這些臟數據是沒有意義的,根本就不可能為以后的數據挖掘決策分析提供任何支持。這就是數據質量問題的由來。
一般來說數據質量問題有四個因素造成:
從上述的四因素來說,管理因素和流程因素屬于組織管理范疇,信息因素和技術因素屬于技術范疇。所以,要改進數據質量問題,要從組織管理和技術兩方面入手,才能從根本上,最佳地解決數據質量問題。
從方法論的角度,從組織管理上去改進質量,我們能做的是:
-
確立組織數據質量改進目標
-
評估組織流程
-
制定組織流程改善計劃
-
實施改進
-
評估改善效果
從技術上去改進數據質量,我們能做的是?
總結
以上是生活随笔為你收集整理的数据中台(二)数据质量分析及提升的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习核心技术精讲100篇(十九)--
- 下一篇: Leetcode每日必刷题库第5题,如何