浅析数据质量检查
What are the four broad categories of data quality checks? Provide an implementation technique for each.
數(shù)據(jù)質(zhì)量檢查的四大類是什么?為每類提供一種實現(xiàn)技術(shù)。
答:數(shù)據(jù)質(zhì)量檢查是ETL工作中非常重要的一步,主要關(guān)注一下四個方面。
1.正確性檢查(Corret)
檢查數(shù)據(jù)值及其描述是否真實的反映了客觀事務(wù)。例如地址的描述是否完全。
2.明確性檢查(Unambiguous)
檢查數(shù)據(jù)值及其描述是否只有一個意思或者只有一個解釋。例如地名相同的兩個縣需要加區(qū)分方法。
3.一致性檢查(Consistent)
檢查數(shù)據(jù)值及其描述是否統(tǒng)一的采用固定的約定符號來表示。例如幣別中人民幣用'CNY'。
4.完全性檢查(Complete)
完全性有兩個需要檢查的地方,一個是檢查字段的數(shù)據(jù)值及其描述是否完全。例如檢查是否有空值。另一個是檢查記錄的合計值是否完全,有沒有遺忘某些條件。
轉(zhuǎn)載于:https://www.cnblogs.com/sanpoye/archive/2012/03/14/2659616.html
總結(jié)
- 上一篇: 华为真全面屏折叠手机现身:开孔、刘海消失
- 下一篇: AMD锐龙处理器越来越贵:均价提升35%