ETL的四个基本过程.
轉自:http://www.chinabi.net/blog/user1/lastwood/archives/2006/888.html
What are the four basic data flow steps of an ETL process?
答:
Kimball 數據倉庫構建方法中, ETL的過程和傳統的實現方法有一些不同, 主要分為4個階段, 分別是抽取(extract),? 清洗(clean), 一致性處理(comform) 和交付(delivery). 堅持ECCD.
1. Extract 階段的主要任務是:
讀取系統的數據模型.
連接并訪問源系統的數據.
變化數據捕獲
抽取數據到數據準備區.
2.clean階段的主要任務是:
清洗并增補列的屬性.
清洗并增補數據結構.
清洗并增補數據規則.
清洗并增補業務規則.
建立元數據庫描述數據質量.
將清洗后的數據保存到數據準備區
3. comform階段的主要任務是:
一致性處理業務標簽, 即維度表中的描述屬性.
一致性處理業務度量及性能指標, 通常是事實表中的事實.
去除重復數據.
國際化處理.
將一致性處理后的數據保存到數據準備區.
4.delivery階段的主要任務是:
加載性行的和經過雪花處理的維度表數據.
產生日期維度.
加載退化維度.
加載子維度.
加載1.2.3型的緩慢變化維度.
處理遲到的維度和遲到的事實.
加載多值維度.
加載有復雜層級結構的維度表
處理事實表的代理鍵.
加載三個基本類型的事實性數據.
加載和更新聚集.
將處理好的數據加載到數據倉庫.
從這個任務列表中可以看出, ETL的過程和數據倉庫建模的過程結合的非常緊密. 換句話說, ETL系統的設計和目標表的設計同時開始. 通常來說, 數據倉庫架構師和ETL系統設計師是同一個人.
總結
以上是生活随笔為你收集整理的ETL的四个基本过程.的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: grouping Function
- 下一篇: 在数据准备区中允许使用的数据结构有哪些,