日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

ETL的四个基本过程.

發布時間:2025/3/20 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 ETL的四个基本过程. 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

轉自:http://www.chinabi.net/blog/user1/lastwood/archives/2006/888.html


What are the four basic data flow steps of an ETL process?


答:

Kimball 數據倉庫構建方法中, ETL的過程和傳統的實現方法有一些不同, 主要分為4個階段, 分別是抽取(extract),? 清洗(clean), 一致性處理(comform) 和交付(delivery). 堅持ECCD.


1. Extract 階段的主要任務是:

讀取系統的數據模型.

連接并訪問源系統的數據.

變化數據捕獲

抽取數據到數據準備區.


2.clean階段的主要任務是:

清洗并增補列的屬性.

清洗并增補數據結構.

清洗并增補數據規則.

清洗并增補業務規則.

建立元數據庫描述數據質量.

將清洗后的數據保存到數據準備區


3. comform階段的主要任務是:

一致性處理業務標簽, 即維度表中的描述屬性.

一致性處理業務度量及性能指標, 通常是事實表中的事實.

去除重復數據.

國際化處理.

將一致性處理后的數據保存到數據準備區.


4.delivery階段的主要任務是:

加載性行的和經過雪花處理的維度表數據.

產生日期維度.

加載退化維度.

加載子維度.

加載1.2.3型的緩慢變化維度.

處理遲到的維度和遲到的事實.

加載多值維度.

加載有復雜層級結構的維度表

處理事實表的代理鍵.

加載三個基本類型的事實性數據.

加載和更新聚集.

將處理好的數據加載到數據倉庫.



從這個任務列表中可以看出, ETL的過程和數據倉庫建模的過程結合的非常緊密. 換句話說, ETL系統的設計和目標表的設計同時開始. 通常來說, 數據倉庫架構師和ETL系統設計師是同一個人.




總結

以上是生活随笔為你收集整理的ETL的四个基本过程.的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。