数仓架构--之数据拉链表实操
生活随笔
收集整理的這篇文章主要介紹了
数仓架构--之数据拉链表实操
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數倉架構--之數據拉鏈表
- 不登高山不知天之高也,不臨深溪不知地之厚也
- 序
- 拉鏈表定義
- 拉鏈表特征
- 拉鏈表加工
- 重跑機制
- 邏輯加工
- 全量拉鏈和增量拉鏈
- 全增量問題
- 全量拉鏈的全增量問題
- 增量拉鏈的全增量問題
- 結尾
不登高山不知天之高也,不臨深溪不知地之厚也
序
一句話道出求知的路勁,要想知道這個東西難不難只有去行動,去攀登。接下來在這里比較簡單的講講數倉中的拉鏈表
拉鏈表作為處理歷史數據的非常常用的表,掌握拉鏈表可以說掌握了數倉開發的核心,廢話不多說,直接進入正題。
拉鏈表定義
可參考百度不詳細說明,主要是記錄某些數據特征在某一段時間內持續的狀態
拉鏈表特征
MD5生成可以如下:select listagg(to_char(column_name)) from user_table_columns left join user_cons_columns on t2.position is not null where columnname not in (技術字段)
拉鏈表加工
重跑機制
邏輯加工
全量拉鏈和增量拉鏈
全增量問題
全量拉鏈的全增量問題
當主表是全量,而關聯表用增量的時候,當有該表字段用來加工目標數據的時候是有問題的,需要注意
解決方式*關聯表也用全量
增量拉鏈的全增量問題
當有多個關聯表,且使用關聯表加工目標表字段的時候,有些主表沒有變動,但是關聯表有變動,這種時候就需要注意保證變化的數據要是全量的。
解決方式: 可以創建一個臨時表,多個表的主鍵union生成目標表的主鍵
結尾
本篇文章主要講以上內容,未盡事項評論區見
總結
以上是生活随笔為你收集整理的数仓架构--之数据拉链表实操的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 毕业设计——房屋租赁管理系统
- 下一篇: vue : 无法将“vue”项识别为 c