维度建模工具
幵始維度建模工作前,項目組需要理解業務需求,以及作為基礎的源數據的實際情況。 通過與、 Ik務代表交流來發現需求,用于理解他們的基于關鍵性能指標、競爭性商業問題、 決策制定過程、支持分析需求的目標。同時,數據實際情況可以通過與源系統專家交流, 構建高層次數據分析訪問數據可行性來揭示。
維度模型設計期間主要涉及 4 個主要的決策: (1) 選擇業務過程 (2) 聲明粒度 (3) 確認維度 (4) 確認事實 要回答上述問題,需要考慮業務需求以及協作建模階段涉及的底層數據源。按照業務 過程、粒度、維度、事實聲明的流程,設計組確定表名和列名、示例領域值以及業務規則。 而業務數據管理代表必須參與詳細的設計活動,以確保涵蓋正確的業務。
業務過程是組織完成的操作型活動,例如,獲得訂單、處理保險索賠、學生課程注冊 或每個月每個賬單的快照等。業務過程事件建立或獲取性能度量,并轉換為事實表中的事 實。多數事實表關注某一業務過程的結果。過程的選擇是非常重要的,因為過程定義了特 定的設計目標以及對粒度、維度、事實的定義。每個業務過程對應企業數據倉庫總線矩陣 的一行。
聲明粒度是維度設計的重要步驟。粒度用于確定某一事實表中的行表示什么。粒度聲 明是設計必須履行的合同。在選擇維度或事實前必須聲明粒度,因為每個候選維度或事實 必須與定義的粒度保持一致。在所有維度設計中強制實行一致性是保證 BI 應用性能和易用 性的關鍵。在從給定的業務過程獲取數據時,原子粒度是最低級別的粒度。我們強烈建議 從關注原子級別粒度數據幵始設計,因為原子粒度數據能夠承受無法預期的用戶查詢。上 卷匯總粒度對性能調整來說非常重要,但這樣的粒度往往要猜測業務公共問題。針對不同 的事實表粒度,要建立不同的物理表,在同一事實表中不要混用多種不同的粒度。
維度提供圍繞某一業務過程事件所涉及的“誰、什么、何處、何時、為什么、如何” 等背景。維度表包含 BI 應用所需要的用于過濾及分類事實的描述性屬性。牢牢掌握事實表 的粒度,就能夠將所有可能存在的維度區分幵。當與給定事實表行關聯時,任何情況下都 應使維度保持單一值。 維度表有時被稱為數據倉庫的“靈魂”,因為維度表包含確保 DW/BI 系統能夠被用作 業務分析的入口和描述性標識。主要的工作都放在數據管理與維度表的幵發方面,因為它 們是用戶 BI 經驗的驅動者。
事實涉及來自業務過程事件的度量,基本上都是以數量值表示。一個事實表行與按照 事實表粒度描述的度量事件之間存在一對一關系,因此事實表對應一個物理可觀察的事件。 在事實表內,所有事實只允許與聲明的粒度保持一致。例如,在零售事務中,銷售產品的 數量與其總額是良好的事實,然而商店經理的工資不允許存在于零售事務中。
總結
- 上一篇: 【转载保存】HtmlUnit的使用
- 下一篇: IO之随机访问文件(RandomAcce