當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

学习笔记-大数据之路-数据模型篇-建模综述

發布時間：2023/12/14 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了学习笔记-大数据之路-数据模型篇-建模综述小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

??數據爆發增長，如何將這些數據進行有序、有結構地分類組織和存儲
(數據太多了，怎么辦才能將數據放規矩點，方便后續查找，不要到處散亂)

??數據模型建立后好處：

??數據倉庫的關系模型來源自數據庫(本是同根生，你卻榜上富婆，一下子農轉非)

OLTP 系統通常面向的主要數據操作是隨機讀寫，主要采用滿足3NF的實體關系模型存儲數據，從而在事務處理中解決數據的冗余和一致性問題；

OLAP 系統面向的主要數據操作是批量讀寫，事務處理中的一致性不是OLAP所關注的，其主要關注數據的整合，以及在一次性的復雜大數據查詢和處理中的性能，因此它需要采用些不同的數據建模方法

??采用ER模型建設數據倉庫模型的出發點是整合數據，將各個系統中的數據以整個企業角度按主題進行相似性組合和合并，并進行一致性處理，為數據分析決策服務，但是并不能直接用于分析決策。

由Ralph Kimball倡導
設計步驟:

選擇業務過程
??業務過程可以是單個業務事件，比如交易的支付、退款等
??也可以是某個事件的狀態，比如當前的賬戶余額、物流信息等
選擇粒度
??在事件分析中，我們要預判所有分析需要細分的程度，從而決定選擇的粒度。粒度是維度的一個組合(個人理解如人的身份證號、人的姓名、人的性別是一對一，但是人的銀行卡賬號，手機號卻不是一對一，那么身份證號，姓名，性別是相同粒度，銀行卡和手機號卻不是相同粒度)
識別維表
??選擇好粒度之后，就需要基于此粒度設計維表，包括維度屬性，用于分析時進行分組和篩選
選擇事實
??確定分析需要衡量的指標

??不常用

??不常用

??OneData
??其包括一致性的指標定義體系 、模型設計方法體系以及配套工具。

我是dyson不只是吹風機，若是對大數據-數據倉庫技術感興趣的可以加我溝通交流，一起進步。VX：daijun1211

ps：若文章侵權、觸犯隱私請聯系作者刪除，謝謝~~

以上是生活随笔為你收集整理的学习笔记-大数据之路-数据模型篇-建模综述的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。