ODS(Operational Data Store)定义
ODS(Operational Data Store)可操作的數據存儲。
很多人對ODS究竟是什么有很多的困惑,ODS對于不同的人可以有不同的看法,我主要說說什么是最主流的定義。首先我們需要注意,ODS不同于數據倉庫(Data warehouse)或數據集市(Data mart)。數據倉庫是用來保存公司來自很多不同的來源的歷史數據,并主要將這些數據用于趨勢分析,生成報表的地方。它是一個公司很多主題域(subject area)的一個合集,它在企業中是唯一的(一個企業不會有很多個數據倉庫,那樣數據可能會對不上)、真實的(只認可這一個數據倉庫中的數據)。數據集市和數據倉庫扮演的角色一樣,只是數據倉庫包含多個主題域,而數據集市僅僅面向一個主題域。可以把數據倉庫認為是多個數據集市組合體。
ODS的目的是集成公司不同來源的企業數據,以便于實時或者接近實時地產生操作報告。通常ODS中數據的結構和源數據結構很像,盡管在數據集成的時候,可以被清理、去規范化,?還有一些數據按照公司政策來集成。這個集成是粒度最小的、一天內發生的頻率最高的集成。通常ODS不會被設計成用來做歷史數據分析或者趨勢分析工作,這些是數據倉庫的功能。ODS通常會被用來當做數據倉庫的數據來源。
?
總結下ODS和數據倉庫的不同之處:
~~ODS用于最低粒度的查詢用,而數據倉庫通常保存的是綜合過的、粒度較粗的數據,通常用于較復雜的、分析性的查詢。
~~ODS通常實時性較高,通常保存的數據是實時的或者近乎實時的,因此能較及時地返回查詢請求,數據倉庫通常是歷史的數據,通常分析的數據較多,不能做到實時返回查詢,分析需要比較長時間。
~~ODS保存的數據視窗較小,即時間跨度不大;數據倉庫保存的幾乎是一個公司的所有歷史數據。
~~ODS為當前或接近實時數據的操作和戰術決策提供信息,而數據倉庫為戰略決策提供反饋,從而整體改進系統。
~~ODS抽取數據的頻率可以是幾分鐘、幾小時;數據倉庫的抽取數據的頻率可以是每天、每周、每月、或者每季度。
?
為什么需要一個ODS的一些原因:
~~源系統能夠提供有限的分析能力
~~可以使用更好的、更有效的工具來做分析,而不是直接在源系統上做數據分析
~~可以更好地做權限控制,僅僅讓某些人訪問到公司的數據,生成實時或近乎實時的報表統計
~~可以將公司不同的數據庫中的數據集合到一起,并基于當天的數據做近乎實時的分析和生成報表
?
轉載于:https://www.cnblogs.com/lukairui/p/7687418.html
總結
以上是生活随笔為你收集整理的ODS(Operational Data Store)定义的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: dialogic d300语音卡驱动重装
- 下一篇: Spotify模式并非“敏捷涅磐”