数据的生命周期
大多數數據不是靜態的。不,數據具有改變的生命,可能用于多種用途,并且可以在各處移動。因此,考慮組織中數據的生命周期是有意義的。
附圖有助于演示此生命周期。基本上,任何數據都有三個主要的“生命”階段。
通常通過交易在某些時刻創建數據:產品被釋放,訂單被處理,存款等等。在創建之后的一段時間內,數據首先進入狀態:它是可操作的。也就是說,需要數據來完成正在進行的業務交易。這是它為主要業務目的服務的地方。對此狀態下的數據進行交易。大多數更改都發生在數據運行狀態期間。
操作狀態之后是參考狀態。這是報告和查詢目的仍然需要數據的時間,但它不一定推動業務交易。可能需要數據來生成內部報告,外部報表,或者只是在客戶要求的情況下存在。
然后,在一段額外的時間之后,數據移動到完成業務事務不再需要的區域,并且查詢和報告所需的機會很小。但是,為了符合法規要求和其他法律目的,仍然需要保存數據,特別是如果它涉及金融交易。這是存檔狀態。
最后,在歸檔中指定的一段時間之后,根本不再需要數據,并且可以丟棄該數據。實際上應該強調這一點:必須丟棄數據。在大多數情況下,保留舊數據的唯一原因是遵守法規,其中許多法規有助于啟動訴訟。如果沒有法律要求維護這些數據,那么組織要求銷毀這些數據是正確和恰當的 - 如果不是法律要求,為什么要讓任何人起訴你呢?
也許一個簡短的例子會有所幫助。你出去買衣服了。你挑選一件漂亮的衣服并決定向購買的信用卡收取費用。作為此交易的一部分,企業會捕獲您的信用卡數據和您購買的商品。換句話說,數據被創建并存儲在操作狀態中。
在您的月度結算周期完成并且您通過郵件收到您的對帳單之前,它仍然有效。在此之后的某個時刻,數據從操作狀態移動到參考狀態。進行任何進一步的業務不需要數據,但報告可能需要這些數據。此外,卡處理公司確定存在一段時間 - 可能是90天 - 在此期間客戶經常打電話以獲得關于最近交易的信息。但在那之后客戶的要求很少。
此時,數據可以進入存檔狀態。它必須保持不變,直到所有監管要求都過去為止。所有對數據的需求,無論是出于內部業務目的還是外部法律目的,都已過期,它將從系統中清除。
在考慮這些數據狀態時,不要考慮您已經知道的數據庫或技術。數據可以在三個單獨的數據庫中,單個數據庫或其任何組合。此外,在這種情況下不要考慮數據倉庫 - 這里我們討論的是單一的官方數據存儲 - 以及它的生產生命周期。
運營和參考狀態在當今的組織中得到了相當好的實施,但對于歸檔數據卻并非如此。如果您現在歸檔任何內容,請考慮如何歸檔數據。它容易接近嗎?或者需要數周或數月的工作才能將存檔數據轉換成任何合理的查詢格式?或者更常見的是,數據永遠不會存檔。相反,它在操作和參考數據的生產數據庫中萎縮,但從未被訪問過。它所做的只是占用空間并影響查詢對其余數據的性能!
在設計數據庫時,請務必相應地考慮每個階段的數據生命周期和計劃。隨著監管壓力的增加,更好地規劃和實施數據庫歸檔的需求將隨著時間的推移變得越來越普遍。
原文地址:?https://datatechnologytoday.wordpress.com/2015/09/29/the-lifecycle-of-data/
轉載于:https://blog.51cto.com/lee90/2317940
總結
- 上一篇: tinycore 的基本搭建,开机时间只
- 下一篇: shiro简单入门介绍