informatica数据脱敏_助您首个大数据项目破茧成蝶的实践指南
自從本世紀初軟件應用開始在整個業務流程中盛行以來,一個不爭的事實就是:數據改變了我們的工作方式。越來越多的企業認識到必須在大數據方面有所作為,但他們卻并未切實規劃出如何開展這項工作。而調查發現,切實展開的大數據項目,因為缺少明確目標,55%都會半途而廢。在一項技術趨勢早期階段出現這樣的失敗并非罕見,倘若不吸取經驗教訓,那顯然不是明智之舉。
大數據項目失敗的首要原因是缺乏清晰的目標。現在,讓Informatica確保您計劃的項目不會因為目標模糊而失敗。
制定目標
1、確定業務目標
讓我們先從業務開始,因為要使項目得到充分重視,這些目標必須放在比IT更重要的位置上。制定您希望項目實現的業務目標時,請盡量具體。并且記住確定產生可衡量影響的目標。例如,在可預測客戶流失的客戶服務接口示例中,項目列出的目標不應是像“提高客戶體驗”這樣模糊的說法。目標越清晰,離實現目標的距離就越近。一個高度精確的目標比五個模糊的目標更有價值。
2、確定IT目標
現在,讓我們看一下與項目相關的IT目標。需要指出的是,如果項目是要幫助IT更快更好地工作,向業務用戶推銷的時候會很困難。就其本身而言,IT目標的溝通描述應與業務用戶十分感興趣的目標結合。按照重要性高低列出與IT相關的大數據項目的目標。例如,建立聚合客戶數據、信用卡使用數據、社交圖數據和流失指標的實時收集、清洗、掌握和存儲流程。
3、確定數據需求
現在我們已經概括介紹了如何制定大數據項目的具體目標,接下來我們開始直接討論項目的核心——數據本身。無論是什么項目,必須戰略性地思考您需要什么信息,使用什么數據集應對這種需求, 以及如何獲取和使用這樣的數據。
五個關鍵數據考慮事項
一旦列出您要尋找的數據,您就會更清楚地了解所面臨的具體大數據挑戰。尤其重要的是,在進一步行動之前,有五個您必須考慮的關鍵要素,這些要素將決定針對每個數據集以及您的大數據數據集需要采取的行動。
1、為海量數據做好準備
您必須做好應對需要“海量”數據的準備。從多個角度根據數據價值、使用情況、大小、復雜度以及允許訪問數據的人員對數據進行分類。全面、有序的數據庫存有利于您確定如何對所有數據進行管理。評估您的當前存儲和處理能力,并尋找最經濟高效的方式來擴展它。
2、應對多樣性
大數據最具挑戰性的一面是,必須在分析中統協多種不同的格式和結構。如果要在已經習慣使用的數據源之外增加新的數據類型和結構,則您必須集成大量的數據源。如果要對每次集成都進行手動編碼,則會非常繁瑣,必將耗費您的所有時間和資源。充分利用所提供的數據集成和數據質量工具,可以讓更有價值的任務加快進度。
3、處理速度
實時流數據和歷史數據相結合往往能提高分析的預測能力。因此,您所需要的某些數據只有在不斷涌入您的系統時才可能有價值。實際上,大多數實時分析都需要基于流數據進行。這種數據通常來自不同的源并采用不同的格式。為您的項目準備流分析技術和一個邏輯基礎設施,以便管理所有數據。
4、確保真實性
無論您的分析有多么重要,如果人們不信任其中的數據,它就一文不值。根據需要準備的數據創建類別,包括原始數據以及由經過清洗的可靠權威數據組成的數據存儲等,該數據存儲已進行精心組織并會受到掌控。
5、考慮合規性
您處理的不同數據集也會具有不同的安全規定和要求。對于每個數據集,您需要考慮需要采取什么措施來根據安全策略對數據進行匿名化處理。您的海量數據會分散在企業的數百個數據存儲中。您需要熟悉敏感數據所在的位置,并通過加密來確保其數據源的安全性,然后對有權訪問該數據的人員加以控制。除了對敏感數據進行安全、智能存檔之外,還要隨時在其遷移或進入開發和測試環境時使用預定義的規則使該數據脫敏。
對要處理的每個數據集應用上述五個考慮事項,您就可以更現實地做好準備以迎接大數據的挑戰。但如果要建立一個更加穩固的大數據項目,您還必須為數據治理搭建一個程序框架。實際上,即使大數據項目的目標只是為一個部門創造價值,您也需要考慮設立一個小型數據治理委員會,以便您了解如何應對此類機構提出的獨特挑戰。
然后,您的大數據之旅即將啟程。
總結
以上是生活随笔為你收集整理的informatica数据脱敏_助您首个大数据项目破茧成蝶的实践指南的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vdp备份oracle系统,VDP文件级
- 下一篇: worknc的后处理如何安装_如何选择永