数据湖,已成为海量数据存储与分析的重要承载方式
簡介: 在云計算和大數據時代,基于數據開展生產、運營、決策成為常態,根據Gartner報道,2019年數據基建方面的采購費用飆升到660億美元,占據基礎架構類軟件費用的24%。數據的存儲及應用體系是企業生態運轉的中樞神經,數據湖已經成為海量數據存儲與分析的重要承載方式。
在洶涌而至的信息化浪潮下,大數據技術不斷更新迭代,數據管理工具得到飛速發展,相關概念也隨之而生。數據湖(Data Lake)概念自2011年被推出后,其概念定位、架構設計和相關技術都得到了飛速發展和眾多實踐,數據湖也從單一數據存儲池概念演進為支撐高效、安全、穩定企業級數據應用的下一代基礎數據平臺。
?
?
此次發布的《數據湖應用實踐白皮書》涵蓋了數據湖的定義與架構、數據湖核心組件與方案介紹、數據湖構建方案、應用實踐等內容,希望為用戶提供新的洞察。
?
?
通過閱讀本書,包括開發者、IT運維人員、企業數字化管理者等可以全面了解阿里云基于云原生技術的企業級數據湖解決方案和相關產品,也能明晰傳統數據倉庫和數據湖的差異。?
?
?
在云計算和大數據時代,基于數據開展生產、運營、決策成為常態,根據Gartner報道,2019年數據基建方面的采購費用飆升到660億美元,占據基礎架構類軟件費用的24%。數據的存儲及應用體系是企業生態運轉的中樞神經,數據湖已經成為海量數據存儲與分析的重要承載方式。
?
?
市場調研機構Research and Markets發布的報告顯示,2020年,全球數據湖市場的價值為37.4億美元,預計到2026年將達到176億美元,在2021年至2026年的預測期間的復合年增長率為29.9%。
?
?
云原生時代的到來,引領數據湖進入了“云湖共生”新的階段。在此背景下,阿里云推出基于云原生技術的企業級數據湖解決方案,該方案采用了存儲計算分離架構,存儲層基于阿里云對象存儲OSS構建,并與阿里云數據湖分析(Data Lake Analytics 簡稱 DLA)、數據湖構建(Data Lake Formation簡稱 DLF)、E-MapReduce(簡稱EMR)、DataWorks(簡稱DW)等計算引擎無縫對接,且兼容豐富的開源計算引擎生態。
?
?
十年蹤跡十年心,結合先進的數據科學與機器學習技術,數據湖還能為企業提供預測分析,幫助企業構建、優化訓練模型等。希望這本白皮書可以為企業和組織的數字化轉型實踐提供指引,為相關領域的業務決策者與實踐者提供面向行業應用場景的重要參考。
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的数据湖,已成为海量数据存储与分析的重要承载方式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微服务+异步工作流+ Serverles
- 下一篇: 如何在工作中快速成长?致工程师的10个技