【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics
摘要:?近日,阿里云重磅推出Serverless數(shù)據(jù)分析引擎-Data Lake Analytics,Data Lake Analytics,幫助更多不具備分析能力的存儲(chǔ)服務(wù),賦予其分析的能力。
近日,阿里云重磅推出Serverless數(shù)據(jù)分析引擎-Data Lake Analytics,Data Lake Analytics,幫助更多不具備分析能力的存儲(chǔ)服務(wù),賦予其分析的能力。
從生活中的購(gòu)物交易,到工業(yè)上的生產(chǎn)制造,再到社交網(wǎng)絡(luò)媒體信息、企業(yè)化管理決策等等,大數(shù)據(jù)成為當(dāng)前經(jīng)濟(jì)社會(huì)最重要的前進(jìn)方向之一。越來越多的企業(yè)在面臨數(shù)據(jù)以指數(shù)級(jí)成倍增長(zhǎng)的時(shí)候,第一選擇存儲(chǔ)服務(wù)來存儲(chǔ)數(shù)據(jù),那在人人高喊數(shù)據(jù)為王的時(shí)代,如果數(shù)據(jù)僅僅被存儲(chǔ)起來,而不加以分析,那數(shù)據(jù)的超能力也將毫無意義。
擁抱分析能力迫在眉睫
很多企業(yè)用戶選擇阿里云對(duì)象存儲(chǔ)服務(wù)OSS或者表格存儲(chǔ)(Table Store)來存儲(chǔ)數(shù)據(jù),作為面向海量數(shù)據(jù)、極低成本、高度靈活的存儲(chǔ)平臺(tái),云上客戶存儲(chǔ)了大量的流水?dāng)?shù)據(jù)、日志數(shù)據(jù)、監(jiān)控?cái)?shù)據(jù)等,然而這些數(shù)據(jù)今天不具備低成本、靈活高效的分析能力。OSS和Table Store不但存儲(chǔ)了大量的歷史數(shù)據(jù),而且新數(shù)據(jù)每日劇增。
以往客戶需要分析OSS數(shù)據(jù),需要臨時(shí)將數(shù)據(jù)導(dǎo)入各種事先購(gòu)買或者部署好的分析引擎,分析完再將數(shù)據(jù)刪除、釋放分析引擎的資源,鏈路長(zhǎng),耗時(shí)耗力極其不便,也不利于節(jié)省成本。
如果客戶使用Hadoop等傳統(tǒng)的MR解決方案,雖然存儲(chǔ)和計(jì)算分離,但是考慮到資源復(fù)用,往往需要在購(gòu)買的ECS或者物理機(jī)上既部署存儲(chǔ)節(jié)點(diǎn)又要部署計(jì)算節(jié)點(diǎn),存儲(chǔ)和計(jì)算無法做到真正的按需各自擴(kuò)展。而開源Greenplum等傳統(tǒng)的MPP數(shù)據(jù)庫(kù),更是存儲(chǔ)和計(jì)算一體化,存儲(chǔ)和計(jì)算分別按需擴(kuò)展更是無法支撐。
而Serverless化數(shù)據(jù)分析引擎-Data Lake Analytics彌補(bǔ)了以上痛點(diǎn)。無需ETL,就可使用標(biāo)準(zhǔn) SQL、現(xiàn)有的商業(yè)智能 (BI) 和ETL工具,以極低成本與高效地輕松分析與集成在阿里云OSS、Table Store數(shù)據(jù)源的數(shù)據(jù)。
Data Lake Analytics四大特性為數(shù)據(jù)分析保駕護(hù)航
Data Lake Analytics使得更多異構(gòu)數(shù)據(jù)源具備融合分析的能力。不僅支持聯(lián)合OSS和Table Store進(jìn)行數(shù)據(jù)分析,后續(xù)也會(huì)支持對(duì)接更多的數(shù)據(jù)源接入,Serverless,意味著客戶使用分析服務(wù)無需購(gòu)買或者管理服務(wù)器,升級(jí)透明,Data Lake Analytics基于ECS、ESS輕松做到彈性伸縮服務(wù),能讓業(yè)務(wù)真正做到按需擴(kuò)存儲(chǔ)、計(jì)算資源,按使用量付費(fèi)分析,不分析只需要擁有存儲(chǔ)成本,整個(gè)方案成本極低。
不僅如此,Data Lake Analytics支持SQL 2003標(biāo)準(zhǔn)、豐富的內(nèi)置函數(shù)支持,可以像使用數(shù)據(jù)庫(kù)一樣做訪問OSS文件或者其他數(shù)據(jù)源。支持標(biāo)準(zhǔn)JDBC/ODBC, 應(yīng)用程序輕松集成。在交互式能力上,Data Lake Analytics通過高效智能優(yōu)化器,新一代分析引擎XIHE, 全面融合MPP+DAG技術(shù)使得查詢性能非常出色,具備真正的可交互式分析能力。
打破傳統(tǒng),多場(chǎng)景適用
場(chǎng)景一:數(shù)據(jù)提取平臺(tái)
某客戶有大量的數(shù)據(jù)在OSS上,每天開發(fā)者要處理大量的臨時(shí)取數(shù)的需求,客戶最終基于OSS + Data Lake Analytics做到廉價(jià)可擴(kuò)展的數(shù)據(jù)提取平臺(tái)。整個(gè)方案如下:
客戶端通過報(bào)表工具生成各種提取數(shù)據(jù)的SQL,報(bào)表工具將SQL發(fā)送至Data Lake Analytics, Data Lake Analytics則直接去分析OSS數(shù)據(jù),然后將分析后的結(jié)果返回給報(bào)表工具。OSS的10TB的存儲(chǔ)每月費(fèi)用在1200元左右,Data Lake Analytics則是完全按照查詢使用量來付費(fèi)(目前處于公測(cè)免費(fèi)階段),從而實(shí)現(xiàn)了一個(gè)完全自助化、極其廉價(jià)的可持續(xù)擴(kuò)展的數(shù)據(jù)提取平臺(tái)。
場(chǎng)景二:DB冷數(shù)據(jù)分析和快速恢復(fù)
為降低rds的成本,客戶不定期的有大量的歷史庫(kù)數(shù)據(jù)通過DBS備份至OSS,針對(duì)歷史歸檔的業(yè)務(wù)數(shù)據(jù),偶爾可能有少量的分析需求,此時(shí)通過Data Lake Analytics即可輕松滿足。此外,客戶若發(fā)現(xiàn)在線庫(kù)的業(yè)務(wù)數(shù)據(jù)需要利用OSS歸檔數(shù)據(jù)做訂正,以往做法是先購(gòu)買一個(gè)超大規(guī)格的RDS, 然后將OSS備份恢復(fù)至RDS,將用來做訂正的數(shù)據(jù)查詢出來。有了Data Lake Analytics后,就可以輕松的通過Data Lake Analytics直接查詢到OSS的數(shù)據(jù)用做訂正,非常便捷,成本同時(shí)降低了很多。Data Lake Analytics提供端到端的數(shù)據(jù)安全訪問保障,支持OSS的安全角色訪問和表級(jí)別的用戶授權(quán),實(shí)現(xiàn)用戶數(shù)據(jù)的安全隔離。
場(chǎng)景三:能源電池?cái)?shù)據(jù)分析平臺(tái)
客戶有大量電池?cái)?shù)據(jù),需要天級(jí)別僅分析一次蓄電池的數(shù)據(jù),來分析電池的使用壽命,以決定是否提前做報(bào)廢。客戶通過將電池?cái)?shù)據(jù)批量上傳至OSS,通過Data Lake Analytics每日分析一次,OSS 10TB月均存儲(chǔ)成本約1200元,Data Lake Analytics則按照查詢數(shù)據(jù)量計(jì)費(fèi)(目前公測(cè)期間不收費(fèi)),成本極具優(yōu)勢(shì)。
云上目前OSS、Table Store等存儲(chǔ)有大量的業(yè)務(wù)數(shù)據(jù)急需分析能力,而Data Lake Analytics的出現(xiàn)則很好的滿足了這一需求。對(duì)于云上中小企業(yè)來說,可以選擇用最廉價(jià)的存儲(chǔ)來搭配最普惠靈活的的分析能力。阿里云Data Lake Analytics正是最普惠靈活的分析能力的實(shí)踐者,目前公測(cè)期間免費(fèi)試用,歡迎大家前來體驗(yàn).
PC端請(qǐng)戳鏈接體驗(yàn)公測(cè):http://click.aliyun.com/m/1000005393/
原文鏈接
本文為云棲社區(qū)原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的【免费公测中】为数据赋予超能力,阿里云重磅推出Serverless数据分析引擎-Data Lake Analytics的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 提升普适性,阿里云官方SDK发布支持Go
- 下一篇: 他在阿里的逆袭,只因为想做个“锤子”