Kubernetes,多云和低代码数据科学:2020年最热门的数据管理趋势
新興技術(shù)為我們的數(shù)據(jù)之旅鋪平了道路。我們已經(jīng)看到Kubernetes在應(yīng)用程序自動化方面處于領(lǐng)先地位,越來越多的公司將賭注押在了云上,以及當(dāng)今的企業(yè)對數(shù)據(jù)科學(xué)的依賴程度正不斷提,再加上對大數(shù)據(jù)的人工智能高級分析,可以看到數(shù)據(jù)管理領(lǐng)域正出現(xiàn)更多機(jī)會。
以下是我期待在2020年看到的一些最大數(shù)據(jù)趨勢。
趨勢1:Kubernetes將在2020年推動AI更加可操作
在高級分析和人工智能方面,“ Kubernetizing”將在2020年帶來全新的分析堆棧。通過將數(shù)據(jù)從遠(yuǎn)程數(shù)據(jù)孤島移動到K8s集群中以實現(xiàn)更嚴(yán)格的數(shù)據(jù)局部性,分析堆棧的 “ Kubernetizing”解決了數(shù)據(jù)共享和彈性挑戰(zhàn)。盡管容器對于管理Web服務(wù)器和獨(dú)立數(shù)據(jù)庫等無狀態(tài)應(yīng)用程序非常有效,但在高級分析和AI方面,Kubernetes仍有增長的空間。在2020年,Kubernetes將成為推動運(yùn)營AI工作負(fù)載的關(guān)鍵部分。
分析堆棧正從SQL轉(zhuǎn)移到緊耦合的關(guān)系數(shù)據(jù)庫,再到Hadoop和云,逐漸變得更加分散。原始數(shù)據(jù)庫的核心元素可以是它們自己的獨(dú)立系統(tǒng)或?qū)印VT如Kubernetes之類的技術(shù)允許將這些不同的部分組合在一起,從而簡化在任何環(huán)境中運(yùn)行的應(yīng)用程序,并改變與環(huán)境無關(guān)的軟件和應(yīng)用程序的部署和擴(kuò)展方式。
現(xiàn)在,當(dāng)我們仔細(xì)思考當(dāng)今的數(shù)據(jù)趨勢已將我們帶到何處時(尤其是高級分析和AI)時,我們看到了對分發(fā)模型訓(xùn)練和處理的更大需求。這需要在您的Kubernetes部署中編排數(shù)據(jù)。這是一個很難解決的問題,因為要顧忌分析堆棧是如何分開的。數(shù)據(jù)湖(S3,HDFS,GCS等),計算框架(Apache Spark,Presto,Hive,Tensorflow等)以及其他依賴項(例如目錄服務(wù))(Hive Metastore,AWS Glue,KMS等)都處于活動狀態(tài)并自行管理。隨著Kubernetes驅(qū)動更多可操作的AI,數(shù)據(jù)編排技術(shù)將成為這一趨勢的關(guān)鍵部分。
Kubernetes簡化了將多個分布式系統(tǒng)一起部署的復(fù)雜性,但隨著分解變得越來越普遍,我們將看到在K8s集群上運(yùn)行的更先進(jìn)的可操作AI。下一組要解決的挑戰(zhàn)將是數(shù)據(jù)訪問,數(shù)據(jù)局部性和數(shù)據(jù)彈性。
為了在Kubernetes中為可操作的AI做準(zhǔn)備,請查看使Kubernetes中的數(shù)據(jù)能夠訪問遠(yuǎn)程數(shù)據(jù)的技術(shù)。對于未來的AI工作負(fù)載需求而言,將數(shù)據(jù)本地化重新帶入環(huán)境至關(guān)重要。
趨勢2:無碼/低碼技術(shù)將簡化數(shù)據(jù)科學(xué)
到2020年,借助無代碼/低代碼技術(shù),簡化的數(shù)據(jù)科學(xué)將得到發(fā)展。我們看到企業(yè)中比以往任何時候都更側(cè)重于使用高級的分析和人工智能;公司將業(yè)務(wù)押在從AI和ML衍生的數(shù)據(jù)驅(qū)動的結(jié)果上。如今,要對大量數(shù)據(jù)進(jìn)行如此深入的分析和洞察,您需要一名數(shù)據(jù)科學(xué)家或工程師——具有廣泛的編程技能和非常深的數(shù)學(xué)知識的人員。可以想象,這些類型的人的需求量很大,供不應(yīng)求。
2020年會帶來什么?
數(shù)分鐘被部署而不是數(shù)周的AI。這是公司想要實現(xiàn)的目標(biāo),盡管可以實現(xiàn)這一目標(biāo)的專業(yè)人員數(shù)量有限。我們將看到更多使最終用戶(在大多數(shù)情況下為業(yè)務(wù)或數(shù)據(jù)分析師)從自己的數(shù)據(jù)中收集深刻見解的技術(shù)。這些無代碼或低代碼技術(shù)將把機(jī)器學(xué)習(xí)帶到最前沿,并使服務(wù)變得更智能,因此企業(yè)不會依賴具有特定專業(yè)知識的個人。例如,除了構(gòu)建和部署模型之外,我們還將看到“創(chuàng)建您自己的模型,我們將為您提供訓(xùn)練”的自主技術(shù)。
我們最近看到的項目包括Google的Cloud AutoML(“無需編碼的AI培訓(xùn)師”)和Teachable Machine 2.0(面向新的ML實踐者的入門產(chǎn)品)之類的技術(shù)。此類技術(shù)將使非技術(shù)的最終用戶能夠?qū)嵤┖瓦\(yùn)行模型,同時避免出現(xiàn)錯誤(在構(gòu)建AI模型時經(jīng)常發(fā)生錯誤)。
今年,我們看到C3.ai,Mendix和Appian公司在低代碼AI領(lǐng)域涌現(xiàn)了幾項新技術(shù),所有這些新技術(shù)都吹捧了低代碼平臺,這些平臺幾乎不需要編碼經(jīng)驗,甚至可以提高開發(fā)人員的工作效率。
如果此方法適合您,請確保您的無代碼/低代碼技術(shù)具有內(nèi)置的應(yīng)用程序邏輯,位于其上方的托管或聲明層以及位于其下方的可與數(shù)據(jù)集和模塊配合使用的框架。
趨勢3:云計算巨頭將專注于多云
在過去三年中,我們一直在聽到人們談?wù)摶旌显?#xff0c;而在過去的一年中,多云的趨勢越來越多。在大多數(shù)情況下,這只是討論,但在2020年將發(fā)生變化。在部署和利用多云環(huán)境方面,我們將看到顯著增長。
我們正處于主要云提供商(AWS,GCP,Azure)的起步階段,他們向市場推出了能夠支持多云部署的技術(shù)。
Microsoft Azure Stack Hub允許用戶在自己的數(shù)據(jù)中心中利用Azure云服務(wù),而Microsoft最近剛剛發(fā)布了Azure Arc,這是一個多云管理層,將Azure擴(kuò)展到其他公共云平臺(例如AWS和GCP)。
AWS Outposts允許用戶在本地運(yùn)行適用于多云/混合架構(gòu)的AWS基礎(chǔ)設(shè)施。用戶可以利用任何數(shù)據(jù)中心,托管空間或本地設(shè)施中的任何AWS服務(wù),基礎(chǔ)架構(gòu)或運(yùn)營模型。
Google Anthos可使應(yīng)用程序能夠在Google Cloud,私有數(shù)據(jù)中心(確實如此)和/或其他公共云(Azure和AWS)中運(yùn)行。它使用戶真正成為不需可感知云和喜歡使用多云的人。
云提供商意識到不同的用例需要不同的環(huán)境,并且正在構(gòu)建產(chǎn)品,允許其用戶從一個數(shù)據(jù)中心(云)靈活地遷移到另一個數(shù)據(jù)中心。
這些技術(shù)的好處是巨大的。用戶可以自由地在他們想要的任何地方輕松地部署,運(yùn)行和管理其應(yīng)用程序,同時滿足業(yè)務(wù)和技術(shù)要求。必須學(xué)習(xí)不同的環(huán)境和不同的API的日子已經(jīng)一去不復(fù)返了。這些技術(shù)使企業(yè)可以避免供應(yīng)商鎖定,通過使用更接近客戶的數(shù)據(jù)中心來獲得更好的性能(更少的延遲),幫助遵守數(shù)據(jù)治理要求(例如GDPR),并在發(fā)生故障時提供彈性。
在2020年,我們將看到企業(yè)在多云環(huán)境下的數(shù)量翻倍。隨著這些類型的服務(wù)逐漸成為主流,入門也變得容易。
關(guān)于作者
史蒂文·米(Steven Mih)是Alluxio的首席執(zhí)行官。他在企業(yè)技術(shù)解決方案的銷售,業(yè)務(wù)開發(fā)和市場營銷方面擁有20多年的經(jīng)驗。他的營銷經(jīng)驗來自于一些領(lǐng)先的組織,包括Aviatrix,Couchbase,Transitive,Cadence Design Systems和AMD。
總結(jié)
以上是生活随笔為你收集整理的Kubernetes,多云和低代码数据科学:2020年最热门的数据管理趋势的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 成本计算引擎动态规则解析技术详解
- 下一篇: 性能优化 = 改改代码?