云栖发布|企业级互联网架构全新升级 ,助力数字创新
作者|白玙
在 2021 杭州·云棲大會現場,阿里云智能云原生應用平臺產品負責人李國強以《企業互聯網架構轉型之道 - 阿里云中間件升級發布》為主題,全面解讀阿里云云原生產品創新實踐。過去一年中,為應對愈發激烈的行業競爭,重構應用架構已成為大勢所趨,據權威機構數據顯示,80% 以上的用戶已使用或計劃使用微服務,超過 68% 的機構在生產環境中使用容器。85% 以上用戶使用分布式追蹤,監控工具,日志。這些變化都凸顯出企業對于應用架構云原生化、部署運維云原生化、穩定性升級的強烈訴求。
阿里巴巴集團作為云原生受益者,通過云原生充分獲得云計算技術紅利,并實現全球最大規模的云原生實踐,所有業務 100% 跑在公共云上,應用 100% 云原生化。基于容器軟硬一體優化,在線業務部署百萬容器規模,帶來 CPU 資源利用率提升 30%、萬筆交易成本下降 80%、研發運維效率提升 20% 的技術價值。也是基于此,阿里巴巴將這些最佳實踐、解決方案分享給社會,幫助稅務、人社、銀行、保險、石油石化、零售快消、汽車制造、互聯網平臺等眾多行業挖掘更多社會價值。經過多年技術沉淀,阿里云提供超過 300 款云產品、近千個解決方案。在這其中,消息隊列 MQ、應用實時監控服務 ARMS、企業級分布式應用服務 EDAS 等已經成為不少企業在分布式互聯網架構中必不可少的組件。而此次云棲大會也首次對外曝光了這些產品的全新特性。
RocketMQ5.0 重磅升級
消息隊列作為當代應用的通信基礎設施,微服務架構應用的核心依賴,通過異步解耦能力讓用戶更高效地構建分布式、高性能、彈性健壯的應用程序。就數據與價值角度而言,消息隊列的價值不斷深化。消息隊列中流動的業務核心數據涉及集成傳輸、分析計算和處理等不同環節與場景。伴隨著不斷演進,我們可以預見消息隊列勢必在數據通道、事件集成驅動、分析計算等場景不斷產生新價值,創造新的“化學反應”。
此次,阿里云 RocketMQ 發布 5.0 版本全面升級為一站式“消息、事件、流”融合處理平臺,并具備以下兩大亮點:
(1)消息核心場景擴展:覆蓋事件驅動與消息流式處理等眾多場景;
(2)一站式融合處理技術架構迭代:實現一份消息存儲支持流式計算、異步投遞、集成驅動等多種場。
除去兩大亮點的同時,RocketMQ5.0 帶來全新三大功能:
(1)RocketMQ 基礎架構全新升級
輕量版 SDK 的開放和全鏈路可觀測系統的提升
消息級負載均衡
多網絡訪問支持
海量分級存儲
(2)在 Streaming 流式處理場景推出輕量級消息 ETL 功能
輕量無依賴
開發門檻低
Serverless 彈性
(3)EDA 云上最佳實踐——事件中心 EventBridge
統一標準化的事件集成生態
全球事件互通網絡
Serverless 低代碼開發
微服務產品家族再升級
微服務作為如今應用互聯網架構重要代表,隨著微服務與容器不斷融合,可以看到企業對于微服務應用架構與業務要求不斷明晰。架構方面,如 Spring Cloud、Dubbo 基于 Java 的微服務體系,以及隨著多元趨勢出現而逐漸興起的 Service Mesh 技術體系成為主流。需求方面,業務開發設計面向微服務、軟件基礎架構原生容器化、應用生產運維升級鳥瞰式成為核心訴求。阿里云通過是微服務引擎 MSE、服務網絡 ASM 去完美支撐這兩類不同微服務體系。
虛擬化時期的微服務架構下,業務通常采用流量網關 + 微服務網關的兩層架構,流量網關負責南北向流量調度和安全防護,微服務網關負責東西向流量調度和服務治理,而在容器和 Kubernetes 主導的云原生時代,Ingress 成為 Kubernetes 生態的網關標準,賦予了網關新的使命,使得流量網關 + 微服務網關合二為一成為可能。
此次,阿里云 MSE 發布的云原生網關在能力不打折的情況下,將兩層網關變為一層,不僅可以節省 50% 的資源成本,還可以降低運維及使用成本。MSE 云原生網關依托于 Envoy 和 Istio 進行構建,實現了統一的控制面管控,并直連后端服務,支持了 Dubbo3.0、Nacos,打通阿里云容器服務 ACK,自動同步服務注冊信息。
MSE 云原生網關早已在阿里巴巴內部經歷千錘百煉。目前已經在支付寶、釘釘、淘寶、天貓、優酷、飛豬、口碑等阿里各業務系統中使用,并經過 2020 雙 11 海量請求的考驗,大促日可輕松承載每秒數 10 萬筆請求,日請求量達到百億級別。
作為業內首個全托管 Istio 兼容的服務網格產品,阿里云服務網格(簡稱 ASM)作為統一管理微服務應用流量、兼容Istio的托管式平臺,專注打造全托管、安全、穩定、易用的服務網格。支持跨地域多集群、多云混合云服務的統一治理,讓無處不在的應用服務輕松跨多種異構計算基礎設施進行相互通信。今日更是對外發布 ASM Pro 專業版,覆蓋更多應用場景,主要包括:
- 支持 Dubbo 等微服務框架與擴展協議:通過提供更多場景化能力滿足客戶灰度發布、金絲雀發布、服務流量無損下線、以及全鏈路灰度等不同訴求。
- 全面融合多種服務注冊中心:充分融合 Nacos 服務注冊中心的高可用能力、跨注冊中心的多語言服務互通、以及高性能、大規模場景支持。
- 云邊一體的統一服務網格能力:支持跨地域多集群、多云混合云上的服務的統一治理、支持 ACK Edge 邊緣集群,探索邊緣計算中服務網格的場景。
- 優化現有應用進行現代化改造:統一支持容器、虛擬機等多種異構計算基礎設施的混合部署, 助力虛擬機應用的遷移;增強 OPA 策略動態執行能力,無代碼改造實現零信任安全,簡化管理多種類型的計算基礎設施上的應用。
- 全棧優化:通過操作系統和軟硬一體方式降低服務通信時延和加密開銷,提升 TLS 加解密的效率及數據面的性能。
通過流量控制、網格觀測、服務間通信安全等功能,服務網格 ASM 全方位簡化服務治理,為運行在異構計算基礎設施上的服務提供統一管理能力,適用于無處不在的 Kubernetes 集群、Serverless Kubernetes 集群、ECS 虛擬機以及自建集群。
最后,微服務應用在開發過程中,需要一個全站式平臺覆蓋應用架構設計、開發、測試、上線、運維整個體系。一站式云原生應用研發支撐對于用戶的提效具備著非凡的意義。因此,云原生應用設計&開發平臺 ADD 應運而生,幫助企業快速進行原生開發,以應用視角全生命周期管理云原生應用,并具備以下特性:
一、應用開發&架構設計:實現支持應用架構圖的拖拉拽式設計,提供預置及企業自定義應用架構模板。
二、云原生資產商店:為企業提高開箱即用的中間件服務,并沉淀企業的公共業務組件、公共技術中間件,實現企業軟件資產的標準化、產品化、分享和復用。
與此同時,企業級分布式應用服務 EDAS v4.0,重新構建用戶應用發布與上線的整個流程,實現鳥瞰式運維以及雙模治理,助力應用運維現代化,加速在線業務云原生化。
ARMS 3.0 - 企業可觀測體系 All in one
作為企業技術架構中的重要組成部分,不同社區、機構對于可觀測領域的趨勢觀點愈發收斂一致:
- 全棧一體化:當一個請求進到業務系統,從前端到應用層到固定資源上,企業如何把整個鏈路串聯起,一體化的將縱向鏈路與橫向數據打通,成為考驗運維團隊的關鍵能力。
- 云原生可觀測標準化:當可觀測開源領域 Grafana、Prometheus、OpenTelemetry成為事實標準,企業搭建云原生可觀測體系更加高效、有跡可循。
- AIOps:隨著每個企業技術不斷擴張,其擁有的運維數據規模與維度不斷增加,包括海量指標、logging 以及 tracing數據。AI 在這過程中發揮巨大作用,更快速、更高效的發現、解決異常及問題。
為了滿足以上趨勢與需求,阿里云發布 ARMS 3.0,幫助企業實現可觀測體系 All in one,實現統一接入、統一指標、統一鏈路、統一計量、統一面板、統一告警。
- 支持 50+ 技術組件,從接入體驗、業務應用到基礎設施層縱向全鏈路打通;
- Metric,Logging,Tracing 橫向打通,加速問題診斷;
- 全面支持 Prometheus、Grafana、OpenTelemetry 云原生可觀測三大開源標準;
- 支持接入 10+ 監控告警系統接入,實現離散告警消息的統一管理,同時結合算法與阿里經驗,提供智能降噪和根因分析能力。
值得一提是,阿里云憑借 ARMS 成為國內唯一入選《2021 年 Gartner APM 魔力象限》的云廠商,產品能力和戰略愿景獲得 Gartner 分析師高度認可。
高可用
高可用家族中的應用高可用服務 AHAS 也進行了一次重大的產品升級,應用高可用服務(Application High Availability Service)專注于提高應用及業務的高可用能力,主要提供流量防護、故障演練、多活容災三大核心能力。此次升級各模塊都在為用戶業務的穩定性和韌性方面有了很大的產品提升。
首先在流量防護方面,創新性的提供集群防護功能,幫助客戶解決業務單機流量不均、集群小流量等典型集群流控問題。同時網關防護場景下,目前已經支持基于 C/C++ 原生版本的 nginx 插件方案,穩定支持 Sentinel 核心流控及 API 歸組能力的同時,性能損耗大大降低,吞吐量損耗 5% 以內,CPU 占用在 0.8 核以內。除此之外,監控告警能力和防護場景化方面都從業務場景維度和易用性維度有了較大的提升與優化。
故障演練(Chaos)是云原生混沌工程平臺,提供了大規模、低成本、影響可控、形式多樣化的故障演練服務。Chaos 提供一站式架構分析、故障巡檢、故障注入、系統穩態度量等功能,幫助用戶增強分布式系統的容錯性和可恢復性,幫助系統平穩上云。此次故障演練平臺也從演練場景、演練形式、易用性和開源兼容等多方面進行了全面的升級。
- 演練場景上,支持 Windows 類型的演練節點;支持預檢、斷網、恢復、復盤一站式的容災斷網演練;微服務演練也升級至 2.0,支持服務級別的強弱依賴自動化驗證。
- 演練形式方面,此次重磅發布可視化演練,支持基于業務架構拓撲一鍵發起演練。
- 開源兼容性方面,支持社區版在線托管至企業版,且支持一鍵升級至企業版。
多活容災(MSHA)方案由業務異地多活容災解決方案全面升級至業務多活容災解決方案,更兼容、更穩定、更簡單。
兼容更豐富的容災架構與業務組件。
新增同城雙活/多活容災架構、異地雙活容災架構和異地應用雙活容災架構。新增對 MQTT、ScheduleX、K8S、PolarDB 等組件模塊的多活容災支持。
核心容災能力加固,穩定性提升 50% 以上。
通過對接入層、服務層、消息層、任務調度層和數據層的多活容災架構優化和加固,自上而下的的流量穿透優化,容災能力整體穩定性提升 50% 以上。
同城零改造,異地容災改造工作量下降 20% 以上。
同城場景下,業務零改造,平均 3h 內完成同城多活容災業務上線。異地容器業務場景下,依托 pilot 快速集成 agent,大大降低容災改造成本。
此次全面升級,讓業務技術團隊有了更多選擇,通過簡單、豐富、開放和低成本的 PaaS 服務,幫助企業客戶更簡單、更高效的進行在云上創新,搭建更符合業務需要和團隊情況的技術體系
總結
以上是生活随笔為你收集整理的云栖发布|企业级互联网架构全新升级 ,助力数字创新的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 云栖收官:想跟远道而来的朋友们说
- 下一篇: 云原生网关开源、自研、商业化三位一体战略