阿里云服务网格ASM集成SLS告警
簡介:隨著微服務的流行,微服務的架構也在不斷的發展演進,Spring Cloud 與 Dubbo為代表的微服務開發框架也得到了普及和落地;在云原生時代,無侵入的服務網格(Service Mesh)開始走向成熟,相對于傳統微服務架構,服務網格具有可觀察性、流量控制、安全性三大優勢。服務網格將之前服務治理中的復雜性從應用中分離出來,將這些復雜性放到了服務代理中,包括流量控制,斷路,服務發現,安全性,可觀測性等;開發時應用只需要關心業務功能實現,讓責任劃分變得更加清楚。
1. 前言
隨著微服務的流行,微服務的架構也在不斷的發展演進,Spring Cloud 與 Dubbo為代表的微服務開發框架也得到了普及和落地;在云原生時代,無侵入的服務網格(Service Mesh)開始走向成熟,相對于傳統微服務架構,服務網格具有可觀察性、流量控制、安全性三大優勢。服務網格將之前服務治理中的復雜性從應用中分離出來,將這些復雜性放到了服務代理中,包括流量控制,斷路,服務發現,安全性,可觀測性等;開發時應用只需要關心業務功能實現,讓責任劃分變得更加清楚。
阿里云服務網格是阿里云提供的全托管式服務網格平臺,兼容Istio。在可觀測性方面,與SLS深度集成,提供了日志采集、可視化、告警一站式可觀察性解決方案。本文主要介紹介紹服務網格新推出的控制面日志采集和告警配置,同時也會涵蓋數據面訪問日志的采集和可視化;未來數據面的訪問日志的告警也將推出更多內置告警規則,實現可以在SLS上一站式進行告警管理。
2. 阿里云服務網格(ASM)介紹
阿里云服務網格(Alibaba Cloud Service Mesh,簡稱ASM)提供一個全托管式的服務網格平臺,兼容社區Istio開源服務網格,用于簡化服務的治理,包括服務調用之間的流量路由與拆分管理、服務間通信的認證安全以及網格可觀測性能力,從而極大地減輕開發與運維的工作負擔。
ASM中的控制平面組件完全有阿里云托管,兼容Istio,用戶只需要掛住業務應用的開發部署。 對于ACK托管集群,專有集群,Serverless集群,混合云或者多云場景,提供一致的流量控制,安全和可觀測性管理,控制平面核心組件由阿里云托管,最大限度降低用戶資源的開銷和運維成本。
在可觀測性方面,ASM支持使用SLS控制平面和數據平面的日志,并提供了內置的儀表盤及告警,未來將增加更多內置告警的內置告警規則,借助SLS強大的告警管理和通知功能,用戶可以更加對ASM的運行狀態更加了解,并及時獲得告警通知以進行下一步操作。
3. SLS告警介紹
日志服務SLS是云原生觀測與分析平臺,為Log、Metric、Trace等數據提供大規模、低成本、實時的平臺化服務。日志服務提供一站式數據采集、加工、查詢與分析、可視化、告警、消費與投遞等功能。
SLS告警是一站式的告警監控、降噪、事務管理、通知分派的智能運維平臺。SLS告警的核心功能組件主包括數據存儲,告警監控,告警管理,行動管理和開放告警幾個子系統。
SLS告警來源主要包括自定義告警,系統內置告警和開放告警。各類告警源產生告警后,告警會發送給告警管理系統,通過告警管理系統,用戶可以進行合并,抑制,靜默等處理;然后告警會到通知管理系統,在通知管理中,可以設置根據不同的告警屬性將將通知分派到不同的通知渠道。
4. ASM可觀測性日志采集及可視化
ASM可觀測性的日志主要包括控制平面和數據平面的日志:
- 控制平面日志ASM提供了基于SLS的告警功能;
- 數據平面日志主要包括入口網關日志,Envoy Access Log,在數據平面日志中ASM提供了基于SLS的內置儀表盤功能。
4.1. 數據平面入口網關日志采集及可視化
接入數據平面入口網關日志可以參考服務網格接入入口網關日志。主要包括安裝日志服務組件和采集配置,完成采集后,在ASM控制臺內嵌了入口網關概覽、入口網關訪問中心、入口網關監控中心三個儀表盤。
4.2. Envoy Access Log采集及可視化
接入Envoy Access Log可以參考使用日志服務采集數據平面入口網關日志,主要步驟包括安裝日志服務組件和采集配置,完成采集后可以在ASM控制臺查看訪問日志監控中心和訪問日志詳細記錄。
4.3. 控制平面日志采集及告警
ASM支持將控制平面的日志采集到SLS,然后根據日志進行告警配置,接下來著重介紹下如何開啟控制面日志采集及告警。
4.3.1 在ASM控制臺開啟告警
4.3.2 在SLS控制臺配置告警通知人
告警管理中心是SLS下基于業務的統一智能告警運維平臺,可以在全局配置->通知策略->行動策略中找到“SLS服務網關內置行動策略”,點擊修改可以查看其告警通知接收人,通知模板等。
在接收到告警后,可以根據告警中的內容提示進行一些處理建議。
| 錯誤信息 | 處理建議 |
| Internal:Error adding/updating listener(s) 0.0.0.0_443: Failed to load certificate chain from <inline>, only P-256 ECDSA certificates are supported | 該告警信息表示數據面集群不支持您為數據面配置的證書,當前僅支持P-256 ECDSA證書。您需要重新配置證書,具體操作,請參見通過服務網關啟用HTTPS安全服務 。 |
| Internal:Error adding/updating listener(s) 0.0.0.0_443: Invalid path: **** | 該告警信息表示您為數據面配置的證書路徑有誤或證書不存在,您需要檢查證書掛載路徑是否與Gateway中配置的路徑相符。具體操作,請參見通過服務網關啟用HTTPS安全服務 。 |
| Internal:Error adding/updating listener(s) 0.0.0.0_xx: duplicate listener 0.0.0.0_xx found | 該告警信息表示您為網關配置的監聽端口重復,請檢查您的Gateway,刪除重復的端口。 |
| Internal:Error adding/updating listener(s) 192.168.33.189_15021: Didn't find a registered implementation for name: '***' | 該告警信息表示在Sidecar和Ingressgateway中無法找到您通過EnvoyFilter針對15021這個Listener patch的配置中引用的***,您需要刪除該引用。 |
| Internal:Error adding/updating listener(s) 0.0.0.0_80: V2 (and AUTO) xDS transport protocol versions are deprecated in grpc_service *** | 該告警信息表示即將棄用您數據面的XDS V2協議,這通常是因為您的數據面Sidecar的版本與控制平面不符所致。升級數據平面的Sidecar可以解決該問題,您需要刪除Pod,該Pod自動重新創建后會自動注入最新版本的Sidecar。 |
5. 總結
本文主要描述了如果在阿里云服務網格中開啟數據面訪問日志及控制面日志,并且簡單介紹了數據面日志中的內置儀表盤和控制面日志的告警配置。借助SLS告警,用戶可以一站式的進行告警的管理,可以有效的提供運維效率。目前SLS支持了ASM控制面日志告警,未來,在ASM數據面日志采集和可視化基礎上,SLS將提供更多的內置告警規則,在ASM控制臺可以實現一鍵開啟內置告警規則,完善服務網格可觀測性的閉環,用戶也可以在SLS上實現統一的告警管理,敬請期待。
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的阿里云服务网格ASM集成SLS告警的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: HMS数据库设置和优化
- 下一篇: Inclavare Containers