可观测告警运维系统调研——SLS告警与多款方案对比
簡介: 本文介紹對比多款告警監(jiān)控運(yùn)維平臺(tái)方案,覆蓋阿里云SLS、Azure、AWS、自建系統(tǒng)(ELK、Prometheus、TICK)等方案。
前言
本篇是SLS新版告警系列宣傳與培訓(xùn)的第三篇,后續(xù)我們會(huì)推出20+系列直播與實(shí)戰(zhàn)培訓(xùn)視頻,敬請關(guān)注。
?
系列目錄(持續(xù)更新)
- 一站式云原生智能告警運(yùn)維平臺(tái)——SLS新版告警發(fā)布!
- 這才是可觀測告警運(yùn)維平臺(tái)——20個(gè)SLS告警運(yùn)維場景
- 可觀測告警運(yùn)維系統(tǒng)調(diào)研——SLS告警與多款方案對比(本篇)
?
1. 什么是SLS告警運(yùn)維系統(tǒng)
1.1. SLS(日志服務(wù))是什么
SLS是阿里云上云原生觀測分析平臺(tái),為Log/Metric/Trace等數(shù)據(jù)提供大規(guī)模、低成本、實(shí)時(shí)平臺(tái)化服務(wù)。目前對內(nèi)已經(jīng)是“阿里巴巴 + 螞蟻金服”系統(tǒng)的數(shù)據(jù)總線,數(shù)年穩(wěn)定支撐雙十一、雙十二、新春紅包活動(dòng)。對外則已經(jīng)服務(wù)阿里云幾十萬企業(yè)客戶。
?
1.2. SLS新版告警——一站式智能告警運(yùn)維系統(tǒng)
SLS新版告警在中國站等發(fā)布公測(國際站預(yù)計(jì)4月發(fā)布),新版在SLS云原生可觀測性平臺(tái)上提供了一站式智能運(yùn)維告警系統(tǒng)。新版告警提供對日志、時(shí)序等各類數(shù)據(jù)的告警監(jiān)控,亦可接受三方告警,對告警進(jìn)行降噪、事件管理、通知管理等,新增40+功能場景,充分考慮研發(fā)、運(yùn)維、安全以及運(yùn)營人員的告警監(jiān)控運(yùn)維需求。
?
?
1.3. 優(yōu)勢
使用SLS新版告警,可以有效緩解典型告警運(yùn)維系統(tǒng)的痛點(diǎn),和其他自建、商業(yè)化或云廠商提供的方案比,具備如下5大優(yōu)勢:
?
2. 與自建方案對比
2.1. 與ELK X-Pack 告警 (Watcher/KibanaAlert)對比
2.1.1. 簡介
自建方案ELK表示使用開源方案ElasticSearch + Logstash + Kibana組合,但是其不包括告警功能,需要額外購買X-Pack商業(yè)包,會(huì)擁有2個(gè)告警功能,一個(gè)是ElasticSearch附帶的Watcher,一個(gè)是Kibana 7.x+新增的Alert功能,注意:這兩個(gè)告警功能互相獨(dú)立,并不能協(xié)同和關(guān)聯(lián)。
?
2.1.2. 評估對比
2.2. 與Prometheus ?& Loki(含AlertManager)告警對比
2.2.1. 簡介
自建方案Prometheus&Loki表示使用開源方案Prometheus + Loki + AlertManager組合,其中Prometheus Alert針對時(shí)序進(jìn)行告警監(jiān)控,Loki針對日志進(jìn)行告警監(jiān)控,兩者共同將告警發(fā)送給Alert Manager進(jìn)行告警管理。
?
2.2.2. 評估對比
?
2.3. 與InfluxDB 2.0 告警(含Kapacitor) 告警對比
2.3.1. 簡介
自建方案InfluxDB表示使用開源方案InfluxDB OSS 2.0 + kapacitor組合搭建告警監(jiān)控系統(tǒng),如果需要集群部署功能,還需要購買InfluxDB商業(yè)版本。注意,該方案只能支持針對時(shí)序數(shù)據(jù)的告警監(jiān)控。
?
2.3.2. 評估對比
?
3. 與其他云廠商方案對比
3.1. 與AWSCloudWatch 告警 +SNS+SSM對比
3.1.1. 簡介
AWS告警監(jiān)控方案,需要依賴AWS CloudWatch告警加上多個(gè)其他AWS服務(wù)達(dá)到告警監(jiān)控和管理的能力。一般使用CloudWatch Alarm + SNS + System Manager OpsCenter組合的方式完成對日志、時(shí)序的監(jiān)控管理。CloudWatch Logs支持日志的采集,但實(shí)際監(jiān)控告警時(shí),需要先轉(zhuǎn)換成時(shí)序才行。
?
3.1.2. 評估對比
3.2. 與AzureMonitor 告警對比
3.2.1. 簡介
Azure Monitor支持完整的基于時(shí)序與日志的監(jiān)控,并很好集成了上下游方案提供完整的告警監(jiān)控與告警管理通知功能。
?
3.2.2. 評估對比
?
4. 進(jìn)一步參考
4.1. 各方參考
?
- ELK:
-
- ElasticSearch Watcher: https://www.elastic.co/guide/en/kibana/current/watcher-ui.html
- ELK X-Pack Kibana Alert: https://www.elastic.co/guide/en/kibana/current/alerting-getting-started.html
?
- Prometheus & Lock:
-
- Prometheus Alert: https://prometheus.io/docs/prometheus/latest/configuration/alerting_rules/
- Prometheus AlertManager: https://prometheus.io/docs/alerting/latest/alertmanager/
- Loki Alert: https://grafana.com/docs/loki/latest/alerting/
?
- InfluxDB:
-
- InfluxDB Alert: https://docs.influxdata.com/influxdb/v2.0/monitor-alert/
- Kapacitor: https://docs.influxdata.com/kapacitor/v1.5/working/alerts/
?
- AWS:
-
- Cloudwatch Alarm: https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/AlarmThatSendsEmail.html
- Cloudwatch 定價(jià): https://aws.amazon.com/cn/cloudwatch/pricing/
- SNS A2P: https://docs.aws.amazon.com/sns/latest/dg/sns-user-notifications.html
- SNS 定價(jià): https://aws.amazon.com/cn/sns/pricing/
- SSM OpsCenter: https://docs.aws.amazon.com/systems-manager/latest/userguide/OpsCenter.html
- SSM 定價(jià):https://aws.amazon.com/cn/systems-manager/pricing/
?
- Azure:
-
- Azure Monitor Alert概念: https://docs.microsoft.com/en-us/azure/azure-monitor/alerts/alerts-overview
- Azure Monitor Alert指南: https://docs.microsoft.com/en-us/azure/azure-monitor/alerts/alerts-log
- Azure Kusto: https://docs.microsoft.com/en-us/azure/data-explorer/kusto/concepts/
- Azure Monitor定價(jià): https://azure.microsoft.com/en-us/pricing/details/monitor/
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
以上是生活随笔為你收集整理的可观测告警运维系统调研——SLS告警与多款方案对比的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从 Storm 迁移到 Flink,美团
- 下一篇: 【数据湖加速篇】 —— 如何利用缓存加速