日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

java告警系统设计_告警系统的设计

發(fā)布時(shí)間:2025/3/12 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 java告警系统设计_告警系统的设计 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

現(xiàn)在告警系統(tǒng)可以說是系統(tǒng)的必備部分,只要有監(jiān)控,就需要一個(gè)告警系統(tǒng)來幫忙主動(dòng)推送消息,以此減少人不停的主動(dòng)查看監(jiān)控的作用。

在最初的告警系統(tǒng)中,基本主要就是設(shè)置閾值,達(dá)到閾值就發(fā)生告警。這個(gè)在機(jī)器數(shù)量少的時(shí)候是滿足需求的。例如10個(gè)進(jìn)程,就算都出問題也就是10條告警。在使用的過程中,隨著進(jìn)程數(shù)量的增多,告警種類的增多。會(huì)出現(xiàn)告警的洪荒,一直不停的收到告警。

重復(fù)性

為了準(zhǔn)確的傳達(dá)告警信息,告警的設(shè)計(jì)要只要問題不解決就需要一直告警,否則很容易出現(xiàn)告警信息不可達(dá),人查看的時(shí)候忽略了。這種問題,需要讓告警持續(xù)的發(fā)送,直到解除為止。

分級(jí)

這里為了減少告警信息,我們會(huì)設(shè)置告警的級(jí)別。

cpu >80 嚴(yán)重

80 > cpu > 50 一般

然后發(fā)送告警的時(shí)候加上告警級(jí)別,郵件的規(guī)則根據(jù)告警的級(jí)別進(jìn)行分類,就可以很容易的去找出嚴(yán)重的優(yōu)先處理,一般的緊急程度就低一些。

靜默

雖然通過級(jí)別可以篩選出一些特別重要的信息,但是告警是一直持續(xù)發(fā)送的。例如cpu只要還在超過80,一定的時(shí)間間隔內(nèi),就會(huì)繼續(xù)發(fā)送告警,嚴(yán)重級(jí)別的郵箱很快也多起來。而且是同一個(gè)告警的不同時(shí)間的信息。這個(gè)時(shí)候如果有其他嚴(yán)重級(jí)別的告警的時(shí)候,很容易被沖刷掉。導(dǎo)致了一定的延后性,需要指望這個(gè)告警信息也不停的發(fā)送,如果間隔時(shí)間不一樣的話,很容易出現(xiàn)一些失誤。

這里就需要有一個(gè)靜默功能。

例如我收到了A進(jìn)程的cpu使用率的告警,我現(xiàn)在開始去做處理,這時(shí)候并不能立馬解決這個(gè)問題??梢酝ㄟ^靜默的功能,把A進(jìn)程的cpu告警取消發(fā)送。直到解決了問題以后再打開。中間過程如果再繼續(xù)收到信的告警,就需要再次注意了,證明和手頭正在解決的不是同一個(gè)問題。

抑制

我們想一個(gè)場(chǎng)景,現(xiàn)在有如下的告警設(shè)置

物理機(jī)宕機(jī)告警

進(jìn)程探活告警

api接口超時(shí)告警

當(dāng)物理機(jī)宕機(jī)后,上面的所有進(jìn)程肯定也都停止了,探測(cè)api的檢測(cè)功能也檢測(cè)不到api能正常返回了。于是觸發(fā)了3條告警信息。但他們描述的根源的原因是同一個(gè)。如果一個(gè)機(jī)器上有20個(gè)進(jìn)程,總共有300個(gè)api。那么就會(huì)一下子收到1+20+300=321條告警信息。這么多告警信息,人收到都是迷茫的,主動(dòng)靜默都是很大的工作量。得靜默321條情況,這里也能直接選擇把告警去掉,也怕別的程序也這個(gè)時(shí)候出了問題,導(dǎo)致告警的丟失。

這里就需要告警的抑制。上面表達(dá)是一個(gè)包含關(guān)系,api超時(shí)的原因是進(jìn)程停止了,進(jìn)程停止了原因是物理機(jī)停止了。這種場(chǎng)景其實(shí)報(bào)告物理機(jī)的宕機(jī)告警就可以。

也是就是物理機(jī)告警,進(jìn)程告警,端口告警同時(shí)出現(xiàn)的時(shí)候,物理機(jī)的告警要抑制進(jìn)程告警,抑制api告警。

路由設(shè)置

告警信息的通知是需要多樣的,例如什么樣的告警,什么樣的級(jí)別通過什么樣的形式發(fā)送(郵件,短信,電話)。這個(gè)是需要分層的。越緊急的事情就需要越緊急的方式,例如普通的告警就發(fā)送郵件就可以了。但是嚴(yán)重的告警,管理員可能晚上睡著了,郵件的消息通知可能不能被看到,這里可能就需要通過電話開通知。選擇了更可靠的方式。

總結(jié)

以上是生活随笔為你收集整理的java告警系统设计_告警系统的设计的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。