當前位置:
首頁 >
分布式监控系统开发【day37】:需求讨论(一)
發布時間:2023/12/13
63
豆豆
生活随笔
收集整理的這篇文章主要介紹了
分布式监控系统开发【day37】:需求讨论(一)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
本節內容
一、為什么要做監控??
二、常用監控系統設計討論
成熟的監控
三、監控系統需求討論
1.可監控常用系統服務、應用、網絡設備等
網絡層
系統層
應用層
業務邏輯層
2.一臺主機上可監控多個不同服務、不同服務的監控間隔可不同
服務A:
服務B:
3.同一個服務在不同主機上的監控間隔、報警閾值可不同
報警閥值:
4.可以批量的給一批主機添加、刪除、修改要監控的服務
監控模板
linuxservices
5.告警級別:
-
不同的服務 因為業務重要程度不同,如果出了問題可以設置不同的報警級別
- 重要的服務,cup使用率打到80%,就報警
- 普通的服務,cup使用百分之98%,報警
-
可以指定特定的服務或告警級別的事件通知給特定的用戶
- 重要的服務,抄送給CTO
- 不重要的只發送給運維工程師
-
告警的升級設定
- 發送給底層運維工程師沒處理,就發送給運維經理
- 再過半個小時沒處理,就發送給cto
-
報警合并
? ? ? ? ? ? ? ? ? ?有一個報警池,有一個腳本對池的分析
6.歷史數據 的存儲和優化
監控數據的處理
1、存下來,趨勢圖
大數據分析 ,視角越大,越失真
?
?
時間越長,越失真
2、報警處理
7. 數據可視化,如何做出簡潔美觀的用戶界面?
8.如何實現單機支持5000+機器監控需求?
9.采取何種通信方式?主動、被動?
1、server 主動 監控 客戶端
2、server 被動 接收 客戶端
3、主流的:混合式
1、客戶端知道監控什么指標?
客戶端主動去問服務器我要監控什么
2、客戶端掃描本地所有服務,全部匯報給服務器
openfalcon把機器上所有能檢測到的都抓上[2014年自動檢測到(支持一千多項)]
四、如何實現監控服務器的水平擴展?
1、采用什么架構?
?Mysql
?主動通信? Snmp,wget…
server 主動 監控 客戶端
?被動通信?Agent ---how to communicate with the monitor server
server 被動 接收 客戶端
總結:主流的的還是混合模式好
?Socket server –>? Sockect client
不可以,很多坑
?能否用現成的c/s架構? Rabbit mq, redis 訂閱發布, http ?
2、采用HTTP好處
1.接口設計簡單
2.容易水平擴展做分布式
3.Socket穩定成熟,省去較多的通信維護精力
3、Http特性:
1.短連接
2.無狀態
3.安全認證
4.被動通信
五、監控系統架構設計
?
轉載于:https://www.cnblogs.com/luoahong/p/7223580.html
總結
以上是生活随笔為你收集整理的分布式监控系统开发【day37】:需求讨论(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 农行世界杯信用卡账单日是什么时候?四种方
- 下一篇: 0 uC/OS 系统精讲索引