Nagios介绍
Nagios原理及工作機制
1. Nagios原理介紹
1)原理簡介
Nagios的功能是監控服務和主機,但是他自身并不包括這部分功能,所有的監控、檢測功能都是通過各種插件來完成的。啟動 Nagios后,它會周期性的自動調用插件去檢測服務器狀態,同時 Nagios 會維持一個隊列,所有插件返回來的狀態信息都進入隊列,Nagios每次都從隊首開始讀取信息,并進行處理后,把狀態結果通過 web 顯示出來。
2)狀態信息
- Nagios可以識別4種狀態返回信息。
- 0(OK)表示狀態正常/綠色
- 1(WARNING)表示出現警告/黃色
- 2(CRITICAL)表示出現非常嚴重的錯誤/紅色
- 3(UNKNOWN)表示未知錯誤/深黃色
3)監控對象
本機的運行狀態
本機的服務的運行狀態
遠程主機,可以是linuc/unix主機也可以是windows主機
遠程主機上的服務
監控網絡服務(SMTP、POP3、HTTP、PING等)
監控主機資源(處理器負荷、磁盤利用率等)
4)功能特性
- 監控網絡服務(SMTP、POP3、HTTP、FTP、PING 等)
- 監控本機及遠程主機資源(CPU 負荷、磁盤利用率、進程 等)
- 允許用戶編寫自己的插件來監控特定的服務,方便地擴展自己服務的檢測方法,支持多種開發語言(Shell、Perl、Python、PHP 等)
- 具備定義網絡分層結構的能力,用"parent"主機定義來表達網絡主機間的關系,這種關系可被用來發現和明晰主機宕機或不可達狀態。
- 當服務或主機問題產生與解決時將告警發送給聯系人(通過 EMail、短信、用戶定義方式)
- 可以支持并實現對主機的冗余監控。
- 可用 WEB 界面用于查看當前的網絡狀態、通知和故障歷史、日志文件等。
2. Nagios工作機制
1)監控方式
- 被動監控
被動監控是指由被監測的服務器主動上傳數據到nagios監控系統中。這種監測方式提高了實時性(出現問題的時候,被監測的服務器可以及時上傳數據通知nagios,從而使管理員可以盡快作出處理,而不用像主動監測中一樣,非要等到下一個監測周期才能獲知被監測服務器的狀態)。NSCA就是可以實現Nagios被動監測的一個程序。 - 主動監控
nagios監控端按照檢測周期主動地獲取遠程被監控主機的數據。nagios通過nrpe插件和snmp協議實現了對linux/unix服務器進行監控,同時通過snmp協議實現了對windows服務器、交換機、打印機等的監控。另外,nagios通過NSClient++客戶端也可以對windows進行監控。
2)Nagios遠端監控
Nagios通過NRPE外部構件來監控遠程主機,在監控端需要安裝NRPE插件,遠程被監控端需要安裝NRPE插件和Nagios插件。
- nagios會運行check_nrpe這個插件,告訴它要檢查什么。
- check_nrpe插件會連接到遠程被監控主機的NRPE daemon,所用的方式是SSL。
- NRPE daemon運行本地的各種插件去檢測本地的主機狀態和服務狀態
- NRPE daemon把檢測的結果傳給主機端的 check_nrpe,check_nrpe 再把結果送到 Nagios狀態隊列中。
- Nagios 依次讀取隊列中的信息,再把信息顯示到web頁面上。
3)檢測類型
直接檢測
檢測的對象是運行 NRPE 的那臺 Linux 主機的本地資源。間接檢測
當運行 Nagios 的監控主機無法訪問到某臺被監控主機,但是運行 NRPE 的機器可以訪問得到的時候,運行 NRPE 的主機就充當一個中間代理,將監控請求發送到被監控對象上。
轉載于:https://www.cnblogs.com/NewStudy/p/7270677.html
總結
- 上一篇: 工作流中切换数据库时---“禁止流转”
- 下一篇: 【S4 导数据】S/4HANA导数,只会