Nagios介绍
Nagios原理及工作機(jī)制
1. Nagios原理介紹
1)原理簡介
Nagios的功能是監(jiān)控服務(wù)和主機(jī),但是他自身并不包括這部分功能,所有的監(jiān)控、檢測功能都是通過各種插件來完成的。啟動 Nagios后,它會周期性的自動調(diào)用插件去檢測服務(wù)器狀態(tài),同時 Nagios 會維持一個隊列,所有插件返回來的狀態(tài)信息都進(jìn)入隊列,Nagios每次都從隊首開始讀取信息,并進(jìn)行處理后,把狀態(tài)結(jié)果通過 web 顯示出來。
2)狀態(tài)信息
- Nagios可以識別4種狀態(tài)返回信息。
- 0(OK)表示狀態(tài)正常/綠色
- 1(WARNING)表示出現(xiàn)警告/黃色
- 2(CRITICAL)表示出現(xiàn)非常嚴(yán)重的錯誤/紅色
- 3(UNKNOWN)表示未知錯誤/深黃色
3)監(jiān)控對象
本機(jī)的運(yùn)行狀態(tài)
本機(jī)的服務(wù)的運(yùn)行狀態(tài)
遠(yuǎn)程主機(jī),可以是linuc/unix主機(jī)也可以是windows主機(jī)
遠(yuǎn)程主機(jī)上的服務(wù)
監(jiān)控網(wǎng)絡(luò)服務(wù)(SMTP、POP3、HTTP、PING等)
監(jiān)控主機(jī)資源(處理器負(fù)荷、磁盤利用率等)
4)功能特性
- 監(jiān)控網(wǎng)絡(luò)服務(wù)(SMTP、POP3、HTTP、FTP、PING 等)
- 監(jiān)控本機(jī)及遠(yuǎn)程主機(jī)資源(CPU 負(fù)荷、磁盤利用率、進(jìn)程 等)
- 允許用戶編寫自己的插件來監(jiān)控特定的服務(wù),方便地擴(kuò)展自己服務(wù)的檢測方法,支持多種開發(fā)語言(Shell、Perl、Python、PHP 等)
- 具備定義網(wǎng)絡(luò)分層結(jié)構(gòu)的能力,用"parent"主機(jī)定義來表達(dá)網(wǎng)絡(luò)主機(jī)間的關(guān)系,這種關(guān)系可被用來發(fā)現(xiàn)和明晰主機(jī)宕機(jī)或不可達(dá)狀態(tài)。
- 當(dāng)服務(wù)或主機(jī)問題產(chǎn)生與解決時將告警發(fā)送給聯(lián)系人(通過 EMail、短信、用戶定義方式)
- 可以支持并實現(xiàn)對主機(jī)的冗余監(jiān)控。
- 可用 WEB 界面用于查看當(dāng)前的網(wǎng)絡(luò)狀態(tài)、通知和故障歷史、日志文件等。
2. Nagios工作機(jī)制
1)監(jiān)控方式
- 被動監(jiān)控
被動監(jiān)控是指由被監(jiān)測的服務(wù)器主動上傳數(shù)據(jù)到nagios監(jiān)控系統(tǒng)中。這種監(jiān)測方式提高了實時性(出現(xiàn)問題的時候,被監(jiān)測的服務(wù)器可以及時上傳數(shù)據(jù)通知nagios,從而使管理員可以盡快作出處理,而不用像主動監(jiān)測中一樣,非要等到下一個監(jiān)測周期才能獲知被監(jiān)測服務(wù)器的狀態(tài))。NSCA就是可以實現(xiàn)Nagios被動監(jiān)測的一個程序。 - 主動監(jiān)控
nagios監(jiān)控端按照檢測周期主動地獲取遠(yuǎn)程被監(jiān)控主機(jī)的數(shù)據(jù)。nagios通過nrpe插件和snmp協(xié)議實現(xiàn)了對linux/unix服務(wù)器進(jìn)行監(jiān)控,同時通過snmp協(xié)議實現(xiàn)了對windows服務(wù)器、交換機(jī)、打印機(jī)等的監(jiān)控。另外,nagios通過NSClient++客戶端也可以對windows進(jìn)行監(jiān)控。
2)Nagios遠(yuǎn)端監(jiān)控
Nagios通過NRPE外部構(gòu)件來監(jiān)控遠(yuǎn)程主機(jī),在監(jiān)控端需要安裝NRPE插件,遠(yuǎn)程被監(jiān)控端需要安裝NRPE插件和Nagios插件。
- nagios會運(yùn)行check_nrpe這個插件,告訴它要檢查什么。
- check_nrpe插件會連接到遠(yuǎn)程被監(jiān)控主機(jī)的NRPE daemon,所用的方式是SSL。
- NRPE daemon運(yùn)行本地的各種插件去檢測本地的主機(jī)狀態(tài)和服務(wù)狀態(tài)
- NRPE daemon把檢測的結(jié)果傳給主機(jī)端的 check_nrpe,check_nrpe 再把結(jié)果送到 Nagios狀態(tài)隊列中。
- Nagios 依次讀取隊列中的信息,再把信息顯示到web頁面上。
3)檢測類型
直接檢測
檢測的對象是運(yùn)行 NRPE 的那臺 Linux 主機(jī)的本地資源。間接檢測
當(dāng)運(yùn)行 Nagios 的監(jiān)控主機(jī)無法訪問到某臺被監(jiān)控主機(jī),但是運(yùn)行 NRPE 的機(jī)器可以訪問得到的時候,運(yùn)行 NRPE 的主機(jī)就充當(dāng)一個中間代理,將監(jiān)控請求發(fā)送到被監(jiān)控對象上。
轉(zhuǎn)載于:https://www.cnblogs.com/NewStudy/p/7270677.html
總結(jié)
- 上一篇: 工作流中切换数据库时---“禁止流转”
- 下一篇: 【S4 导数据】S/4HANA导数,只会