监控zabbix面试题
目錄
1.我們可以用zabbix監(jiān)控哪些
2.zabbix的主動監(jiān)控與被動監(jiān)控
3.Zabbix監(jiān)控做過哪些
4.zabbix監(jiān)控mysql的四大性能指標(biāo):
5.配置zabbix自定義監(jiān)控流程
6.安全組是什么,限制了3306的入規(guī)則,客戶端還能訪問嗎
7.Nagio監(jiān)控?
8.服務(wù)器一般需要監(jiān)控哪些項目? 憑借這些項目如何判斷服務(wù)器的瓶頸?
9.zabbix監(jiān)控mysql的io情況是否正常的流程
10.監(jiān)控MySQL主從同步是否異常,如果異常,則發(fā)送短信或者郵件給管理員。
11.zabbix如何修改其中監(jiān)控的一臺服務(wù)器中內(nèi)存閾值信息,比如正常內(nèi)存使用到了 80%報**警,我想修改為 60%報警?
12.報警類型和故障處理:
13.告警屏蔽:
1.我們可以用zabbix監(jiān)控哪些
1.硬件監(jiān)控。 通過SNMP來進(jìn)行路由器交換機的監(jiān)控 2.系統(tǒng)監(jiān)控。 如CPU的負(fù)載,上下文切換、內(nèi)存使用率、磁盤讀寫、磁盤使用率、磁盤inode節(jié)點。 3.服務(wù)監(jiān)控。 比如公司用LNMP nginx自帶Status模塊、PHP也有相關(guān)的Status、 MySQL的話可以通過percona來進(jìn)行監(jiān)控。4.網(wǎng)絡(luò)監(jiān)控。 如果是云主機又不是跨機房,那么可以選擇不監(jiān)控網(wǎng)絡(luò)。 5.安全監(jiān)控。 如果是云主機可以考慮使用自帶的安全防護(hù)。當(dāng)然也可以使用iptables。 如果是硬件,那么推薦使用硬件防火墻。 6.Web監(jiān)控。 web監(jiān)控的話題其實還是很多。比如可以使用自帶的web監(jiān)控來監(jiān)控頁面相關(guān)的延遲、 js響應(yīng)時間、下載時間、等等。 7.日志監(jiān)控。 如果是web的話可以使用監(jiān)控Nginx的500x日志。 PHP的ERROR日志。 8.流量分析。 平時我們分析日志都是拿awk sed xxx一堆工具來實現(xiàn)。 這樣對我們統(tǒng)計ip、pv、uv不是很方便。那么可以使用百度統(tǒng)計、 google統(tǒng)計、商業(yè),讓開發(fā)嵌入代碼即可 9.可視化。 通過screen以及引入一 些第三方的庫來美化界面,同時我們也需要知道、訂單量突然增加、 突然減少。或者說突然來了一大波流量,這流量從哪兒來,是不是推廣了, 還是被攻擊了。可以結(jié)合監(jiān)控平來來梳理各個系統(tǒng)之間的業(yè)務(wù)關(guān)系。 10.自動化監(jiān)控。 如上我們做了那么多的工作,當(dāng)然不能是一臺一臺的來加key實現(xiàn)。 可以通過Zabbix的主動模式以及被動模式來實現(xiàn)。當(dāng)然最好還是通過API來實現(xiàn)。2.zabbix的主動監(jiān)控與被動監(jiān)控
主動監(jiān)控和被動監(jiān)控都是相對于被監(jiān)控端主機而言的 默認(rèn)zabbix采用被動監(jiān)控 當(dāng)監(jiān)控主機達(dá)到一定量級后,zabbix服務(wù)器會越來越慢,此時可以考慮使用主動監(jiān)控,釋放服務(wù)器的壓力zabbix也支持分布式監(jiān)控 被動監(jiān)控:server向Agent發(fā)起連接,發(fā)送監(jiān)控key,Agent接受請求,響應(yīng)監(jiān)控數(shù)據(jù) 主動監(jiān)控:Agent向server發(fā)起連接,Agent請求需要檢測監(jiān)控項目列表,server相應(yīng)Agent發(fā)送一個items列表,Agent確認(rèn)收到監(jiān)控列表,TCP連接完成,會話關(guān)閉,Agent開始周期性收集數(shù)據(jù) 區(qū)別: server不用每次需要數(shù)據(jù)都連接Agent,Agent會自己收集數(shù)據(jù)并處理數(shù)據(jù),Server僅需要保存數(shù)據(jù)即可3.Zabbix監(jiān)控做過哪些
zabbix監(jiān)控mysql集群:1)創(chuàng)建并編輯監(jiān)控mysql的腳本(通常有腳本模板),添加執(zhí)行權(quán)限
?????????2)修改zabbix-agent配置文件,默認(rèn)有一個MySQL的子配置文件,直接編輯該文件即可,數(shù)據(jù)庫添加授權(quán)用戶
?????????3)重啟zabbix-agent
???????4)Web界面配置、點擊需要監(jiān)控的主機,進(jìn)去添加監(jiān)控模板,自帶的Template DB MySQL
?????????5)配置完成后等一會兒就可以查看到監(jiān)控主機的MySQL監(jiān)控信息
如果發(fā)現(xiàn)監(jiān)控沒有數(shù)據(jù),請排查如下問題
\1. zabbix客戶端是否重啟
\2. 腳本是否有執(zhí)行權(quán)限
\3. 數(shù)據(jù)庫是否有用戶授權(quán)
\4. 環(huán)境變量是否有問題
4.zabbix監(jiān)控mysql的四大性能指標(biāo):
????????查詢吞吐量 ?
????????查詢執(zhí)行性能 ?
????????連接情況
????????緩沖池使用情況
5.配置zabbix自定義監(jiān)控流程
①被監(jiān)控端修改Agent配置文件(修改是否允許自定義key,加載配置文件目錄) ②被監(jiān)控端創(chuàng)建存放自定義key文件(在zabbix_agentd.conf文件中定義),書寫自定義key③重起客戶端agentd ④測試自定義key是否生效 ⑤在zabbix頁面創(chuàng)建監(jiān)控模板,創(chuàng)建應(yīng)用,創(chuàng)建監(jiān)控項,關(guān)聯(lián)主機6.安全組是什么,限制了3306的入規(guī)則,客戶端還能訪問嗎
因為安全組的默認(rèn)規(guī)則是在出方向上的數(shù)據(jù)報文全部放行,同一個安全組內(nèi)的彈性云服務(wù)器和華為云關(guān)系型數(shù)據(jù)庫實例可互相訪問。 默認(rèn)情況下,一個租戶可以創(chuàng)建500條安全組規(guī)則。 為一個安全組設(shè)置過多的安全組規(guī)則會增加首包延時,因此,建議一個安全組內(nèi)的安全組規(guī)則不超過50條。 當(dāng)需要從安全組外訪問安全組內(nèi)的華為云關(guān)系型數(shù)據(jù)庫實例時,需要為安全組添加相應(yīng)的入方向規(guī)則。 限制了3306的入規(guī)則,客戶端就沒有辦法訪問了,就好像ping一樣7.Nagio監(jiān)控?
不用存儲歷史數(shù)據(jù),注重服務(wù)或者監(jiān)控項的狀態(tài) Nagios是一款開源的免費網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix的主機狀態(tài),交換機路由器等網(wǎng)絡(luò)設(shè)置,打印機等。在系統(tǒng)或服務(wù)狀態(tài)異常時發(fā)出郵件或短信報警第一時間通知網(wǎng)站運維人員,在狀態(tài)恢復(fù)后發(fā)出正常的郵件或短信通知。; Nagios 可以監(jiān)控的功能有: 監(jiān)控網(wǎng)絡(luò)服務(wù)(SMTP、POP3、HTTP、NNTP、PING等); 監(jiān)控主機資源(處理器負(fù)荷、磁盤利用率等); 簡單地插件設(shè)計使得用戶可以方便地擴(kuò)展自己服務(wù)的檢測方法; 并行服務(wù)檢查機制; 具備定義網(wǎng)絡(luò)分層結(jié)構(gòu)的能力,用"parent"主機定義來表達(dá)網(wǎng)絡(luò)主機間的關(guān)系,這種關(guān)系可被用來發(fā)現(xiàn)和明晰主機宕機或不可達(dá)狀態(tài); 當(dāng)服務(wù)或主機問題產(chǎn)生與解決時將告警發(fā)送給聯(lián)系人(通過EMail、短信、用戶定義方式); 可以定義一些處理程序,使之能夠在服務(wù)或者主機發(fā)生故障時起到預(yù)防作用; 自動的日志滾動功能; 可以支持并實現(xiàn)對主機的冗余監(jiān)控; 可選的WEB界面用于查看當(dāng)前的網(wǎng)絡(luò)狀態(tài)、通知和故障歷史、日志文件等;8.服務(wù)器一般需要監(jiān)控哪些項目? 憑借這些項目如何判斷服務(wù)器的瓶頸?
1)比如網(wǎng)站故障監(jiān)控、服務(wù)器性能監(jiān)控、網(wǎng)站安全監(jiān)控、用戶訪問速度監(jiān)控等;內(nèi)存,IO,
CPU,網(wǎng)絡(luò),這個四個模塊是必須的;
2)不能單一指標(biāo)衡量性能瓶頸,比如說是IO出現(xiàn)在性能瓶頸:
第一種是調(diào)整緩沖區(qū)的大小、調(diào)整緩沖區(qū)中的數(shù)據(jù)同步的磁盤中的時間
第二種是修改磁盤調(diào)度算法,查看的路徑cat /sys/bock/sda/queue/scheduler
9.zabbix監(jiān)控mysql的io情況是否正常的流程
在zabbix的配置文件中開啟自定義監(jiān)控 編寫監(jiān)控腳本,過濾出mysql的IO線程是否為yes 編寫自定義監(jiān)控文件,監(jiān)控腳本 測試定義的監(jiān)控命令是否成功 在zabbix網(wǎng)頁中自定義監(jiān)控項,添加監(jiān)控文件中的UserParameter10.監(jiān)控MySQL主從同步是否異常,如果異常,則發(fā)送短信或者郵件給管理員。
a. 開發(fā)一個守護(hù)進(jìn)程腳本每30秒實現(xiàn)檢測一次。 b. 如果同步出現(xiàn)如下錯誤號(1158,1159,1008,1007,1062),則跳過錯誤。 c. 請使用數(shù)組技術(shù)實現(xiàn)上述腳本(獲取主從判斷及錯誤號部分)。 #!/bin/bash mysqlbin=/usr/bin/mysql mysqlhost=127.0.0.1 mysqluser=root mysqlpwd=root skiperrors=(1158 1159 1008 1007 1062) admin='email@qq.com' check() { LASTNO= mysqlbin -h mysqluser -p$mysqlpwd -e "show slave status\G"|grep Last_Errno|awk -F: '{print $2}') } skip() { for errorno in? skiperrors[@];doif[errorno == LASTNO] ;thrnnotifyerrorno break fi done } notify() { text="mysql slave monitor error: I "echotext|mail -s 'mysql error' } main() { while :;do check && skip || notify "mysql connected failed!" sleep 30 done } main11.zabbix如何修改其中監(jiān)控的一臺服務(wù)器中內(nèi)存閾值信息,比如正常內(nèi)存使用到了 80%報**警,我想修改為 60%報警?
正常來說,一般會把監(jiān)控的服務(wù)器統(tǒng)一加入到一個模板中,修改模板的其是某一項的監(jiān)控項 參數(shù)和告警閾值后,加入模板中的所有主機都會同步。如果單獨想修改其中某一臺服務(wù)器內(nèi) 存告警閾值,需要進(jìn)入這臺主機,單獨創(chuàng)建一個告警 Triggers,關(guān)聯(lián)這臺主機監(jiān)控內(nèi)存的項, 配置好告警的閾值為 60%即可實現(xiàn)。12.報警類型和故障處理:
1.E-mail 郵件 2.微信報警等
故障:如監(jiān)控服務(wù)器down機不報警
解決:1.先定位問題:zabbix服務(wù)器采用輪詢的方式從監(jiān)控目標(biāo)機的agent獲取數(shù)據(jù)。但如果目標(biāo)機down了,目標(biāo)機的agent通常也無法工作,所以檢查被監(jiān)控的主機服務(wù)
2.增加一個目標(biāo)主機進(jìn)行是否存活的檢測。
告警收斂:
????????1)所有產(chǎn)生告警均由zabbix調(diào)用腳本推入緩存redis當(dāng)中。
????????2)分析系統(tǒng)將在規(guī)定時間(1分鐘)內(nèi)去redis中拉取數(shù)據(jù),根據(jù)定義好的一系列規(guī)則進(jìn)行,合并、分析或直接丟棄,并存入分析平臺數(shù)據(jù)庫,以便供歷史查詢。
????????3)根據(jù)預(yù)先定義好的規(guī)則將報警通過定義好的方式發(fā)送給相關(guān)人員。
13.告警屏蔽:
1、處于維護(hù)中的主機,告警信息還是會報出來,但是不會觸發(fā)動作;
2、對于可預(yù)知的臨時維護(hù)或緊急維護(hù),可以提前設(shè)置告警屏蔽;
3、可針對組、單臺或多臺主機,進(jìn)行一次性、每日定時、每月定時、每周定時屏蔽;
4、前端可以將維護(hù)中的主機不進(jìn)行顯示,Dashboard右上角有個圖標(biāo)可以進(jìn)行篩選是否顯示維護(hù)中的主機;
5、告警屏蔽時,可以設(shè)置采集數(shù)據(jù)或不采集數(shù)據(jù)兩種方式;
至此,zabbix的告警屏蔽介紹完成。
總結(jié)
以上是生活随笔為你收集整理的监控zabbix面试题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: docker与k8s面试题基础
- 下一篇: Web运维面试题