[运维]---linux机器一般监控用到的概念记录
生活随笔
收集整理的這篇文章主要介紹了
[运维]---linux机器一般监控用到的概念记录
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
發布在linux上的機器,一般我們需要監測各項數據來證實服務器是沒問題的,
如果出現問題,我們也可以通過以下指標找到問題的方向
容器指標
- 線程數
-當前容器內線程總數(平均到每個核的線程數) - 進程數
-當前容器內進程總數 - 內存分配失敗次數
-申請內存/swap失敗次數 - 句柄數
-當前容器內打開的文件句柄數
-在文件I/O中,要從一個文件讀取數據,應用程序首先要調用操作系統函數并傳送文件名,并選一個到該文件的路徑來打開文件。該函數取回一個順序號,即文件句柄(file handle),該文件句柄對于打開的文件是唯一的識別依據。要從文件中讀取一塊數據,應用程序需要調用函數ReadFile,并將文件句柄在內存中的地址和要拷貝的字節數傳送給操作系統。當完成任務后,再通過調用系統函數來關閉該文件。 - memory_swap使用量(MB)
-容器的swap使用量(MB)
硬件指標
- CPU溫度
- 服務器功率
- CPU風扇(即每分鐘多少轉)
磁盤指標
- 磁盤使用率百分比(%)
- 磁盤負載百分比(%)(一般1分鐘粒度平均值)
-查看磁盤負載:
-iostat -x 1 10 查看 %util
-如果沒有iostat 需要yum install sysstat安裝;
-如果 %util 接近 100%,說明產生的I/O請求太多,I/O系統已經滿負荷,該磁盤可能存在瓶頸。 - 磁盤每秒讀取的數據量(KB/s)(一般1分鐘粒度平均值)
- 磁盤每秒寫入的數據量(KB/s)(一般1分鐘粒度平均值)
- 磁盤每秒讀取次數(次/s)(一般1分鐘粒度平均值)
- 磁盤每秒寫入次數(次/s)(一般1分鐘粒度平均值)
系統指標
- cpu使用率百分比 (%)
- 內存使用率百分比(%)
-容器的內存使用率是讀取物理機cgroup下面的文件的,獲取的是整個容器的內存使用率并不是針對某個程序。物理機內存使用率和使用free命令計算結果是一致的。物理機和容器兩者內存計算數據是獨立的。 - 連通性(0 or 1),0為存活,1未不存活
-系統每次檢測時會ping4次,計算得到丟包率。目前不是100%丟包的都算作是存活就(即0),只有100%丟包才會算作不存活(即1) - 系統負載(1分鐘粒度平均值)
-在Linux系統中,使用uptime或這top命令可以查看當前系統的負載(top可以看到的信息更加詳盡一些)
- swap使用率百分比(%)
-Linux中Swap(即:交換分區),類似于Windows的虛擬內存,就是當內存不足的時候,把一部分硬盤空間虛擬成內存使用,從而解決內存容量不足的情況。
網絡指標
- 網絡入向流量(MB/s)(1分鐘粒度平均值)
- 網絡出向流量(MB/s)(1分鐘粒度平均值)
- 網絡入向包速率(packet/s)(1分鐘粒度平均值)
-數據包:包(Packet)是TCP/IP協議通信傳輸中的數據單位,一般也稱“數據包”。
-TCP/IP協議是工作在OSI模型第三層(網絡層)、第四層(傳輸層)上的。 - 網絡出向包速率(packet/s)(1分鐘粒度平均值)
- 當前處于“ESTABLISHED (正在連接)”或者“CLOSE-WAIT (被動關閉)”狀態的tcp連接數
- 主動建立tcp連接頻率,既主動發送SYN,進入“SYN-SENT”狀態的頻率(次/s)(1分鐘粒度平均值)
- 入向IP報文速率(packet/s)(1分鐘粒度平均值)
- 入向的ip包中,沒有錯誤但是被丟棄的
-丟棄的原因可能有buffer滿了。 - 入向TCP包速率(packet/s)(1分鐘粒度平均值)
- 出向TCP包速率(packet/s)(1分鐘粒度平均值)
- 入向TCP錯誤包頻率(packet/s)(1分鐘粒度平均值)
-TCP是一個可靠的協議,TCP包的頭部帶有標識,通過校驗發現接收的包是錯誤的,然后將該包進行丟棄后返回一個值要求重新進行傳送。 - TCP重傳包頻率(packet/s)(1分鐘粒度平均值)
以上指標僅供參考,不同的情況使用不同的指標才是最合適的.
總結
以上是生活随笔為你收集整理的[运维]---linux机器一般监控用到的概念记录的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 华为的涉外知识产权工程师_华为法务社招
- 下一篇: iOS零散知识点