當前位置：首頁 > 运维知识 > linux >内容正文

linux

[运维]---linux机器一般监控用到的概念记录

發布時間：2024/7/23 linux 52 豆豆

生活随笔收集整理的這篇文章主要介紹了 [运维]---linux机器一般监控用到的概念记录小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

發布在linux上的機器,一般我們需要監測各項數據來證實服務器是沒問題的,
如果出現問題,我們也可以通過以下指標找到問題的方向

容器指標

硬件指標

磁盤指標

系統指標

網絡指標

容器指標

線程數
-當前容器內線程總數（平均到每個核的線程數）
進程數
-當前容器內進程總數
內存分配失敗次數
-申請內存/swap失敗次數
句柄數
-當前容器內打開的文件句柄數
-在文件I/O中，要從一個文件讀取數據，應用程序首先要調用操作系統函數并傳送文件名，并選一個到該文件的路徑來打開文件。該函數取回一個順序號，即文件句柄（file handle），該文件句柄對于打開的文件是唯一的識別依據。要從文件中讀取一塊數據，應用程序需要調用函數ReadFile，并將文件句柄在內存中的地址和要拷貝的字節數傳送給操作系統。當完成任務后，再通過調用系統函數來關閉該文件。
memory_swap使用量(MB)
-容器的swap使用量（MB）

硬件指標

CPU溫度
服務器功率
CPU風扇（即每分鐘多少轉）

磁盤指標

磁盤使用率百分比(%)
磁盤負載百分比(%)（一般1分鐘粒度平均值）
-查看磁盤負載：
-iostat -x 1 10 查看 %util
-如果沒有iostat 需要yum install sysstat安裝；
-如果 %util 接近 100%，說明產生的I/O請求太多，I/O系統已經滿負荷，該磁盤可能存在瓶頸。
磁盤每秒讀取的數據量(KB/s)（一般1分鐘粒度平均值）
磁盤每秒寫入的數據量(KB/s)（一般1分鐘粒度平均值）
磁盤每秒讀取次數（次/s）（一般1分鐘粒度平均值）
磁盤每秒寫入次數（次/s）（一般1分鐘粒度平均值）

系統指標

cpu使用率百分比 (%)
內存使用率百分比(%)
-容器的內存使用率是讀取物理機cgroup下面的文件的，獲取的是整個容器的內存使用率并不是針對某個程序。物理機內存使用率和使用free命令計算結果是一致的。物理機和容器兩者內存計算數據是獨立的。
連通性（0 or 1），0為存活，1未不存活
-系統每次檢測時會ping4次，計算得到丟包率。目前不是100%丟包的都算作是存活就（即0），只有100%丟包才會算作不存活（即1）
系統負載（1分鐘粒度平均值）
-在Linux系統中，使用uptime或這top命令可以查看當前系統的負載（top可以看到的信息更加詳盡一些）

CPU負載和CPU使用率區別：CPU利用率:顯示的是程序在運行期間實時占用的CPU百分比CPU負載:顯示的是一段時間內正在使用和等待使用CPU的平均任務數。CPU利用率高，并不意味著負載就一定大。舉例說明：某公用電話亭，有一個人在打電話，四個人在等待，每人限定使用電話一分鐘，若有人一分鐘之內沒有打完電話，只能掛掉電話去排隊，等待下一輪。電話在這里就相當于CPU，而正在或等待打電話的人就相當于任務數。在電話亭使用過程中，肯定會有人打完電話走掉，有人沒有打完電話而選擇重新排隊，更會有新增的人在這兒排隊，這個人數的變化就相當于任務數的增減。為了統計平均負載情況，我們5秒鐘統計一次人數，并在第1、5、15分鐘的時候對統計情況取平均值，從而形成第1、5、15分鐘的平均負載。有的人拿起電話就打，一直打完1分鐘，而有的人可能前三十秒在找電話號碼，或者在猶豫要不要打，后三十秒才真正在打電話。如果把電話看作CPU，人數看作任務，我們就說前一個人（任務）的CPU利用率高，后一個人（任務）的CPU利用率低。當然， CPU并不會在前三十秒工作，后三十秒歇著，只是說，有的程序涉及到大量的計算，所以CPU利用率就高，而有的程序牽涉到計算的部分很少，CPU利用率自然就低。但無論CPU的利用率是高是低，跟后面有多少任務在排隊沒有必然關系。

swap使用率百分比(%)
-Linux中Swap（即：交換分區），類似于Windows的虛擬內存，就是當內存不足的時候，把一部分硬盤空間虛擬成內存使用,從而解決內存容量不足的情況。

網絡指標

網絡入向流量（MB/s）（1分鐘粒度平均值）
網絡出向流量（MB/s）（1分鐘粒度平均值）
網絡入向包速率（packet/s）（1分鐘粒度平均值）
-數據包：包(Packet)是TCP/IP協議通信傳輸中的數據單位，一般也稱“數據包”。
-TCP/IP協議是工作在OSI模型第三層(網絡層)、第四層(傳輸層)上的。
網絡出向包速率（packet/s）（1分鐘粒度平均值）
當前處于“ESTABLISHED (正在連接)”或者“CLOSE-WAIT (被動關閉)”狀態的tcp連接數

一、ESTABLISHED (正在連接) 即有一個TCP 連接正在進行二、TCP 關閉四步1、Client發送了FIN給server， 2、server發送ACK給Client，而Server 程序處于CLOSE_WAIT狀態 3、server發送FIN給Client，Server 就置為LAST_ACK（主動關閉）狀態 4、Client發送了ACK給server TCP 連接才會關閉如果第三步沒有進行則server會保持CLOSE-WAIT (被動關閉)狀態，通常會保持2個小時

主動建立tcp連接頻率，既主動發送SYN，進入“SYN-SENT”狀態的頻率（次/s）（1分鐘粒度平均值）

SYN_SENT表示請求連接，當你要訪問其它的計算機的服務時首先要發個同步信號給該端口，此時狀態為SYN_SENT，如果連接成功了就變為ESTABLISHED，此時SYN_SENT狀態非常短暫。但如果發現SYN_SENT非常多且在向不同的機器發出，那你的機器可能中了沖擊波或震蕩波之類的病毒了。這類病毒為了感染別的計算機，它就要掃描別的計算機，在掃描的過程中對每個要掃描的計算機都要發出了同步請求，這也是出現許多SYN_SENT的原因。

入向IP報文速率（packet/s）（1分鐘粒度平均值）

TCP/IP協議定義了一個在因特網上傳輸的包，稱為IP數據包，而IP數據報(IP Datagram)是個比較抽象的內容，是對數據包的結構進行分析。由首部和數據兩部分組成。首部的前一部分是固定長度，共20字節，是所有IP數據報必須具有的。在首部的固定部分的后面是一些可選字段，其長度是可變的。首部中的源地址和目的地址都是IP協議地址。

入向的ip包中，沒有錯誤但是被丟棄的
-丟棄的原因可能有buffer滿了。
入向TCP包速率（packet/s）（1分鐘粒度平均值）
出向TCP包速率（packet/s）（1分鐘粒度平均值）
入向TCP錯誤包頻率（packet/s）（1分鐘粒度平均值）
-TCP是一個可靠的協議，TCP包的頭部帶有標識，通過校驗發現接收的包是錯誤的，然后將該包進行丟棄后返回一個值要求重新進行傳送。
TCP重傳包頻率（packet/s）（1分鐘粒度平均值）

以上指標僅供參考,不同的情況使用不同的指標才是最合適的.

總結

以上是生活随笔為你收集整理的[运维]---linux机器一般监控用到的概念记录的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：华为的涉外知识产权工程师_华为法务社招
下一篇： linux系统支持u盘格式,linux下

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

linux

[运维]---linux机器一般监控用到的概念记录

容器指標

硬件指標

磁盤指標

系統指標

網絡指標

以上指標僅供參考,不同的情況使用不同的指標才是最合適的.

總結