TCP queue 的一些问题
轉(zhuǎn)自Jasey Wang的blog,原文地址
首先回顧下三次握手里面涉及到的問題:
可以看到,整個 TCP stack 有如下的兩個 queue:
LISTEN 狀態(tài): Recv-Q 表示的當前等待服務(wù)端調(diào)用 accept 完成三次握手的 listen backlog 數(shù)值,也就是說,當客戶端通過 connect() 去連接正在 listen() 的服務(wù)端時,這些連接會一直處于這個 queue 里面直到被服務(wù)端 accept();Send-Q 表示的則是最大的 listen backlog 數(shù)值,這就就是上面提到的 min(backlog, somaxconn) 的值。
其余狀態(tài): 非 LISTEN 狀態(tài)之前理解的沒有問題。Recv-Q 表示 receive queue 中的 bytes 數(shù)量;Send-Q 表示 send queue 中的 bytes 數(shù)值。
要理解上面總結(jié)的這些,可以參見下這兩個案例(1, 2)。
通過 "SYNs to LISTEN sockets dropped" 以及 "times the listen queue of a socket overflowed" 這兩個 netstat -s 獲取到的 TCP 狀態(tài),可以很快的發(fā)現(xiàn)系統(tǒng)存在的一些問題。
任何一個包含 "dropped" 或者 "overflowed" 并且數(shù)值一直居高不下的 metric 從字面含義理解來看,都不是一個好現(xiàn)象。
對于 Nginx 來說,backlog 的默認值為 511,這個可以通過 ss/netstat 的 Send-Q 確認:
State Recv-Q Send-Q Local Address:Port Peer Address:Port
LISTEN 0 511 :80 :*
可以通過適當?shù)脑龃?nginx 的 backlog 以及 somaxconn 來增大隊列:
listen 80 backlog=1638
上面說了這么多,其實就是為了引入下面這個問題。
我們線上一個基于 Netty 的代碼,3.5.12 的版本,監(jiān)控顯示 "times the listen queue of a socket overflowed" 常年居高不下,動輒幾十 K,通過 ss,我們發(fā)現(xiàn)其 backlog 的值只有 50:
Recv-Q Send-Q Local Address:Port Peer Address:Port
0 50 :6928 :* users:(("java",454409,196))
g 了一下,發(fā)現(xiàn)這個版本復(fù)用了 Java 默認的 50 這個值。將其增加到 1024 測試,監(jiān)控曲線一下子降低到了 0。
除了上面這些,還有一個比較基礎(chǔ)的 net.core.netdev_max_backlog,如果內(nèi)核接受包的速度大于被 userspace 處理的速度,該值定義了可以在接口輸入最大的的包數(shù)量。
chartbeat 分享了兩篇很精彩的文檔,其中涉及到了 queue 的一些問題。
Lessons learned tuning TCP and Nginx in EC2 1
Lessons learned tuning TCP and Nginx in EC2 2
參考鏈接https://www.cnblogs.com/jcli/p/3911505.html
轉(zhuǎn)載于:https://www.cnblogs.com/johnsonjie/p/10300987.html
總結(jié)
以上是生活随笔為你收集整理的TCP queue 的一些问题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [匈牙利] 洛谷 P2526 小狗散步
- 下一篇: Scala 基础(8)—— 占位符_和部