當(dāng)前位置：首頁 > 运维知识 > windows >内容正文

windows

Netty源码学习6——netty编码解码器&粘包半包问题的解决

發(fā)布時(shí)間：2023/11/29 windows 51 coder

生活随笔收集整理的這篇文章主要介紹了 Netty源码学习6——netty编码解码器&粘包半包问题的解决小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

系列文章目錄和關(guān)于我

零丶引入

經(jīng)過《Netty源碼學(xué)習(xí)4——服務(wù)端是處理新連接的&netty的reactor模式和《Netty源碼學(xué)習(xí)5——服務(wù)端是如何讀取數(shù)據(jù)的》的學(xué)習(xí)，我們了解了服務(wù)端是如何處理新連接并讀取客戶端發(fā)送的數(shù)據(jù)的：

netty的reactor：主reactor中的NioEventLoop監(jiān)聽accept事件，然后調(diào)用NioServerSocketChannel#Unsafe讀取數(shù)據(jù)——依賴JDK ServerSockectChannel#accept，獲取到新連接——SockectChannel后，會(huì)包裝為NioSocketChannel然后調(diào)用channelRead，隨后ServerBootstrapAcceptor 會(huì)負(fù)載均衡的選擇一個(gè)子reactor 注冊(cè)NioSocketChannel對(duì)read事件感興趣
read事件：子reactor中的NioEventLoop會(huì)監(jiān)聽read事件，調(diào)用NioSocketChannel讀取客戶端發(fā)送數(shù)據(jù)（依賴JDK SocketChannel#read(ByteBuffer)），netty會(huì)使用ByteBufAllocator優(yōu)化ByteBuf的分配，使用AdaptiveRecvByteBufAllocator對(duì)ByteBuf進(jìn)行擴(kuò)容縮容，以及控制是否繼續(xù)讀取。

——至此數(shù)據(jù)以及讀取到了ByteBuf中，服務(wù)端需要先解碼ByteBuf中的數(shù)據(jù)，然后我們業(yè)務(wù)處理器才能根據(jù)發(fā)送的消息進(jìn)行響應(yīng)，業(yè)務(wù)執(zhí)行結(jié)果還需要進(jìn)行編碼才能發(fā)送，so 這一篇和大家一起學(xué)習(xí)以下Netty中的編碼解碼。

一丶看看其他開源框架是如何使用Netty的編碼解碼的

1.Dubbo

Apache Dubbo 是一款 RPC 服務(wù)開發(fā)框架，用于解決微服務(wù)架構(gòu)下的服務(wù)治理與通信問題，使用 Dubbo 開發(fā)的微服務(wù)原生具備相互之間的遠(yuǎn)程地址發(fā)現(xiàn)與通信能力，利用 Dubbo 提供的豐富服務(wù)治理特性，可以實(shí)現(xiàn)諸如服務(wù)發(fā)現(xiàn)、負(fù)載均衡、流量調(diào)度等服務(wù)治理訴求。

Dubbo 中的網(wǎng)絡(luò)通信可以基于Netty，Dubbo 官方源碼如下

可以看到Dubbo會(huì)向ChannelPipeline中加入decoder和encoder，負(fù)責(zé)編碼解碼。

2.Sentinel

Sentinel 是面向分布式、多語言異構(gòu)化服務(wù)架構(gòu)的流量治理組件，主要以流量為切入點(diǎn)，從流量路由、流量控制、流量整形、熔斷降級(jí)、系統(tǒng)自適應(yīng)過載保護(hù)、熱點(diǎn)流量防護(hù)等多個(gè)維度來幫助開發(fā)者保障微服務(wù)的穩(wěn)定性。(詳細(xì)學(xué)習(xí)：《Sentinel基本使用與源碼分析》)

sentinel提供了集群限流的能力，本質(zhì)是服務(wù)端控制令牌的下發(fā)，客戶端通過網(wǎng)絡(luò)通信申請(qǐng)令牌，如下是集群限流中，使用netty實(shí)現(xiàn)服務(wù)端的源碼：

可以看到sentinel集群限流會(huì)向ChannelPipeline中增加

LengthFieldBasedFrameDecoder：基于長(zhǎng)度字段的解碼器——一級(jí)解碼器，根據(jù)frame中的長(zhǎng)度字段，解碼出消息
NettyRequestDecoder：請(qǐng)求解碼器——二次解碼器，將一次解碼器解碼出的消息，反序列化為請(qǐng)求對(duì)象
LengthFieldPrepender：長(zhǎng)度放在frame頭部的編碼器，將服務(wù)端響應(yīng)的消息添加上長(zhǎng)度信息
NettyResponseEncoder：將服務(wù)端處理返回的java對(duì)象，編碼成ByteBuf

3.對(duì)比Dubbo和Sentinel對(duì)netty的使用

相比于Sentinel，Dubbo的使用更加簡(jiǎn)潔，直接將編碼解碼的邏輯封裝到自己的adapter之中

Sentinel的使用也是非常標(biāo)準(zhǔn)，也利于我們理解netty的編解碼運(yùn)行機(jī)制——即編碼解碼其實(shí)是ChannelHandler的一種實(shí)現(xiàn)，通過將編碼解碼加入到ChannelPipline中實(shí)現(xiàn)數(shù)據(jù)的逐環(huán)處理。

二丶什么是編碼，解碼器，為什么需要編碼解碼器

netty中的編碼解碼器是負(fù)責(zé)將應(yīng)用程序的數(shù)據(jù)格式轉(zhuǎn)換為可以在網(wǎng)絡(luò)中傳輸?shù)淖止?jié)流，以及將接收到的字節(jié)流轉(zhuǎn)換回為應(yīng)用程序可以處理的數(shù)據(jù)格式的組件。編解碼器是網(wǎng)絡(luò)通信的關(guān)鍵組件，因?yàn)樗鼈兂橄蟮袅司W(wǎng)絡(luò)層和應(yīng)用層之間的復(fù)雜轉(zhuǎn)換細(xì)節(jié)。

主要作用有：

數(shù)據(jù)序列化與反序列化:
- 編碼（序列化）：將應(yīng)用數(shù)據(jù)結(jié)構(gòu)（如對(duì)象、消息）轉(zhuǎn)換成字節(jié)流，以便能夠通過網(wǎng)絡(luò)發(fā)送。
- 解碼（反序列化）：將網(wǎng)絡(luò)中接收到的字節(jié)流轉(zhuǎn)換回應(yīng)用數(shù)據(jù)結(jié)構(gòu)。
協(xié)議實(shí)現(xiàn):

編解碼器實(shí)現(xiàn)了網(wǎng)絡(luò)通信中所需遵守的特定協(xié)議規(guī)則，如 HTTP、WebSocket，SMTP。
它們確保數(shù)據(jù)符合協(xié)議格式，并能夠正確地被發(fā)送和接收方理解。
處理流控制問題:
對(duì)于面向流的協(xié)議（如 TCP），解決粘包和半包等問題，確保數(shù)據(jù)的完整性。
解耦應(yīng)用與網(wǎng)絡(luò)層&擴(kuò)展性與靈活性:

編解碼器允許開發(fā)者專注于業(yè)務(wù)邏輯，而無需關(guān)心底層的字節(jié)處理。應(yīng)用邏輯可以與網(wǎng)絡(luò)傳輸邏輯分離，使得代碼更加清晰和可維護(hù)。

應(yīng)用開發(fā)者也可以隨機(jī)的切換不同的編碼解碼器，提升擴(kuò)展性和靈活性。

三丶Netty解決tcp粘包，半包的編解碼器

1.tcp是基于流的協(xié)議&為什么會(huì)出現(xiàn)粘包，半包

TCP 傳輸?shù)臄?shù)據(jù)被視為一個(gè)連續(xù)的、無邊界的字節(jié)流。網(wǎng)絡(luò)上的兩個(gè)應(yīng)用程序通過建立一個(gè) TCP 連接來交換數(shù)據(jù)，而這個(gè)數(shù)據(jù)流就像是從一個(gè)地方倒水到另一個(gè)地方，水（數(shù)據(jù)）會(huì)連續(xù)不斷地流動(dòng)，而不是一杯一杯分開倒（即不像獨(dú)立的消息或數(shù)據(jù)包）。

TCP 數(shù)據(jù)發(fā)送:

當(dāng)應(yīng)用程序要發(fā)送數(shù)據(jù)時(shí)，它會(huì)將數(shù)據(jù)寫入到 TCP 套接字的發(fā)送緩沖區(qū)。這個(gè)寫入操作通常是通過像 write() 或 send() 這樣的系統(tǒng)調(diào)用完成的。

TCP 協(xié)議會(huì)從發(fā)送緩沖區(qū)中取出數(shù)據(jù)，并將數(shù)據(jù)分割成合適大小的段，此大小受多個(gè)因素影響，包括最大傳輸單元（MTU）和網(wǎng)絡(luò)擁塞窗口（congestion window）。然后，TCP 將每個(gè)段封裝在一個(gè) TCP 數(shù)據(jù)包中，并加上 TCP 頭部，其中包含序列號(hào)等信息，再將數(shù)據(jù)包發(fā)送到網(wǎng)絡(luò)中。

這里的關(guān)鍵點(diǎn)是，TCP 不關(guān)心應(yīng)用程序傳遞給它的數(shù)據(jù)是一條消息還是多條消息，它只是簡(jiǎn)單地將這些數(shù)據(jù)作為字節(jié)序列處理。因此，即使應(yīng)用程序以多個(gè) write() 調(diào)用發(fā)送多條消息，TCP 仍可能將它們合并成一個(gè)數(shù)據(jù)包發(fā)送，這就可能導(dǎo)致粘包問題。
TCP 數(shù)據(jù)接收:

在接收端，TCP 數(shù)據(jù)包到達(dá)后，TCP 協(xié)議會(huì)解析 TCP 頭部信息，并根據(jù)序列號(hào)將數(shù)據(jù)放入接收緩沖區(qū)中的正確位置。

接收端的應(yīng)用程序通過 read() 或 recv() 等系統(tǒng)調(diào)用從 TCP 套接字的接收緩沖區(qū)中讀取數(shù)據(jù)。這里也是不考慮消息邊界的，應(yīng)用程序可能一次讀取任意大小的數(shù)據(jù)，這可能導(dǎo)致一次讀取操作包含了多條消息（粘包），或只有部分消息（半包）。

2.netty是怎么解決粘包，半包問題的

解決粘包，半包問題的關(guān)系，是如何分辨那一部分是一條完整的消息。

Netty 通過提供一系列編解碼器（Decoder 和 Encoder）來解決 TCP 粘包和半包問題。這些編解碼器位于 Netty 的管道（ChannelPipeline）中，它們對(duì)進(jìn)出的數(shù)據(jù)流進(jìn)行處理，確保數(shù)據(jù)的完整性和邊界的正確性。

FixedLengthFrameDecoder:

這個(gè)解碼器按照固定的長(zhǎng)度對(duì)接收到的數(shù)據(jù)進(jìn)行分割。如果發(fā)送的數(shù)據(jù)小于固定長(zhǎng)度，那么發(fā)送方需要進(jìn)行填充。
LineBasedFrameDecoder:
這個(gè)解碼器基于換行符（\n 或 \r\n）拆分?jǐn)?shù)據(jù)流。它適用于文本協(xié)議，如 SMTP 或 POP3。
DelimiterBasedFrameDecoder:
這個(gè)解碼器根據(jù)指定的分隔符來拆分?jǐn)?shù)據(jù)流。分隔符可以是任意的字節(jié)序列，如特定的字符或者字符串。
LengthFieldBasedFrameDecoder:
這是一個(gè)更加通用和靈活的解碼器，它基于消息頭的長(zhǎng)度字段來確定每個(gè)消息的長(zhǎng)度。發(fā)送方在消息頭中指定了消息體的長(zhǎng)度，接收方通過解碼器讀取指定長(zhǎng)度的數(shù)據(jù)，從而確保完整性。
LengthFieldPrepender:
這個(gè)編碼器在發(fā)送消息的前面添加長(zhǎng)度字段，與 LengthFieldBasedFrameDecoder 配合使用，可確保粘包和半包問題不會(huì)發(fā)生

3.源碼學(xué)習(xí)

可以看到解碼器都是ByteToMessageDecoder的子類，編碼器只有LengthFieldPrepender是MessageToMessageEncoder的子類（和LengthFieldBasedFrameDecoder是一對(duì)）

3.1 ByteToMessageDecoder

以類似流的方式將字節(jié)從一個(gè)ByteBuf解碼為另一個(gè)消息類型，是一個(gè)ChannelInboundHandler，意味著可以處理入站事件

其中最關(guān)鍵的是channelRead方法

public void channelRead(ChannelHandlerContext ctx, Object msg) throws Exception {
    // 只處理ByteBuf類型
    if (msg instanceof ByteBuf) {
        selfFiredChannelRead = true;
        // List的一種實(shí)現(xiàn) clear方法不會(huì)清空內(nèi)容，recycle方法會(huì)清空
        // newInstance方法使用FastThreadLocal緩存已有對(duì)象，避免重復(fù)構(gòu)造
        CodecOutputList out = CodecOutputList.newInstance();
        try {
            first = cumulation == null;
            // cumulation累積器 ，第一次會(huì)把傳入的byteBuf和空buf累計(jì)
            // 后續(xù)會(huì)和原有的內(nèi)容進(jìn)行累計(jì)
            cumulation = cumulator.cumulate(ctx.alloc(),
                    first ? Unpooled.EMPTY_BUFFER : cumulation, (ByteBuf) msg);
            // 調(diào)用子類進(jìn)行解碼
            callDecode(ctx, cumulation, out);
        } catch (DecoderException e) {
            throw e;
        } catch (Exception e) {
            throw new DecoderException(e);
        } finally {
           
            try {
                // 省略資源釋放部分
                int size = out.size();
                firedChannelRead |= out.insertSinceRecycled();
                 // 編碼后內(nèi)容觸發(fā)channelRead
                fireChannelRead(ctx, out, size);
            } finally {
                // 釋放資源
                out.recycle();
            }
        }
    } else {
        // 只處理ByteBuf類型
        ctx.fireChannelRead(msg);
    }
}

netty使用了CodecOutputList來記錄解碼生成的內(nèi)容，也就是說子類實(shí)現(xiàn)decode方法時(shí)，如果得到了完整的消息，需要將消息加入到CodecOutputList中，CodecOutputList#newInstance是從FastThreadLocal中獲取的，線程安全，每一個(gè)線程進(jìn)行復(fù)用
Cumulator：累積器，由于TCP存在粘包，半包的情況，NioSockectChannel在讀取的時(shí)候不一定可以讀取到一個(gè)完整的消息，所有需要使用Cumulator進(jìn)行累計(jì)，netty提供了兩種累積器的實(shí)現(xiàn)
- 合并：顧名思義，會(huì)將已經(jīng)積攢的ByteBuf和當(dāng)前需要累計(jì)的ByteBuf進(jìn)行合并，是真真切切發(fā)生內(nèi)存拷貝的
- 組合：這種策略下，會(huì)將已經(jīng)積攢的ByteBuf和當(dāng)前需要累計(jì)的ByteBuf進(jìn)行組合——生成一個(gè)邏輯視圖：CompositeByteBuf
模板模式：ByteToMessageDecoder將累積的過程進(jìn)行了抽象，子類只需要實(shí)現(xiàn)decode將解碼生成的消息寫入到CodecOutputList中即可

3.1 FixedLengthFrameDecoder 定長(zhǎng)消息

使用子類進(jìn)行解碼，需要保證發(fā)送來的消息長(zhǎng)度是一致的！其使用字段frameLength記錄完整消息的長(zhǎng)度

如下是解碼源碼：

3.2 LineBasedFrameDecoder 換行符解碼器

顧名思義就是找到換行符所在的位置，分割出一條消息

這個(gè)累有點(diǎn)雞肋，因?yàn)椴恢С肿远x換行符，如果換行符需要支持指定可以使用DelimiterBasedFrameDecoder

3.3 DelimiterBasedFrameDecoder 支持自定義分割符的解碼器

原理和LineBasedFrameDecoder 類似，內(nèi)部使用delimiters數(shù)組記錄分割符是什么

3.4 LengthFieldBasedFrameDecoder

基于消息頭的長(zhǎng)度字段來確定每個(gè)消息的長(zhǎng)度來解碼出消息，相比于上面幾種，它使用更加廣泛的解碼器（消息定長(zhǎng)如果消息太短需要補(bǔ)齊，浪費(fèi)網(wǎng)絡(luò)資源，換行和分割符解碼同樣會(huì)浪費(fèi)一些網(wǎng)絡(luò)資源）

此類源碼上的注釋詳細(xì)解釋了如何使用，它有如下幾個(gè)重要的參數(shù)：

maxFrameLength ：發(fā)送的數(shù)據(jù)包最大長(zhǎng)度；
lengthFieldOffset ：長(zhǎng)度域偏移量，指的是長(zhǎng)度域位于整個(gè)數(shù)據(jù)包字節(jié)數(shù)組中的下標(biāo)；
lengthFieldLength ：長(zhǎng)度域的自己的字節(jié)數(shù)長(zhǎng)度。
lengthAdjustment ：長(zhǎng)度域的偏移量矯正。如果長(zhǎng)度域的值，除了包含有效數(shù)據(jù)域的長(zhǎng)度外，還包含了其他域（如長(zhǎng)度域自身）長(zhǎng)度，那么，就需要進(jìn)行矯正。矯正的值為：包長(zhǎng) - 長(zhǎng)度域的值 – 長(zhǎng)度域偏移 – 長(zhǎng)度域長(zhǎng)。
initialBytesToStrip ：丟棄的起始字節(jié)數(shù)。丟棄處于有效數(shù)據(jù)前面的字節(jié)數(shù)量。比如前面有4個(gè)節(jié)點(diǎn)的長(zhǎng)度域，則它的值為4。

例子：

3.5 LengthFieldPrepender

在發(fā)送消息的前面添加長(zhǎng)度字段，與 LengthFieldBasedFrameDecoder 配合使用，可確保粘包和半包問題不會(huì)發(fā)生。

因此它是一個(gè)ChannelOutboundHandler，其原理也比較簡(jiǎn)單，在發(fā)送消息前加上長(zhǎng)度信息

四丶總結(jié)&啟下

這一篇我們學(xué)習(xí)了netty是如何解決TCP協(xié)議中粘包半包的問題，以及粘包半包問題為何會(huì)出現(xiàn)，并學(xué)習(xí)netty中常用的編碼解碼器源碼

其實(shí)netty對(duì)于其他協(xié)議，如：udp，websockect，http，smtp都有對(duì)應(yīng)的實(shí)現(xiàn)，這也是為啥開發(fā)者喜歡使用netty的原因——不需要重復(fù)造*

另外netty還支持多種序列化反序列化方式：json，xml，Protobuf等

后續(xù)應(yīng)該會(huì)更新netty追求卓越性能打造的一些*，如FastThreadLocal，對(duì)象池，內(nèi)存池，時(shí)間輪。以及和學(xué)習(xí)交流群的小伙伴們一起基于netty寫一個(gè)簡(jiǎn)陋的rpc框架，鞏固一下netty的使用。

總結(jié)

以上是生活随笔為你收集整理的Netty源码学习6——netty编码解码器&粘包半包问题的解决的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： Java开发者的Python快速进修指南
下一篇：平稳扩展：可支持RevenueCat每日