Netty(三) 什么是 TCP 拆、粘包？如何解决？

huaye00

2019-06-28

Netty(三) 什么是 TCP 拆、粘包？如何解决？

前言

记得前段时间我们生产上的一个网关出现了故障。

这个网关逻辑非常简单，就是接收客户端的请求然后解析报文最后发送短信。

但这个请求并不是常见的 HTTP ，而是利用 Netty 自定义的协议。

有个前提是：网关是需要读取一段完整的报文才能进行后面的逻辑。

问题是有天突然发现网关解析报文出错，查看了客户端的发送日志也没发现问题，最后通过日志发现收到了许多不完整的报文，有些还多了。

于是想会不会是 TCP 拆、粘包带来的问题，最后利用 Netty 自带的拆包工具解决了该问题。

这便有了此文。

TCP 协议

问题虽然解决了，但还是得想想原因，为啥会这样？打破砂锅问到底才是一个靠谱的程序员。

这就得从 TCP 这个协议说起了。

TCP 是一个面向字节流的协议，它是性质是流式的，所以它并没有分段。就像水流一样，你没法知道什么时候开始，什么时候结束。

所以他会根据当前的套接字缓冲区的情况进行拆包或是粘包。

下图展示了一个 TCP 协议传输的过程：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

发送端的字节流都会先传入缓冲区，再通过网络传入到接收端的缓冲区中，最终由接收端获取。

当我们发送两个完整包到接收端的时候：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

正常情况会接收到两个完整的报文。

但也有以下的情况：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

接收到的是一个报文，它是由发送的两个报文组成的，这样对于应用程序来说就很难处理了（这样称为粘包）。

Netty(三) 什么是 TCP 拆、粘包？如何解决？

还有可能出现上面这样的虽然收到了两个包，但是里面的内容却是互相包含，对于应用来说依然无法解析（拆包）。

对于这样的问题只能通过上层的应用来解决，常见的方式有：

在报文末尾增加换行符表明一条完整的消息，这样在接收端可以根据这个换行符来判断消息是否完整。
将消息分为消息头、消息体。可以在消息头中声明消息的长度，根据这个长度来获取报文（比如 808 协议）。
规定好报文长度，不足的空位补齐，取的时候按照长度截取即可。

以上的这些方式我们在 Netty 的 pipline 中里加入对应的解码器都可以手动实现。

但其实 Netty 已经帮我们做好了，完全可以开箱即用。

比如：

LineBasedFrameDecoder 可以基于换行符解决。
DelimiterBasedFrameDecoder 可基于分隔符解决。
FixedLengthFrameDecoder 可指定长度解决。

字符串拆、粘包

下面来模拟一下最简单的字符串传输。

还是在之前的

https://github.com/crossoverJie/netty-action

进行演示。

在 Netty 客户端中加了一个入口可以循环发送 100 条字符串报文到接收端：

/**
     * 向服务端发消息 字符串
     * @param stringReqVO
     * @return
     */
    @ApiOperation("客户端发送消息，字符串")
    @RequestMapping(value = "sendStringMsg", method = RequestMethod.POST)
    @ResponseBody
    public BaseResponse<NULLBody> sendStringMsg(@RequestBody StringReqVO stringReqVO){
        BaseResponse<NULLBody> res = new BaseResponse();

        for (int i = 0; i < 100; i++) {
            heartbeatClient.sendStringMsg(stringReqVO.getMsg()) ;
        }

        // 利用 actuator 来自增
        counterService.increment(Constants.COUNTER_CLIENT_PUSH_COUNT);

        SendMsgResVO sendMsgResVO = new SendMsgResVO() ;
        sendMsgResVO.setMsg("OK") ;
        res.setCode(StatusEnum.SUCCESS.getCode()) ;
        res.setMessage(StatusEnum.SUCCESS.getMessage()) ;
        return res ;
    }
    
    
    
    /**
     * 发送消息字符串
     *
     * @param msg
     */
    public void sendStringMsg(String msg) {
        ByteBuf message = Unpooled.buffer(msg.getBytes().length) ;
        message.writeBytes(msg.getBytes()) ;
        ChannelFuture future = channel.writeAndFlush(message);
        future.addListener((ChannelFutureListener) channelFuture ->
                LOGGER.info("客户端手动发消息成功={}", msg));

    }

服务端直接打印即可：

@Override
    protected void channelRead0(ChannelHandlerContext ctx, String msg) throws Exception {
        LOGGER.info("收到msg={}", msg);

    }

顺便提一下，这里加的有一个字符串的解码器：.addLast(new StringDecoder()) 其实就是把消息解析为字符串。

@Override
    protected void decode(ChannelHandlerContext ctx, ByteBuf msg, List<Object> out) throws Exception {
        out.add(msg.toString(charset));
    }

在 Swagger 中调用了客户端的接口用于给服务端发送了 100 次消息：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

正常情况下接收端应该打印 100 次 hello 才对，但是查看日志会发现：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

收到的内容有完整的、多的、少的、拼接的；这也就对应了上面提到的拆包、粘包。

该怎么解决呢？这便可采用之前提到的 LineBasedFrameDecoder 利用换行符解决。

利用 LineBasedFrameDecoder 解决问题

LineBasedFrameDecoder 解码器使用非常简单，只需要在 pipline 链条上添加即可。

//字符串解析,换行防拆包
.addLast(new LineBasedFrameDecoder(1024))
.addLast(new StringDecoder())

构造函数中传入了 1024 是指报的长度最大不超过这个值，具体可以看下文的源码分析。

然后我们再进行一次测试看看结果：

注意，由于 LineBasedFrameDecoder 解码器是通过换行符来判断的，所以在发送时，一条完整的消息需要加上 \n。

Netty(三) 什么是 TCP 拆、粘包？如何解决？

最终的结果：
Netty(三) 什么是 TCP 拆、粘包？如何解决？

仔细观察日志，发现确实没有一条被拆、粘包。

LineBasedFrameDecoder 的原理

目的达到了，来看看它的实现原理：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

第一步主要就是 findEndOfLine 方法去找到当前报文中是否存在分隔符，存在就会返回分隔符所在的位置。
判断是否需要丢弃，默认为 false ，第一次走这个逻辑（下文会判断是否需要改为 true）。
如果报文中存在换行符，就会将数据截取到那个位置。
如果不存在换行符（有可能是拆包、粘包），就看当前报文的长度是否大于预设的长度。大于则需要缓存这个报文长度，并将 discarding 设为 true。
如果是需要丢弃时，判断是否找到了换行符，存在则需要丢弃掉之前记录的长度然后截取数据。
如果没有找到换行符，则将之前缓存的报文长度进行累加，用于下次抛弃。

从这个逻辑中可以看出就是寻找报文中是否包含换行符，并进行相应的截取。

由于是通过缓冲区读取的，所以即使这次没有换行符的数据，只要下一次的报文存在换行符，上一轮的数据也不会丢。

高效的编码方式 Google Protocol

上面提到的其实就是在解码中进行操作，我们也可以自定义自己的拆、粘包工具。

编解码的主要目的就是为了可以编码成字节流用于在网络中传输、持久化存储。

Java 中也可以实现 Serializable 接口来实现序列化，但由于它性能等原因在一些 RPC 调用中用的很少。

而 Google Protocol 则是一个高效的序列化框架，下面来演示在 Netty 中如何使用。

安装

首先第一步自然是安装：

在官网下载对应的包。

本地配置环境变量：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

当执行 protoc --version 出现以下结果表明安装成功：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

定义自己的协议格式

接着是需要按照官方要求的语法定义自己的协议格式。

比如我这里需要定义一个输入输出的报文格式：

BaseRequestProto.proto:

syntax = "proto2";

package protocol;

option java_package = "com.crossoverjie.netty.action.protocol";
option java_outer_classname = "BaseRequestProto";

message RequestProtocol {
  required int32 requestId = 2;
  required string reqMsg = 1;
  

}

BaseResponseProto.proto:

syntax = "proto2";

package protocol;

option java_package = "com.crossoverjie.netty.action.protocol";
option java_outer_classname = "BaseResponseProto";

message ResponseProtocol {
  required int32 responseId = 2;
  required string resMsg = 1;
  

}

再通过

protoc --java_out=/dev BaseRequestProto.proto BaseResponseProto.proto

protoc 命令将刚才定义的协议格式转换为 Java 代码，并生成在 /dev 目录。

只需要将生成的代码拷贝到我们的项目中，同时引入依赖：

<dependency>
    <groupId>com.google.protobuf</groupId>
    <artifactId>protobuf-java</artifactId>
    <version>3.4.0</version>
</dependency>

利用 Protocol 的编解码也非常简单：

public class ProtocolUtil {

    public static void main(String[] args) throws InvalidProtocolBufferException {
        BaseRequestProto.RequestProtocol protocol = BaseRequestProto.RequestProtocol.newBuilder()
                .setRequestId(123)
                .setReqMsg("你好啊")
                .build();

        byte[] encode = encode(protocol);

        BaseRequestProto.RequestProtocol parseFrom = decode(encode);

        System.out.println(protocol.toString());
        System.out.println(protocol.toString().equals(parseFrom.toString()));
    }

    /**
     * 编码
     * @param protocol
     * @return
     */
    public static byte[] encode(BaseRequestProto.RequestProtocol protocol){
        return protocol.toByteArray() ;
    }

    /**
     * 解码
     * @param bytes
     * @return
     * @throws InvalidProtocolBufferException
     */
    public static BaseRequestProto.RequestProtocol decode(byte[] bytes) throws InvalidProtocolBufferException {
        return BaseRequestProto.RequestProtocol.parseFrom(bytes);
    }
}

利用 BaseRequestProto 来做一个演示，先编码再解码最后比较最终的结果是否相同。答案肯定是一致的。

利用 protoc 命令生成的 Java 文件里已经帮我们把编解码全部都封装好了，只需要简单调用就行了。

可以看出 Protocol 创建对象使用的是构建者模式，对使用者来说清晰易读，更多关于构建器的内容可以参考这里。

更多关于 Google Protocol 内容请查看官方开发文档。

结合 Netty

Netty 已经自带了对 Google protobuf 的编解码器，也是只需要在 pipline 中添加即可。

server 端：

// google Protobuf 编解码
.addLast(new ProtobufDecoder(BaseRequestProto.RequestProtocol.getDefaultInstance()))
.addLast(new ProtobufEncoder())

客户端：

// google Protobuf 编解码

.addLast(new ProtobufDecoder(BaseResponseProto.ResponseProtocol.getDefaultInstance()))

.addLast(new ProtobufEncoder())

稍微注意的是，在构建 ProtobufDecoder 时需要显式指定解码器需要解码成什么类型。

我这里服务端接收的是 BaseRequestProto，客户端收到的是服务端响应的 BaseResponseProto 所以就设置了对应的实例。

同样的提供了一个接口向服务端发送消息，当服务端收到了一个特殊指令时也会向客户端返回内容：

@Override
    protected void channelRead0(ChannelHandlerContext ctx, BaseRequestProto.RequestProtocol msg) throws Exception {
        LOGGER.info("收到msg={}", msg.getReqMsg());

        if (999 == msg.getRequestId()){
            BaseResponseProto.ResponseProtocol responseProtocol = BaseResponseProto.ResponseProtocol.newBuilder()
                    .setResponseId(1000)
                    .setResMsg("服务端响应")
                    .build();
            ctx.writeAndFlush(responseProtocol) ;
        }

    }

在 swagger 中调用相关接口：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

在日志可以看到服务端收到了消息，同时客户端也收到了返回：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

Netty(三) 什么是 TCP 拆、粘包？如何解决？

虽说 Netty 封装了 Google Protobuf 相关的编解码工具，其实查看它的编码工具就会发现也是利用上文提到的 api 实现的。

Netty(三) 什么是 TCP 拆、粘包？如何解决？

Protocol 拆、粘包

Google Protocol 的使用确实非常简单，但还是有值的注意的地方，比如它依然会有拆、粘包问题。

不妨模拟一下：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

连续发送 100 次消息看服务端收到的怎么样：

Netty(三) 什么是 TCP 拆、粘包？如何解决？

会发现服务端在解码的时候报错，其实就是被拆、粘包了。

这点 Netty 自然也考虑到了，所以已经提供了相关的工具。

//拆包解码
.addLast(new ProtobufVarint32FrameDecoder())
.addLast(new ProtobufVarint32LengthFieldPrepender())

只需要在服务端和客户端加上这两个编解码工具即可，再来发送一百次试试。

查看日志发现没有出现一次异常，100 条信息全部都接收到了。

Netty(三) 什么是 TCP 拆、粘包？如何解决？

这个编解码工具可以简单理解为是在消息体中加了一个 32 位长度的整形字段，用于表明当前消息长度。

总结

网络这块同样是计算机的基础，由于近期在做相关的工作所以接触的比较多，也算是给大学补课了。

后面会接着更新 Netty 相关的内容，最后会产出一个高性能的 HTTP 以及 RPC 框架，敬请期待。

上文相关的代码：

https://github.com/crossoverJie/netty-action

号外

最近在总结一些 Java 相关的知识点，感兴趣的朋友可以一起维护。

地址: https://github.com/crossoverJie/Java-Interview

欢迎关注公众号一起交流：
Netty(三) 什么是 TCP 拆、粘包？如何解决？

netty tcp segmentfault

huaye00

0 关注 0 粉丝 0 动态

相关推荐

浅析 Netty 实现心跳机制与断线重连

顾名思义, 所谓心跳, 即在 TCP 长连接中, 客户端和服务器之间定期发送的一种特殊的数据包, 通知对方自己还在线, 以确保 TCP 连接的有效性.使用 TCP 协议层面的 keepalive 机制.它不是 TCP 的标准协议, 并且是默认关闭的.TCP

fengshantao 2020-06-11

Netty TCP 粘包和拆包及解决方案

1 TCP 粘包和拆包基本介绍 1) TCP 是面向连接的，面向流的，提供高可靠性服务。这样做虽然提高了效率，但是接收端就难于分辨出完整的数据包了，因为面向流的通信是无消息保护边界的。2) 由于 TCP 无消息保护边界, 需要在接收端处理消息边界问

爱传文档 2020-05-04

netty设置socket用户缓冲区

由于netty对socket read有一套自己的流程，可能数据-》网卡-〉tcp接收缓冲区-》netty缓冲区，测试用例不好设计，故不做实践部分

追寻水中桥 2020-02-02

没吃透Netty 缓冲区，还能算得上Java老司机？

Java NIO 需要理解的主要有缓冲区，通道，选择器，这三个主要的部分。操作系统为了提供稳定性，把虚拟地址空间分为用户空间和内核空间，其中用户进程只能操作用户空间的内容，而内核空间的内容可以操作用户空间的内容以及用户空间的内容。总结数据流向是：磁盘 -

fengshantao 2020-10-29

彻底搞懂 Netty 线程模型

在学习Netty 之前我们最好先掌握 BIO、NIO、AIO 基础知识，前面我们已经花了三篇文章去讲这些知识。我们开始来学习 Netty 的具体知识了，本文就Netty线程模型展开分析。简单来说，内核将可读可写事件通知应用，由应用主动发起读写事件；NIO

arctan0 2020-10-14

netty教程

Netty 是由 JBOSS 提供的一个 Java 开源框架。Netty 提供异步的、基于事件驱动的网络。应用程序框架，用以快速开发高性能、高可靠性的网络 IO 程序。个网络应用，相当于简化和流程化了 NIO 的开发过程。通信行业等获得了广泛的应用，知名的

爱传文档 2020-07-28

初识Netty：背景、现状与趋势

Netty由Trustin Lee 2004年开发。Netty is an asynchronous event-driven network application framework for rapid development of maintain

gzx0 2020-07-05

Netty源码学习系列之5-NioEventLoop的run方法

NioEventLoop的run方法，是netty中最核心的方法，没有之一。在该方法中，完成了对已注册的channel上来自底层操作系统的socket事件的处理、单线程任务队列的处理，当然还包括对NIO空轮询的规避、消息的编解码等。下面一起来探究一番，首先

fengshantao 2020-07-04

昨天，我彻底搞懂了Netty内存分配策略！

Netty 作为一款高性能的 RPC 框架必然涉及到频繁的内存分配销毁操作。基于此，在堆外内存使用方面，Netty 自己实现了一套创建、回收堆外内存池的相关功能。这些划分在 Netty 中的实现接口分别如下。另外 Netty 并不是直接对外暴露这些 AP

fengshantao 2020-07-02

【从BIO到Netty】1.BIO存在的问题

package org.scaventz.bio;import java.net.Socket;private ServerSocket serverSocket;private final int PORT = 8080;serverSocket = n

jannal 2020-06-21

Netty中的这些知识点，你需要知道！

Channel是一个接口，而且是一个很大的接口，我们称之为“大而全”，囊括了server端及client端接口所需要的接口。Channel聚合了包括网络读写、链路管理、网络连接信息、获取EventLoop、Pipeline等相关功能类；统一分配，调度实现相

arctan0 2020-06-19

你要的Netty常见面试题总结，我面试回来整理好了！

最近经常会再面试中碰到 Netty 相关的问题。全文采用大家喜欢的与面试官对话的形式展开。如果大家觉得总结的不错的话，不妨点一个赞鼓励一下！这是我继续坚持很重要的动力来源。Netty 应用场景了解么？Netty 核心组件有哪些？Netty 服务端和客户端的

arctan0 2020-06-16

Netty（五）Netty 高性能之道

通过使用 Netty相比于传统基于 Java 序列化+BIO的通信框架，性能提升了 8 倍多。实上，我对这个数据并不感到惊讶，根据我多的 NIO 编程经验，通过选择合适的 NIO 框架，精心的设计 Reactor 线程。模型，达到上述性能指标是完全有可能的

gzx0 2020-06-14

Netty

需要将数据缓冲区地址和大小传给OS，OS需要支持异步IO操作API）。你可以不断问大堂经理排到了没有，大堂经理如果说还没到你就不能去（使用非阻塞IO时，如果不能读写Java调用会马上返回，当IO事件分发器会通知可读写时再继续进行读写，不断循环直到读写完成）

fengshantao 2020-06-13

第一章：初识Netty：背景、现状与趋势 (7讲)

请求处理最主要的流程是什么？最核心的逻辑是什么？在了解这些主线之前，不要迷恋细节，否则容易迷失在那些细枝末节的代码中。如何学好一个技术？Netty 相关:《Netty权威指南》《Netty实战》《Netty进阶之路：跟着案例学Netty》。老师，一般的ne

gzx0 2020-06-12

Netty中使用零拷贝方式写大数据

因为网络饱和的可能性，如何在异步框架中高效地写大块的数据是一个特殊的问题。由于写操作是非阻塞的，所以即使没有写出所有的数据，写操作也会在完成时返回并通知ChannelFuture。当这种情况发生时，如果仍然不停地写入，就有内存耗尽的风险。所以在写大型数据时

arctan0 2020-06-11

Netty原理

Netty事件监听和处理（下）。这可能是目前最透彻的Netty原理架构解析

jannal 2020-05-25

Netty源码死磕二（Netty的启动流程）

上一篇文章介绍了Netty的线程模型及EventLoop机制，相信大家对Netty已经有一个基本的认识。那么本篇文章我会根据Netty提供的Demo来分析一下Netty启动流程。创建ServerBootstrap实例，ServerBootstrap是Net

mbcsdn 2020-05-19

简单的Java实现Netty进行通信

看过dubbo源码的同学应该都清楚，使用dubbo协议的底层通信是使用的netty进行交互，而最近看了dubbo的Netty部分后，自己写了个简单的Netty通信例子。rpc-common作为各个模块都需使用的模块，工程中出现的是一些通信时请求的参数以及返

arctan0 2020-05-16

Netty的实现原理、特点与优势、以及适用场景

Netty是由JBOSS提供的一个java开源框架。Netty是一个高性能、异步事件驱动的NIO框架，它提供了对TCP、UDP和文件传输的支持。作为当前最流行的NIO框架，Netty在互联网领域、大数据分布式计算领域、游戏行业、通信行业等获得了广泛的应用，

爱传文档 2020-05-08

huaye00

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号