Linux 使用 Protocol Buffers 在 TCP 中需要自己设计协议头以解决 “粘包” 问题吗?

qichunren · August 14, 2018 · Last by yfractal replied at August 17, 2018 · 11225 hits

由于 TCP 是流式的,我发送数据时,使用 Protocol Buffers 序列化消息后,需要额外将序列化的消息放进自己设计的数据包中吗?还是可以直接发送给接收方?

想知道 Protocol Buffers 本身是否已经支持这一点,即接收方收到数据放入数据缓冲区后,直接反序列化即可解析出消息实体?

不用再包一遍了吧,SDK 会帮你搞定

“粘包”是一个不存在的概念。提出这个概念的人肯定没有理解 TCP。send 不表示把数据作为一个包发出去了,receive 也不表示接收到的一定是一个包。开发者需要自己定义包格式以及解析规则,正好 Protocol Buffers 把这些事都做好了,直接用就好了。

我见过有人为了解决所谓的“粘包”问题,每次 send 之后都来一次 sleep,以此保证另一端 receive 的时候不会受到多于一个包的数据,显然这是一种非常蠢的做法。之所以用这么蠢的做法,是因为脑子里臆想了一个更蠢的“粘包”概念。

本身没有,可以 2 字节表示包长

不明白 protobuf 跟 TCP 有啥关系,直接 encode 成 binary 发过去后,对方再 decode 就好了

Reply to tony612

erlang gen_tcp 有 {packet, N},其它语言要自己搞吧

Reply to lidashuang

@lidashuang 两个字节也不行吧,还得加自己构建一个包头和包尾。

@tony612 消息 encode 之后,对方收到的消息是流式的,也就是前后没有边界的,需要定义一个规则才能确定数据包的位置的。

Reply to qichunren

用 Protocol Buffer 就上 gRPC https://grpc.io/

Protobuf 确实跟 TCP 没啥关系啊,protobuf 只是一种二进制消息打包方式,你 TCP 怎么分包跟他没啥关系。

最简单的办法就是留一个定长的头来存储后面消息的长度就好了

要具体看协议了。比如直接读 16 位,有哪几位是长度啥的。 既然用 protobuf 了,为啥不直接 grpc 呢?

You need to Sign in before reply, if you don't have an account, please Sign up first.