Dubbo序列化插件smartbuf与kryofsthessian2fastjson等性能对比

jiezi

4 年前

本文同步发布于 GitHub、个人主页等

smartbuf-dubbo是一个基于 smartbuf 的dubbo序列化插件。

它内部封装了 smartbuf 序列化框架的 stream 模式，通过自定义的 SmartbufSerialization 向dubbo暴露了一个名为 smartbuf 的序列化器。

关于`smartbuf`

smartbuf是一种新颖、高效、智能、易用的跨语言序列化框架，它既拥有不亚于 protobuf 的高性能，也拥有与 json 相仿的通用性、可扩展性、可调试性等。

它内部采用分区序列化将松散的对象序列化为若干个紧凑的分区，从而大幅提高编码效率，具体细节请参考 smartbuf 项目。

smartbuf-dubbo内部实现非常简单，它只是简单地按照 dubbo 官方文档提供了序列化插件，包括三个class:

SmartbufObjectInput
SmartbufObjectOutput
SmartbufSerialization

以及位于 core/src/main/resources/META-INF.dubbo/ 的插件配置。

此插件已打包 deploy 至中心仓库，所以你可以直接通过以下 maven 坐标引入它：

<dependency>
    <groupId>com.github.smartbuf</groupId>
    <artifactId>smartbuf-dubbo</artifactId>
    <version>1.0.1</version>
</dependency>

当然也可以直接将以上提到的 class 和resources配置复制入自己的工程中，同时记得手动添加 smartbuf 依赖。

之后就可以按照官方文档的配置，在 protocol 中选择启用序列化插件，具体效果可能类似于：

<dubbo:protocol serialization="smartbuf" />

此插件支持 com.alibaba 版本与 org.apache 版本的dubbo。

根目录中的 demo-alibaba 和demo-apache分别针对 2.6.* 版本和 2.7.* 版本的 dubbo 进行序列化测试，测试对象包括smartbuf、fastjson、hessian2、kryo、fst。

对比测试包括三部分：tiny、user、posts，分别对比测试各个序列化框架在简单、普通、复杂业务中的综合表现。

提示：对比测试侧重于单线程的序列化性能、数据压缩率，最终数据仅用于横向对比各个序列化框架，并不能体现 dubbo 本身的多并发性能。

大数据集 `posts` 测试

此测试中 dubbo 接口返回的数据为 100 个固定的 PostModel 实例，其具体模型如下：

public class PostModel implements Serializable {
    private int         postId;
    private int         authorId;
    private Integer     prePostId;
    private String      title;
    private String      description;
    private ContentType contentType;
    private Visibility  visibility;
    private long        createTime;

    private List<Integer>    mentions = new ArrayList<>();
    private List<TopicModel> topics   = new ArrayList<>();}

测试中随机创建 100 个PostModel对象、10个 TopicModel 对象，然后随机为每个 PostModel 分配若干个 TopicModel，最终模拟类似实际产品应用中的queryPost 结果集。

这个数据集采用 json 编码时，大概 20KB，各个序列化框架调用10w 次的综合表现为：

fastjson: 耗时约192s, 网络输入输出总计约17.88GB
fst: 耗时约52s, 网络输入输出总计约4.01GB
hessian2: 耗时约115s, 网络输入输出总计约11.08GB
kryo: 耗时约135s, 网络输入输出总计约4.05GB
smartbuf: 耗时约75s, 网络输入输出总计约2.15GB

具体表现如下图所示，横轴表示时间，纵轴表示网络流量：

说明：模型中存在枚举值ContentType 与Visibility，而测试中使用的 kryo 并不支持枚举，因此在测试 kryo 时直接忽略了枚举，最终导致它的测试数据并不完整。

普通数据集 `user` 测试

此测试中 dubbo 接口返回的数据为 1 个固定的 UserModel 实例，其具体模型如下：

public class UserModel implements Serializable {
    private int    id;
    private String token;
    private String nickname;
    private String loginIp;
    private long   loginTime;
    private long   createTime;
    private long   updateTime;

    private List<UserModel> friends = new ArrayList<>();}

为了照顾 kryo，此测试中不再使用enum 类型。

测试中为 friends 随机创建 20 个UserModel对象，顺便测试一下各个序列化框架对循环引用的处理。这个数据集采用 json 编码时，大概 4KB，各个序列化框架调用30w 次的综合表现为：

fastjson: 耗时约41s, 网络输入输出总计约1.11GB
fst: 耗时约31s, 网络输入输出总计约0.55GB
hessian2: 耗时约32s, 网络输入输出总计约0.57GB
kryo: 耗时约39s, 网络输入输出总计约0.62GB
smartbuf: 耗时约41s, 网络输入输出总计约0.43GB

具体表现如下图所示，横轴表示时间，纵轴表示网络流量：

小数据集 `tiny` 测试

此测试中 dubbo 接口返回的数据为一个普通的 uuid 字符串，没有太大的意义。各个序列化框架调用 40w 次的综合表现为：

fastjson: 耗时约46s, 网络输入输出总计约130MB
fst: 耗时约38s, 网络输入输出总计约122MB
hessian2: 耗时约38s, 网络输入输出总计约120MB
kryo: 耗时约38s, 网络输入输出总计约120MB
smartbuf: 耗时约42s, 网络输入输出总计约120MB

具体表现如下图所示，横轴表示时间，纵轴表示网络流量：

以上测试全部为本地网络，使用的 dubbo 版本号为2.6.7。

你可以直接 checkout 源代码在本地执行测试代码。测试中用于采集网络 IO 数据的 NetMonitor 类内部使用了 nettop 指令，据我了解它应该只支持 osx 操作系统，如果你在其他系统中执行测试，可能无法获得正确的 bytes_in 及bytes_out。

由于 smartbuf 在架构设计上采用了数据可复用的分区序列化，因此面对大数据集、数组、列表等结构时，可以通过 属性复用 的技术优势，显著地提高其编码效率。相比于 kryo、fst、hession2 等时，甚至可以提高一倍的空间利用率 ，相比于json 更是提高 一个数量级。

由于 smartbuf 底层设计上以类似于 json 的方式解析数据，因此它的兼容性与 json 相仿，天然地解决了不同对象模型之间的字段兼容。且支持大多数常用的数据类型，也包括枚举、泛型等等。相比之下其他序列化框架仅支持 java 语言，且存在或多或少的兼容性问题，以及支持数据类型过少的问题。比如测试中发现 kryo 不支持 enum 和AbstractList$SubList。

在序列化性能上 smartbuf 相比于 fst 存在一些劣势，可能是分区序列化中内存复制所致，也可能是代码中某些地方存在性能问题。不过这种劣势往往只是纳秒级的，相比于数据报文在服务器、机房、区域的网络传输而言，都是微不足道的。

Dubbo序列化插件smartbuf与kryofsthessian2fastjson等性能对比

介绍

关于`smartbuf`

使用方式

对比其他序列化方案

大数据集 `posts` 测试

普通数据集 `user` 测试

小数据集 `tiny` 测试

测试说明

总结

介绍

关于smartbuf

使用方式

对比其他序列化方案

大数据集 posts 测试

普通数据集 user 测试

小数据集 tiny 测试

测试说明

总结

关于`smartbuf`

大数据集 `posts` 测试

普通数据集 `user` 测试

小数据集 `tiny` 测试