本文章转自:乐字节

文章次要解说:Java罕用序列化框架

获取更多JAVA相干材料能够关注公众号《乐字节》 发送:999

一 背景介绍

序列化与反序列化是咱们日常数据长久化和网络传输中常常应用的技术,然而目前各种序列化框架让人目迷五色,不分明什么场景到底采纳哪种序列化框架。本文会将业界开源的序列化框架进行比照测试,别离从通用性、易用性、可扩展性、性能和数据类型与Java语法反对五方面给出比照测试。

上面别离对JDK Serializable、FST、Kryo、Protobuf、Thrift、Hession和Avro进行比照测试。

二 序列化框架

1 JDK Serializable

JDK Serializable是Java自带的序列化框架,咱们只须要实现java.io.Serializable或java.io.Externalizable接口,就能够应用Java自带的序列化机制。实现序列化接口只是示意该类可能被序列化/反序列化,咱们还须要借助I/O操作的ObjectInputStream和ObjectOutputStream对对象进行序列化和反序列化。

通用性

因为是Java内置序列化框架,所以自身是不反对跨语言序列化与反序列化。

易用性

作为Java内置序列化框架,无序援用任何内部依赖即可实现序列化工作。然而JDK Serializable在应用上相比开源框架难用许多,能够看到下面的编解码应用十分僵硬,须要借助ByteArrayOutputStream和ByteArrayInputStream才能够残缺字节的转换。

可扩展性

JDK Serializable中通过serialVersionUID管制序列化类的版本,如果序列化与反序列化版本不统一,则会抛出java.io.InvalidClassException异样信息,提醒序列化与反序列化SUID不统一。

性能

JDK Serializable是Java自带的序列化框架,然而在性能上其实一点不像亲生的。上面测试用例是咱们贯通全文的一个测试实体。
咱们对该测试用例进行1000万次序列化,而后计算工夫总和:

同样咱们之后会同其它序列化框架进行比照。

数据类型和语法结构支持性

因为JDK Serializable是Java语法原生序列化框架,所以根本都可能反对Java数据类型和语法。

WeakHashMap没有实现Serializable接口。

2 FST序列化框架

FST(fast-serialization)是齐全兼容JDK序列化协定的Java序列化框架,它在序列化速度上能达到JDK的10倍,序列化后果只有JDK的1/3。目前FST的版本为2.56,在2.17版本之后提供了对Android的反对。

通用性

FST同样是针对Java而开发的序列化框架,所以也不存在跨语言个性。

易用性

在易用性上,FST能够说可能甩JDK Serializable几条街,语法极其简洁,FSTConfiguration封装了大部分办法。

可扩展性

FST通过@Version注解可能反对新增字段与旧的数据流兼容。对于新增的字段都须要通过@Version注解标识,没有版本正文意味着版本为0。

留神:

综合来看,FST在扩展性下面尽管反对,然而用起来还是比拟繁琐的。

性能

应用FST序列化下面的测试用例,序列化后大小为:172,相比JDK序列化的432 ,将近缩小了1/3。上面咱们再看序列化与反序列化的工夫开销。

数据类型和语法结构支持性

FST是基于JDK序列化框架而进行开发的,所以在数据类型和语法上和Java支持性统一。

3 Kryo序列化框架

Kryo一个疾速无效的Java二进制序列化框架,它依赖底层ASM库用于字节码生成,因而有比拟好的运行速度。Kryo的指标就是提供一个序列化速度快、后果体积小、API简略易用的序列化框架。Kryo反对主动深/浅拷贝,它是间接通过对象->对象的深度拷贝,而不是对象->字节->对象的过程。

通用性

首先Kryo官网说本人是一款Java二进制序列化框架,其次在网上搜了一遍没有看到Kryo的跨语言应用,只是一些文章提及了跨语言应用非常复杂,然而没有找到其它语言的相干实现。

易用性

在应用形式上Kryo提供的API也是十分简洁易用,Input和Output封装了你简直可能想到的所有流操作。Kryo提供了丰盛的灵便配置,比方自定义序列化器、设置默认序列化器等等,这些配置应用起来还是比拟吃力的。

可扩展性

Kryo默认序列化器FiledSerializer是不反对字段扩大的,如果想要应用扩大序列化器则须要配置其它默认序列化器。

性能

应用Kryo测试下面的测试用例,Kryo序列化后的字节大小为172 ,和FST未经优化的大小统一。工夫开销如下:

咱们同样敞开循环援用配置和预注册序列化类,序列化后的字节大小为120,因为这时候类序列化的标识是应用的数字,而不是类全名。应用的是工夫开销如下:

数据类型和语法结构支持性

Kryo对于序列化类的根本要求就是须要含有无参构造函数,因为反序列化过程中须要应用无参构造函数创建对象。

4 Protocol buffer

Protocol buffer是一种语言中立、平台无关、可扩大的序列化框架。Protocol buffer相较于后面几种序列化框架而言,它是须要事后定义Schema的。

通用性

protobuf设计之初的指标就是可能设计一款与语言无关的序列化框架,它目前反对了Java、Python、C++、Go、C#等,并且很多其它语言都提供了第三方包。所以在通用性上,protobuf是十分给力的。

易用性

protobuf须要应用IDL来定义Schema形容文件,定义完形容文件后,咱们能够间接应用protoc来间接生成序列化与反序列化代码。所以,在应用上只须要简略编写形容文件,就能够应用protobuf了。

可扩展性

可扩展性同样是protobuf设计之初的指标之一,咱们能够十分轻松的在.proto文件进行批改。
新增字段:对于新增字段,咱们肯定要保障新增字段要有对应的默认值,这样才可能与旧代码交互。相应的新协定生成的音讯,能够被旧协定解析。
删除字段:删除字段须要留神的是,对应的字段、标签不可能在后续更新中应用。为了防止谬误,咱们能够通过reserved躲避带哦。

protobuf在数据兼容性上也十分敌对,int32、unit32、int64、unit64、bool是齐全兼容的,所以咱们能够依据须要批改其类型。
通过下面来看,protobuf在扩展性上做了很多,可能很敌对的反对协定扩大。

性能

咱们同样应用下面的实例来进行性能测试,应用protobuf序列化后的字节大小为 192,上面是对应的工夫开销。

能够看出protobuf的反序列化性能要比FST、Kryo差一些。

数据类型和语法结构反对

Protobuf应用IDL定义Schema所以不反对定义Java办法,上面序列化变量的测试:

注:List、Set、Queue通过protobuf repeated定义测试的。只有实现Iterable接口的类都能够应用repeated列表。

5 Thrift序列化框架

Thrift是由Facebook实现的一种高效的、反对多种语言的近程服务调用框架,即RPC(Remote Procedure Call)。起初Facebook将Thrift开源到Apache。能够看到Thrift是一个RPC框架,然而因为Thrift提供了多语言之间的RPC服务,所以很多时候被用于序列化中。

应用Thrift实现序列化次要分为三步,创立thrift IDL文件、编译生成Java代码、应用TSerializer和TDeserializer进行序列化和反序列化。

通用性

Thrift和protobuf相似,都须要应用IDL定义形容文件,这是目前实现跨语言序列化/RPC的一种无效形式。Thrift目前反对 C++、Java、Python、PHP、Ruby、 Erlang、Perl、Haskell、C#、Cocoa、JavaScript、Node.js、Smalltalk、OCaml、Delphi等语言,所以能够看到Thrift具备很强的通用性。

易用性

Thrift在易用性上和protobuf相似,都须要通过三步:应用IDL编写thrift文件、编译生成Java代码和调用序列化与反序列化办法。protobuf在生成类中曾经内置了序列化与反序列化办法,而Thrift须要独自调用内置序列化器来进行编解码。

可扩展性

Thrift反对字段扩大,在扩大字段过程中须要留神以下问题:

性能

下面的测试用例,应用Thrift序列化后的字节大小为:257,上面是对应的序列化工夫与反序列化工夫开销:

Thrift在序列化和反序列化的工夫开销总和上和protobuf差不多,protobuf在序列化工夫上更占优势,而Thrift在反序列化上有本人的劣势。

数据类型和语法结构反对

数据类型反对:因为Thrift应用IDL来定义序列化类,所以可能反对的数据类型就是Thrift数据类型。Thrift所可能反对的Java数据类型:

Thrift同样不反对定义Java办法。

6 Hessian序列化框架

Hessian是caucho公司开发的轻量级RPC(Remote Procedure Call)框架,它应用HTTP协定传输,应用Hessian二进制序列化。
Hessian因为其反对跨语言、高效的二进制序列化协定,被常常用于序列化框架应用。Hessian序列化协定分为Hessian1.0和Hessian2.0,Hessian2.0协定对序列化过程进行了优化(优化内容待看),在性能上相较Hessian1.0有显著晋升。
应用Hessian序列化非常简单,只须要通过HessianInput和HessianOutput即可实现对象的序列化,上面是Hessian序列化的Demo:

通用性

Hessian与Protobuf、Thrift一样,反对跨语言RPC通信。Hessian相比其它跨语言PRC框架的一个次要劣势在于,它不是采纳IDL来定义数据和服务,而是通过自描述来实现服务的定义。目前Hessian曾经实现了语言包含:Java、Flash/Flex、Python、C++、.Net/C#、D、Erlang、PHP、Ruby、Object-C。

易用性

相较于Protobuf和Thrift,因为Hessian不须要通过IDL来定义数据和服务,对于序列化的数据只须要实现Serializable接口即可,所以应用上相比Protobuf和Thrift更加容易。

可扩展性

Hession序列化类尽管须要实现Serializable接口,然而它并不受serialVersionUID影响,可能轻松反对字段扩大。

性能

应用Hessian1.0协定序列化下面的测试用例,序列化后果大小为277。应用Hessian2.0序列化协定,序列化后果大小为178。

序列化化与反序列化的工夫开销如下:

能够看到Hessian1.0的无论在序列化后体积大小,还是在序列化、反序列化工夫上都比Hessian2.0相差很远。

数据类型和语法结构反对

因为Hession应用Java自描述序列化类,所以Java原生数据类型、汇合类、自定义类、枚举等根本都可能反对(SynchronousQueue不反对),Java语法结构也可能很好的反对。

7 Avro序列化框架

Avro是一个数据序列化框架。它是Apache Hadoop下的一个子项目,由Doug Cutting主导Hadoop过程中开发的数据序列化框架。Avro在设计之初就用于反对数据密集型利用,很适宜近程或本地大规模数据交换和存储。

通用性

Avro通过Schema定义数据结构,目前反对Java、C、C++、C#、Python、PHP和Ruby语言,所以在这些语言之间Avro具备很好的通用性。

易用性

Avro对于动静语言无需生成代码,但对于Java这类动态语言,还是须要应用avro-tools.jar来编译生成Java代码。在Schema编写上,个人感觉相比Thrift、Protobuf更加简单。

可扩展性

性能

应用Avro生成代码序列化之后的后果为:111。上面是应用Avro序列化的工夫开销:

数据类型和语法结构反对

Avro须要应用Avro所反对的数据类型来编写Schema信息,所以可能反对的Java数据类型即为Avro所反对的数据类型。Avro反对数据类型有:根底类型(null、boolean、int、long、float、double、bytes、string),简单数据类型(Record、Enum、Array、Map、Union、Fixed)。

Avro主动生成代码,或者间接应用Schema,不能反对在序列化类中定义java办法。

三 总结

1 通用性

上面是从通用性上比照各个序列化框架,能够看出Protobuf在通用上是最佳的,可能反对多种支流变成语言。

2 易用性

上面是从API应用的易用性下面来比照各个序列化框架,能够说除了JDK Serializer外的序列化框架都提供了不错API应用形式。

3 可扩展性

上面是各个序列化框架的可扩展性比照,能够看到Protobuf的可扩展性是最不便、天然的。其它序列化框架都须要一些配置、注解等操作。

4 性能

序列化大小比照

比照各个序列化框架序列化后的数据大小如下,能够看出kryo preregister(事后注册序列化类)和Avro序列化后果都很不错。所以,如果在序列化大小上有需要,能够抉择Kryo或Avro。

序列化工夫开销比照

上面是序列化与反序列化的工夫开销,kryo preregister和fst preregister都能提供优异的性能,其中fst pre序列化工夫就最佳,而kryo pre在序列化和反序列化工夫开销上基本一致。所以,如果序列化工夫是次要的思考指标,能够抉择Kryo或FST,都能提供不错的性能体验。

5 数据类型和语法结构反对

各序列化框架对Java数据类型反对的比照:

注:汇合类型测试根本笼罩了所有对应的实现类。

上面依据测试总结了以上序列化框架所能反对的数据类型、语法。

因为Protobuf、Thrift是IDL定义类文件,而后应用各自的编译器生成Java代码。IDL没有提供定义staic外部类、非static外部类等语法,所以这些性能无奈测试。

感激大家的认同与反对,小编会继续转发《乐字节》优质文章