前言
序列化大家都不生疏,说白了就是把以后类对象的状态保留为二进制,而后被用来长久化或者网络传输;罕用的RPC框架在数据传输前都会进行序列化操作,支流的RPC框架蕴含了多种序列化形式比方protobuf,fastjson,kryo,hessian,java内置序列化等等,大抵能够分为二进制和字符串(json字符串)。
反射
因为须要把以后类对象状态保留为二进制,所以往往须要获取所有类属性,这时候大部分的序列化形式都用到了反射,通过反射获取所有类属性获取办法,而后获取到属性值,大抵如下:
//1.办法
Method[] methods = obj.getClass().getDeclaredMethods();
for(Method method : methods) {
method.invoke(obj);
}
//2.字段
Field fields[] = obj.getClass().getDeclaredFields();
for (Field field : fields) {
field.get(obj);
}
然而反射往往在性能上被大家所狐疑,所以呈现了相似protobuf采纳主动生成序列化代码的形式,fastjson应用ASM代替反射的形式;上面咱们先用简略的测试来比照一下各种形式的性能,看反射是否真的慢;
性能测试
在windows10+jdk8环境下别离对间接,反射,以及ASM调用办法别离进行压力测试,看起耗费的工夫,测试中能够屡次执行,取稳固的值;以下测试别离从Person对象通过办法获取属性值,如下:
public class Person {
private String id;
private String name;
public String getId() {
return id;
}
public String getName() {
return name;
}
}
间接调用
间接调用也就是咱们平时最罕用的形式,间接通过对象调用办法名称获取属性值,咱们在压测的时候会别离轮询两个办法:
public static void test() {
Person person = new Person("10001", "zhaohui");
long startTime = System.currentTimeMillis();
for (int i = 0; i < 1_0000_0000; i++) {
if (i % 2 == 0) {
person.getId();
} else {
person.getName();
}
}
long endTime = System.currentTimeMillis();
System.out.println("Manual time:" + (endTime - startTime) + "ms");
}
屡次测试后果大略在90ms左右,间接调用速度是最快的,然而须要咱们手动的写每个bean的序列化代码,或者像protobuf一样应用工具给咱们生成所有的序列化代码,比方生成Person的序列化代码:
public void writeTo(com.google.protobuf.CodedOutputStream output)
throws java.io.IOException {
getSerializedSize();
if (((bitField0_ & 0x00000001) == 0x00000001)) {
output.writeInt32(1, id_);
}
if (((bitField0_ & 0x00000002) == 0x00000002)) {
output.writeBytes(2, getNameBytes());
}
getUnknownFields().writeTo(output);
}
能够看到每个生成的bean都主动生成了序列化代码,并且所有的bean都继承于对立的抽象类,这样提供一整套标准;有个毛病就是每次批改须要手动改proto文件,而后从新生成代码;
反射调用
应用jdk提供的反射机制,获取Methods,而后获取属性值,具体代码如下:
public static void test() throws Exception {
long startTime = System.currentTimeMillis();
Person person = new Person("10001", "zhaohui");
Method[] ms = Person.class.getDeclaredMethods();
for (int i = 0; i < 1_0000_0000; i++) {
ms[i & ms.length - 1].invoke(person);
}
long endTime = System.currentTimeMillis();
System.out.println("Reflex time:" + (endTime - startTime) + "ms");
}
经测试工夫大略维持在205ms左右,和间接调用还是存在肯定差距的,不过jdk每一轮的降级,都在晋升性能,比方jdk7中引入的MethodHandle,模仿字节码层面的调用;
ASM调用
反射是读取长久堆上存储的类信息,而ASM是间接解决.class字节码的,无需加载类,咱们这里应用ReflectASM来进行测试;
ReflectASM 是一个十分小的 Java 类库,通过代码生成来提供高性能的反射解决,主动为 get/set 字段提供拜访类,拜访类应用字节码操作而不是 Java 的反射技术,因而十分快。
public static void test() {
Person person = new Person("10001", "zhaohui");
long startTime = System.currentTimeMillis();
MethodAccess methodAccess = MethodAccess.get(Person.class);
String[] mns = methodAccess.getMethodNames();
int len = mns.length;
int indexs[] = new int[len];
for (int i = 0; i < len; i++) {
indexs[i] = methodAccess.getIndex(mns[i]);
}
for (int i = 0; i < 1_0000_0000; i++) {
methodAccess.invoke(person, indexs[i & len - 1]);
}
long endTime = System.currentTimeMillis();
System.out.println("ASM time:" + (endTime - startTime) + "ms");
}
经测试工夫维持在110ms左右,速度还是很快的,快赶上间接调用了;其中为了取得最大性能,应应用办法或字段索引而不是名称;
总结
能够看到尽管反射性能始终在晋升,然而相比间接调用和ASM的形式还是有一点差距;但其实如果用在RPC上这点工夫在整个网络传输上来说能够说微不足道;如果对性能极度谋求,能够思考应用间接调用或者ASM的形式;
思考
对于间接调用下面说到protobuf,通过工具生成序列化代码,然而这种形式每次改变都要手动生成代码,有点麻烦,是否能够间接利用lombok这种框架做一个扩大,主动生成序列化代码,其实lombok底层也用到ASM,间接生成字节码代码,提供序列化注解
@Target(ElementType.TYPE)
@Retention(RetentionPolicy.SOURCE)
public @interface Serialize {
}
而后能够间接把注解利用到bean中,间接帮忙咱们生成序列化代码,就像@Getter/@Setter一样;相当于间接调用和ASM形式的一种整合;相似如下代码:
@Serialize
public class Person {
private String id;
private String name;
//主动生成
public byte[] serialize(){
ByteBuffer bb = ByteBuffer.allocate(100);
bb.put(id.getBytes());
bb.put(name.getBytes());
return bb.array();
}
}
感激关注
能够关注微信公众号「回滚吧代码」,第一工夫浏览,文章继续更新;专一Java源码、架构、算法和面试。
发表回复