对于 PHP 中的对象序列化这件事儿,之前咱们在很早前的 []() 文章中曾经提到过 __sleep() 和 __weakup() 这两个魔术办法。明天咱们介绍的则是另外一个能够管制序列化内容的形式,那就是应用 Serializable 接口。它的应用和上述两个魔术办法很相似,但又稍有不同。
Serializable 接口
class A implements Serializable {
private $data;
public function __construct(){
echo '__construct', PHP_EOL;
$this->data = "This is Class A";
}
public function serialize(){
echo 'serialize', PHP_EOL;
return serialize($this->data);
}
public function unserialize($data){
echo 'unserialize', PHP_EOL;
$this->data = unserialize($data);
}
public function __destruct(){echo '__destruct', PHP_EOL;}
public function __weakup(){echo '__weakup', PHP_EOL;}
public function __sleep(){echo '__destruct', PHP_EOL;}
}
$a = new A();
$aSerialize = serialize($a);
var_dump($aSerialize);
// "C:1:"A":23:{s:15:"This is Class A";}"
$a1 = unserialize($aSerialize);
var_dump($a1);
这段代码就是应用 Serializable 接口来进行序列化解决的,留神一点哦,实现了 Serializable 接口的类中的 __sleep() 和 __weakup() 魔术办法就有效了哦,序列化的时候不会进入它们。
Serializable 这个接口须要实现的是两个办法,serialize() 办法和 unserialize() 办法,是不是和那两个魔术办法齐全一样。当然,应用的形式也是一样的。
在这里,咱们多遍及一点序列化的常识。对象序列化只能序列化它们的属性,不能序列化他们办法。如果以后可能找到对应的类模板,那么能够还原出这个类的办法来,如果没有定义过这个类的模板,那么还原进去的类是没有办法只有属性的。咱们通过这段代码中的序列化字符串来剖析:
- “C:”,指的是以后数据的类型,这个我面前面还会讲,实现 Serializable 接口的对象序列化的后果是 C:,而没有实现这个接口的对象序列化的后果是 O:
- “A:”,很显著对应的是类名,也就是类的::class
- “{xxx}”,对象构造和 JSON 一样,也是用的花括号
各种类型的数据进行序列化的后果
上面咱们再来看下不同类型序列化的后果。要晓得,在 PHP 中,咱们除了句柄类型的数据外,其余标量类型或者是数组、对象都是能够序列化的,它们在序列化字符串中是如何示意的呢?
$int = 110;
$string = '110';
$bool = FALSE;
$null = NULL;
$array = [1,2,3];
var_dump(serialize($int)); // "i:110;"
var_dump(serialize($string)); // "s:3:"110";"
var_dump(serialize($bool)); // "b:0;"
var_dump(serialize($null)); // "N;"
var_dump(serialize($array)); // "a:3:{i:0;i:1;i:1;i:2;i:2;i:3;}"
下面的内容还是比拟好了解的吧。不过咱们还是一一阐明一下:
- 数字类型:i:< 值 >
- 字符串类型:s:< 长度 >:< 值 >
- 布尔类型:b:< 值:0 或 1 >
- NULL 类型:N;
- 数组:a:< 长度 >:< 内容 >
对象在应用 Serializable 接口序列化时要留神的中央
接下来,咱们重点讲讲对象类型,下面曾经提到过,实现 Serializable 接口的对象序列化后的标识是有非凡状况的。上方序列化后的字符串结尾类型标识为 “C:”,那么咱们看看不实现 Serializable 接口的对象序列化后是什么状况。
// 失常对象类型序列化的后果
class B {private $data = "This is Class B";}
$b = new B();
$bSerialize = serialize($b);
var_dump ($bSerialize); // "O:1:"B":1:{s:7:"Bdata";s:15:"This is Class B";}"
var_dump($bSerialize);
var_dump(unserialize("O:1:\"B\":1:{s:7:\"\0B\0data\";s:15:\"This is Class B\";}"));
// object(B)#4 (1) {// ["data":"B":private]=>string(15) "This is Class B"
// }
果然,它结尾的类型标识是 “O:”。那么咱们能够看出,”C:” 很大的概率指的是以后序列化的内容是一个类类型,不是一个对象类型。它们之间其实并没有显著的差别,包含官网文档上也没有找到特地具体的阐明。如果有过这方面的钻研或者有相干材料的同学能够评论留言一起探讨哈。
此外,如果咱们手动将一个对象的 “O:” 转成 “C:” 会怎么样呢?
// 把 O: 替换成 C:
var_dump(unserialize(str_replace('O:', 'C:', $bSerialize))); // false
道歉,无奈还原了。那么咱们反过来,将下面 A 类也就是实现了 Serializable 接口的序列化字符串中的 “C:” 转成 “O:” 呢?
// Warning: Erroneous data format for unserializing 'A'
var_dump(unserialize(str_replace('C:', 'O:', $aSerialize))); // false
嗯,会提醒一个正告,而后同样也无奈还原了。这样看来,咱们的反序列化还是十分智能的,有一点点的不同都无奈进行还原操作。
未定义类的反序列化操作
最初,咱们来看看未定义类的状况下,间接反序列化一个对象。
// 模仿一个未定义的 D 类
var_dump(unserialize("O:1:\"D\":2:{s:7:\"\0D\0data\";s:15:\"This is Class D\";s:3:\"int\";i:220;}"));
// object(__PHP_Incomplete_Class)#4 (3) {// ["__PHP_Incomplete_Class_Name"]=>string(1) "D"
// ["data":"D":private]=>string(15) "This is Class D"
// ["int"]=>int(220)
// }
// 把未定义类的 O: 替换成 C:
var_dump(unserialize(str_replace('O:', 'C:', "O:1:\"D\":2:{s:7:\"\0D\0data\";s:15:\"This is Class D\";s:3:\"int\";i:220;}"))); // false
从代码中,咱们能够看出,”C:” 类型的字符串仍然无奈反序列化胜利。划重点哦,如果是 C: 结尾的序列化字符串,肯定须要是定义过的且实现了 Serializable 接口的类 能力反序列化胜利。
另外,咱们能够发现,当序列化字符串中的模板不存在时,反序列化进去的类的类名是 __PHP_Incomplete_Class_Name 类,不像有类模板的反序列化胜利间接就是失常的类名。
总结
其实从以上各种来看,个人感觉如果要保留数据或者传递数据的话,序列化并不是最好的抉择。毕竟蕴含了类型以及长度后将使得格局更为严格,而且反序列化回来的内容如果没有对应的类模板定义也并不是特地好用的,还不如间接应用 JSON 来得不便易读。当然,具体情况具体分析,咱们还是要联合场景来抉择适合的应用形式。
测试代码:
https://github.com/zhangyue0503/dev-blog/blob/master/php/202003/source/%E4%BD%BF%E7%94%A8Serializable%E6%8E%A5%E5%8F%A3%E6%9D%A5%E8%87%AA%E5%AE%9A%E4%B9%89PHP%E4%B8%AD%E7%B1%BB%E7%9A%84%E5%BA%8F%E5%88%97%E5%8C%96.php
参考文档:
https://www.php.net/manual/zh/class.serializable.php
===========
各自媒体平台均可搜寻【硬核项目经理】