乐趣区

PHP的垃圾回收机制-引用计数基本知识(5.3)

PHP 的垃圾回收机制
垃圾回收器,全称 Garbage Collection,简称 GC,5.3 版本之前 只是简单判断变量的 zval 的 refcount 是否为 0,是的话就释放,不是直至进程结束(隐藏着变量内存溢出的风险).
如果你已经安装了» Xdebug,你能通过调用函数 xdebug_debug_zval()显示 ”refcount” 和 ”is_ref” 的值。
引用计数基本知识

1、一个 zval 变量容器:

内容

类型

is_ref
是个 bool 值,用来标识这个变量是否是属于引用集合(reference set)
zval 变量容器中还有一个内部引用计数机制,来优化内存使用

refcount
指向这个 zval 变量容器的变量 (也称符号即 symbol) 个数
所有的符号存在一个符号表中,其中每个符号都有作用域 (scope),那些主脚本(比如:通过浏览器请求的的脚本) 和每个函数或者方法也都有作用域。

当一个变量被赋常量值时,就会生成一个 zval 变量容器
1、生成一个新的 zval 容器
<?php
$a = “new string”;
?>
参考上面的定义,分别是:
生成的变量容器,其中:

类型 string
值 new string
is_ref false
Refcount 1

2、增加一个 zval 的引用计数

把一个变量赋值给另一变量将增加引用次数(refcount).
<?php
$a = “new string”;
$b = $a;
?>

类型 string
值 new string
is_ref true
Refcount 2

引用次数是 2,因为同一个变量容器被变量 a 和变量 b 关联. 当没必要时,php 不会去复制已生成的变量容器。变量容器在”refcount“变成 0 时就被销毁. 当任何关联到某个变量容器的变量离开它的作用域 (比如:函数执行结束),或者对变量调用了函数 unset() 时,”refcount“就会减 1.
3、减少引用计数
<?php
$a = “new string”;
$c = $b = $a;
xdebug_debug_zval(‘a’);
unset($b, $c);
xdebug_debug_zval(‘a’);
?>

a: (refcount=3, is_ref=0)=’new string’
a: (refcount=1, is_ref=0)=’new string’
如果我们现在执行 unset($a);,包含类型和值的这个变量容器就会从内存中删除。
4、复合类型(Compound Types) ¶

当考虑像 array 和 object 这样的复合类型时,事情就稍微有点复杂. 与 标量 (scalar) 类型的值不同,array 和 object 类型的变量把它们的成员或属性存在自己的符号表中。这意味着下面的例子将生成三个 zval 变量容器。
<?php
$a = array(‘meaning’ => ‘life’, ‘number’ => 42);
xdebug_debug_zval(‘a’);
?>
输出
a: (refcount=1, is_ref=0)=array (
‘meaning’ => (refcount=1, is_ref=0)=’life’,
‘number’ => (refcount=1, is_ref=0)=42
)
看图说话

这三个 zval 变量容器是: a,meaning 和 number。增加和减少”refcount”的规则和上面提到的一样. 下面, 我们在数组中再添加一个元素, 并且把它的值设为数组中已存在元素的值:
添加一个已经存在的元素到数组中
<?php
$a = array(‘meaning’ => ‘life’, ‘number’ => 42);
$a[‘life’] = $a[‘meaning’];
xdebug_debug_zval(‘a’);
?>
输出
a: (refcount=1, is_ref=0)=array (
‘meaning’ => (refcount=2, is_ref=0)=’life’,
‘number’ => (refcount=1, is_ref=0)=42,
‘life’ => (refcount=2, is_ref=0)=’life’
)
有图有真相

从以上的 xdebug 输出信息,我们看到原有的数组元素和新添加的数组元素关联到同一个 ”refcount”2 的 zval 变量容器. 尽管 Xdebug 的输出显示两个值为 ’life’ 的 zval 变量容器,其实是同一个。函数 xdebug_debug_zval()不显示这个信息,但是你能通过显示内存指针信息来看到。
删除数组中的一个元素,就是类似于从作用域中删除一个变量. 删除后, 数组中的这个元素所在的容器的“refcount”值减少,同样,当“refcount”为 0 时,这个变量容器就从内存中被删除,下面又一个例子可以说明:
<?php
$a = array(‘meaning’ => ‘life’, ‘number’ => 42);
$a[‘life’] = $a[‘meaning’];
unset($a[‘meaning’], $a[‘number’] );
xdebug_debug_zval(‘a’);
?>
输出
a: (refcount=1, is_ref=0)=array (
‘life’ => (refcount=1, is_ref=0)=’life’
)
现在,当我们添加一个数组本身作为这个数组的元素时,事情就变得有趣,下个例子将说明这个。例中我们加入了引用操作符,否则 php 将生成一个复制。
把数组作为一个元素添加到自己
<?php
$a = array(‘one’);
$a[] =& $a;
xdebug_debug_zval(‘a’);
?>
输出
a: (refcount=2, is_ref=1)=array (
0 => (refcount=1, is_ref=0)=’one’,
1 => (refcount=2, is_ref=1)=…
)
看图说话

能看到数组变量 (a) 同时也是这个数组的第二个元素(1) 指向的变量容器中“refcount”为 2。上面的输出结果中的 ”…” 说明发生了递归操作, 显然在这种情况下意味着 ”…” 指向原始数组。
跟刚刚一样,对一个变量调用 unset,将删除这个符号,且它指向的变量容器中的引用次数也减 1。所以,如果我们在执行完上面的代码后,对变量 $a 调用 unset, 那么变量 $a 和数组元素 “1” 所指向的变量容器的引用次数减 1, 从 ”2″ 变成 ”1″. 下例可以说明:
<?php
$a = array(‘one’);
$a[] =& $a;
unset($a);
输出
(refcount=1, is_ref=1)=array (
0 => (refcount=1, is_ref=0)=’one’,
1 => (refcount=1, is_ref=1)=…
)
看图说话

2、清理变量容器的问题(Cleanup Problems) ¶

尽管不再有某个作用域中的任何符号指向这个结构(就是变量容器),由于数组元素“1”仍然指向数组本身,所以这个容器不能被清除。因为没有另外的符号指向它,用户没有办法清除这个结构,结果就会导致内存泄漏。庆幸的是,php 将在脚本执行结束时清除这个数据结构,但是在 php 清除之前,将耗费不少内存。如果你要实现分析算法,或者要做其他像一个子元素指向它的父元素这样的事情,这种情况就会经常发生。当然,同样的情况也会发生在对象上,实际上对象更有可能出现这种情况,因为对象总是隐式的被引用。
如果上面的情况发生仅仅一两次倒没什么,但是如果出现几千次,甚至几十万次的内存泄漏,这显然是个大问题。这样的问题往往发生在长时间运行的脚本中,比如请求基本上不会结束的守护进程 (deamons) 或者单元测试中的大的套件 (sets) 中。后者的例子:在给巨大的 eZ(一个知名的 PHP Library) 组件库的模板组件做单元测试时,就可能会出现问题。有时测试可能需要耗用 2GB 的内存,而测试服务器很可能没有这么大的内存。
PHP 手册

退出移动版