PHP中的写时复制(Copy On Write)

转:http://blog.csdn.net/yeoman92/article/details/52793371

问题引入

  首先来看看PHP中的赋值与引用问题

<?php
$a = 10;//将常量值赋给变量,会为a分配内存空间 
$b = $a;//变量赋值给变量,是不是copy了一份副本,b也分配了内存空间呢? 
$c = &$a;//引用是不会为c分配空间的,c和a是共用一份空间的。
?>
  • 1
  • 2
  • 3
  • 4
  • 5

  对于中间的那个问题,你的答案是什么呢?在今天之前,我的答案是会为b分配内存空间。因为我是这么理解的: 
  &赋值的时候,视为一个变量定义了一个别名,增加了一个对内存空间的引用。改变其中一个,会影响其他的引用。而使用unset()时,只是断开了对变量内存空间的引用,内存空间不会释放。 
  而 = 赋值则不同,它会重新开辟一份内存空间存储原变量的副本。两者之间的修改不会相互影响。

  而下面的程序则印证了这一点:

<?php
$a = 10;   //将常量值赋给变量,会为a分配内存空间 
$b = $a; //变量赋值给变量,是不是copy了一份副本,b也分配了内存空间呢? 
$c = &$a; //引用是不会为c分配空间的,c和a是共用一份空间的。 
$a = 5;
echo $c;   //输出5,因为a和c 是指向同一个内存空间
echo PHP_EOL;
echo $b;   //由于b是副本,对a的操作不会影响b,输出10
?>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

  那如果

$b = $a;//之后a  和  b 都不做任何改变,保持一致
  • 1

  有这么一个问题,如果 = 赋值之后,两个变量都不曾改变,如果是两份副本,岂不是太浪费内存? 
  PHP中实际上避免了这种情况。 
  PHP中将一个变量赋值给新变量时,不会立即为新变量分配内存空间,只是增加了对内存空间的引用。当原变量或者新变量作出任何改变时,才会为新变量 分配一块内存空间。

<?php
$a = 1;
$b = $a; 
echo $a;
//在此之前,b都是和a共用内存空间的。 
$a = 2;//a作出了改变,此时b才会有自己的空间
?>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

  每个php变量存在一个叫”zval”的变量容器中。一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。第一个是”is_ref”,是个bool值,用来标识这个变量是否是属于引用集合(referenceset)。通过这个字节,php引擎才能把普通变量和引用变量区分开来,由于php允许用户通过使用&来使用自定义引用,zval变量容器中还有一个内部引用计数机制,来优化内存使用。第二个额外字节是”refcount”,用以表示指向这个zval变量容器的变量(也称符号即symbol)个数。当”refcount”的值是1时,”is_ref”的值总是FALSE.

  安装xdebug之后,利用xdebug_debug_zval(),可以看到zval结构: 
  如下:

<?php
$a = 1;
$b = $a;

echo $a;
//在此之前,b都是和a共用内存空间的。
xdebug_debug_zval('b');
$a = 2;//a作出了改变,此时b才会有自己的空间
xdebug_debug_zval('b');
?>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

 输出:

b: 
(refcount=2, is_ref=0), 
int 
1

b: 
(refcount=1, is_ref=0), 
int 
1

  由上面的结果可以看到,在a作出改变之前,引用计数是2 ,当a作出改变之后,b的引用计数变为1,是因为b重新分配了空间。 
  上面说描述的现象就是写时复制。

写时复制

  写时复制Copy-on-Write,也缩写为COW),顾名思义,就是在写入时才真正复制一份内存进行修改。 COW最早应用在*nix系统中对线程与内存使用的优化,后面广泛的被使用在各种编程语言中,如C++的STL等。 在PHP内核中,COW也是主要的内存优化手段。 在前面关于变量和内存的讨论中,引用计数对变量的销毁与回收中起着至关重要的标识作用。 引用计数存在的意义,就是为了使得COW可以正常运作,从而实现对内存的优化使用。 
   写时复制优点:是通过赋值的方式赋值给变量时不会申请新内存来存放新变量所保存的值,而是简单的通过一个计数器来共用内存,只有在其中的一个引用指向变量的值发生变化时才申请新空间来保存值内容以减少对内存的占用。

  从PHP底层基础数据结构来看

ref_count和is_ref是定义于zval结构体中; 
is_ref标识是不是用户使用 & 的强制引用; 
ref_count是引用计数,用于标识此zval被多少个变量引用,即写时复制的自动引用,为0时会被销毁。

*文章为作者原创或网络转载
转载此文请于文首标明作者姓名,保持文章完整性,并请附上出处
未按照规范转载者,陈帅同学保留追究相应责任的权利
编程改变世界

干了这碗鸡汤