PHP安装与使用VLD查看opcode代码

需要分析PHP代码的性能,或者说实现同样功能的代码到底哪个更好呢?或者说想知道底层的实现可以使用VLD查看opcode

下载与安装VLD

# wget http://pecl.php.net/get/vld-0.11.2.tgz
# tar zxvf vld-0.11.2.tgz
# cd ./vld-0.11.2
# /usr/local/php/bin/phpize              或者直接phpize
# ./configure --with-php-config=/usr/local/php/bin/php-config --enable-vld
# make && make install

---------------------------------

编辑php.ini文件激活vld扩展:

php.ini位置

#cd /usr/local/php/lib

增加
extension=vld.so

 

重启Apache:
# /usr/local/apache2/bin/apachectl restart
--------------------------------- 

查看phpinfo()信息

 

--------------------------------

至此,VLD就安装完了。写个简单的test.php

  1. $a='123';
  2. echo $a;


 

 

# php -dvld.active=1 ./test.php

如果没有设置php环境变量的话

#/usr/local/php/bin/php  -dvld.active=1  test.php

查看结果

 

如上为VLD输出的PHP代码生成的中间代码的信息,说明如下:

  • Branch analysis from position 这条信息多在分析数组时使用。
  • Return found 是否返回,这个基本上有都有。
  • filename 分析的文件名
  • function name 函数名,针对每个函数VLD都会生成一段如上的独立的信息,这里显示当前函数的名称
  • number of ops 生成的操作数
  • compiled vars 编译期间的变量,这些变量是在PHP5后添加的,它是一个缓存优化。这样的变量在PHP源码中以IS_CV标记。
  • op list 生成的中间代码的变量列表

使用-dvld.active参数输出的是VLD默认设置,如果想看更加详细的内容。可以使用-dvld.verbosity参数。

 

#php -dvld.active=1 -dvld.verbosity=3 text.php

-dvld.verbosity=3是VLD在当前版本可以显示的最详细的信息.

如果我们只是想要看输出的中间代码,并不想执行这段PHP代码,可以使用-dvld.execute=0来禁用代码的执行

#php -dvld.active=1 -dvld.execute=0 text.php

 

VLD扩展的参数列表:

  • -dvld.active 是否在执行PHP时激活VLD挂钩,默认为0,表示禁用。可以使用-dvld.active=1启用。
  • -dvld.skip_prepend 是否跳过php.ini配置文件中auto_prepend_file指定的文件, 默认为0,即不跳过包含的文件,显示这些包含的文件中的代码所生成的中间代码。此参数生效有一个前提条件:-dvld.execute=0
  • -dvld.skip_append 是否跳过php.ini配置文件中auto_append_file指定的文件, 默认为0,即不跳过包含的文件,显示这些包含的文件中的代码所生成的中间代码。此参数生效有一个前提条件:-dvld.execute=0
  • -dvld.execute 是否执行这段PHP脚本,默认值为1,表示执行。可以使用-dvld.execute=0,表示只显示中间代码,不执行生成的中间代码。
  • -dvld.format 是否以自定义的格式显示,默认为0,表示否。可以使用-dvld.format=1,表示以自己定义的格式显示。这里自定义的格式输出是以-dvld.col_sep指定的参数间隔
  • -dvld.col_sep 在-dvld.format参数启用时此函数才会有效,默认为 “\t”。
  • -dvld.verbosity 是否显示更详细的信息,默认为1,其值可以为0,1,2,3 其实比0小的也可以,只是效果和0一样,比如0.1之类,但是负数除外,负数和效果和3的效果一样 比3大的值也是可以的,只是效果和3一样。
  • -dvld.save_dir 指定文件输出的路径,默认路径为/tmp。
  • -dvld.save_paths 控制是否输出文件,默认为0,表示不输出文件
  • -dvld.dump_paths 控制输出的内容,现在只有0和1两种情况,默认为1,输出内容

 

使用VLD比较代码差异

代码text1.php

  1. $var = 111;
  2. $str = "AAA " . $var . " BBB";


代码text2.php

  1. $var = 111;
  2. $str = "AAA $var BBB";


从结果很清晰的看出第一段代码比第二段代码多了concat

第一个连接操作,将“test string begin ”和$var连接起来,得到“AAA 111”,然后再执行第二个连接操作,将上一个操作得到的结果“AAA 111”和” BBB”连接起来,并将结果存储在另一个临时变量,最后将第二个连接操作的结果赋值给$str。

连接操作对应的opcode为ZEND_CONCAT,对于所给的两个操作数,其最终通过concat_function函数将两个字符串连接起来,如果所给的变量的类型不是字符串,则会通过zend_make_printable_zval将其转换成字符串。concat_function函数会根据两个字符串的长度重新分配内存,并执行两次拷贝操作,将两个字符串拷贝到新的内存空间。这里针对两个字符串相同的情况有一个特殊处理。

  1. if (result==op1) { /* special case, perform operations on result */
  2. uint res_len = Z_STRLEN_P(op1) + Z_STRLEN_P(op2);
  3. Z_STRVAL_P(result) = erealloc(Z_STRVAL_P(result), res_len+1);
  4. memcpy(Z_STRVAL_P(result)+Z_STRLEN_P(result), Z_STRVAL_P(op2), Z_STRLEN_P(op2));
  5. Z_STRVAL_P(result)[res_len]=0;
  6. Z_STRLEN_P(result) = res_len;
  7. } else {
  8. Z_STRLEN_P(result) = Z_STRLEN_P(op1) + Z_STRLEN_P(op2);
  9. Z_STRVAL_P(result) = (char *) emalloc(Z_STRLEN_P(result) + 1);
  10. memcpy(Z_STRVAL_P(result), Z_STRVAL_P(op1), Z_STRLEN_P(op1));
  11. memcpy(Z_STRVAL_P(result)+Z_STRLEN_P(op1), Z_STRVAL_P(op2), Z_STRLEN_P(op2));
  12. Z_STRVAL_P(result)[Z_STRLEN_P(result)] = 0;
  13. Z_TYPE_P(result) = IS_STRING;
  14. }


而直接在字符串中插入变量,其所有的操作都是添加操作,将字符串添加到返回值,将变量添加到返回值,
所有的结果返回都是在一个临时变量中,如我们的示例,首先会将”AAA “添加到临时变量,然后将临时变量和$var变量添加到临时变量,之后将临时变量和” BBB”添加到临时变量,最后将此此时变量赋值给$str。这里添加将字符串添加到临时变量,其对应的opcode为ZEND_ADD_STRING,将变量添加到临时变量,其对应的opcode为ZEND_ADD_VAR,虽然这两个操作的opcode不同,但其最终调用都是add_string_to_string,他们所不同的调用此函数的第三个参数,一个是操作码存储的ZVAL变量,一个是通过变更列表获取的ZVAL变量。

如果觉得需要看C语音级别的php源码,可以参考:使用strace查看C语言级别的php源码


tags: PHP,php源码分析