首頁  >  文章  >  後端開發  >  PHP7 的抽象語法樹(AST)帶來的變化

PHP7 的抽象語法樹(AST)帶來的變化

藏色散人
藏色散人轉載
2019-03-22 13:48:273734瀏覽

PHP7 的抽象語法樹(AST)帶來的變化

什麼是抽象語法樹?

抽象語法樹(abstract syntax tree,AST)是原始碼的抽象語法結構的樹狀表示,樹上的每個節點都表示原始碼中的一種結構,這所以說是抽象的,是因為抽象語法樹並不會表示出真實語法出現的每一個細節,比如說,嵌套括號被隱含在樹的結構中,並沒有以節點的形式呈現。抽象語法樹並不依賴源語言的語法,也就是說語法分析階段所採用的上下文無文法【文法是用來描述語言的語法結構的形式規則。任何一種語言都有它自己的文法,不管它是機器語言還是自然語言。 】,因為在寫文法時,經常會對文法進行等價的轉換(消除左遞歸,回溯,二義性等),這樣會給文法分析引入一些多餘的成分,對後續階段造成不利影響,甚至會使合個階段變得混亂。因些,許多編譯器常常要獨立建構語法分析樹,為前端,後端建立一個清晰的介面

PHP-Parser的專案首頁是https://github.com/nikic/PHP- Parser。可以對多版本的PHP進行完美解析,產生一顆抽象語法樹。

新的執行過程

PHP7 的核心中有一個重要的變化是加入了 AST。在PHP5中,從php 腳本到opcodes 的執行的過程是:

1.Lexing:詞法掃描分析,將原始檔轉換成token 流;

2.Parsing:語法分析,在此階段生成op arrays。

PHP7 中在語法分析階段不再直接產生op arrays,而是先生成AST,所以過程多了一步:

1.Lexing:詞法掃描分析,將原始檔轉換成token 流;

2.Parsing:語法分析,從token 流產生抽象語法樹;

3.Compilation:從抽象語法樹產生op arrays。

執行時間和記憶體消耗

從以上的步驟來看,這比之前的過程還多了一步,所以照常理來說這反而會增加程序的執行時間和記憶體的使用。但事實上記憶體的使用確實增加了,但是執行時間上卻有所降低。

以下結果是使用小(程式碼大約100 行)、中(大約700 行)、大(大約2800 行)三個腳本分別進行測試得到的,測試腳本: https://gist.github .com/nikic/289b0c7538b46c2220bc.

每個檔案編譯100 次的執行時間(注意文章的測試結果時間是14 年,PHP7 還叫PHP-NG 的時候):

PHP7 的抽象語法樹(AST)帶來的變化

#單次編譯中的記憶體峰值:

PHP7 的抽象語法樹(AST)帶來的變化

單次編譯的測試結果可能無法代表實際使用的情況,以下是使用 PhpParser進行完整項目測試所得到的結果:

PHP7 的抽象語法樹(AST)帶來的變化

測試表明,使用AST 之後程式的執行時間整體上大概有10% 到15% 的提升,但是記憶體消耗也有增加,在大檔案單次編譯中增加明顯,但是在整個專案執行過程中並不是很嚴重的問題。

還有註意的是以上的結果都是在沒有 Opcache 的情況下,生產環境中開啟 Opcache 的情況下,記憶體的消耗增加也不是很大的問題。

語意上的改變

如果只是時間上的最佳化,似乎也不是使用 AST 的充足理由。其實實現 AST 並不是基於時間優化上的考慮,而是為了解決語法上的問題。下面來看一下語意上的一些變化。

yield 不需要括號

在PHP5 的實作中,如果在一個表達式上下文(例如在一個賦值表達式的右側)中使用yield,你必須在yield 申明兩邊使用括號:

<?php
$result = yield fn();   // 不合法的
$result = (yield fn()); // 合法的

這種行為僅僅是因為PHP5 的實現方式的限制,在PHP7 中,括號不再是必須的了。所以下面這些寫法也都是合法的:

<?php
$result = yield;
$result = yield $v;
$result = yield $k => $v;

當然了,還要遵循 yield 的應用場景才行。

括號不會影響行為

在 PHP5 中,

<?php
($foo)[&#39;bar&#39;] = &#39;baz&#39;;
# PHP Parse error: Syntax error, unexpected &#39;[&#39; on line 1

但是在 PHP7 中,兩個寫法表示同樣的意思。

同樣,如果函數的參數被括號包裹,類型檢查存在問題,在PHP7 中這個問題也得到了解決:

<?php
function func() {
    return [];
}

function byRef(array &$a) {
}

byRef((func()));

以上代碼在PHP5 中不會告警,除非使用byRef (func()) 的方式調用,但是在PHP7 中,不管func() 兩邊有沒有括號都會產生以下錯誤:

PHP Strict standards:  Only variables should be passed by reference ...

list() 的變化

#

list 关键字的行为改变了很多。list 给变量赋值的顺序(等号左右同时的顺序)以前是从右至左,现在是从左到右:

<?php
list($array[], $array[], $array[]) = [1, 2, 3];
var_dump($array);
// PHP5: $array = [3, 2, 1]
// PHP7: $array = [1, 2, 3]
# 注意这里的左右的顺序指的是等号左右同时的顺序,
# list($a, $b) = [1, 2] 这种使用中 $a == 1, $b == 2 是没有疑问的。

产生上面变化的原因正是因为在 PHP5 的赋值过程中,3 会最先被填入数组,1 最后,但是现在顺序改变了。

同样的变化还有:

<?php
$a = [1, 2];
list($a, $b) = $a;
// PHP5: $a = 1, $b = 2
// PHP7: $a = 1, $b = null + "Undefined index 1"

这是因为在以前的赋值过程中 $b 先得到 2,然后 $a 的值才变成1,但是现在 $a 先变成了 1,不再是数组,所以 $b 就成了null。

list 现在只会访问每个偏移量一次

<?php
list(list($a, $b)) = $array;
// PHP5:
$b = $array[0][1];
$a = $array[0][0];
// PHP7:
// 会产生一个中间变量,得到 $array[0] 的值
$_tmp = $array[0];
$a = $_tmp[0];
$b = $_tmp[1];

空的 list 成员现在是全部禁止的,以前只是在某些情况下:

<?php
list() = $a;           // 不合法
list($b, list()) = $a; // 不合法
foreach ($a as list()) // 不合法 (PHP5 中也不合法)

引用赋值的顺序

引用赋值的顺序在 PHP5 中是从右到左的,现在时从左到右:

<?php
$obj = new stdClass;
$obj->a = &$obj->b;
$obj->b = 1;
var_dump($obj);
// PHP5:
object(stdClass)#1 (2) {
 ["b"] => &int(1)
  ["a"] => &int(1)
}
// PHP7:
object(stdClass)#1 (2) {
 ["a"] => &int(1)
  ["b"] => &int(1)
}

__clone 方法可以直接调用

现在可以直接使用 $obj->__clone() 的写法去调用 __clone 方法。 __clone 是之前唯一一个被禁止直接调用的魔术方法,之前你会得到一个这样的错误:

Fatal error:Cannot call __clone() method on objects -use &#39;clone $obj&#39; instead in...

变量语法一致性

AST 也解决了一些语法一致性的问题,这些问题是在另外一个 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.

在新的实现上,以前的一些语法表达的含义和现在有些不同,具体的可以参照下面的表格:

PHP7 的抽象語法樹(AST)帶來的變化

整体上还是以前的顺序是从右到左,现在从左到右,同时也遵循括号不影响行为的原则。这些复杂的变量写法是在实际开发中需要注意的。

相关推荐:《PHP教程

以上是PHP7 的抽象語法樹(AST)帶來的變化的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:uckendo。如有侵權,請聯絡admin@php.cn刪除