本篇文章給大家分享的是關於PHP7新特性中抽象文法樹(AST)的一些介紹,內容很不錯,有需要的朋友可以參考一下,希望可以協助到大家。
本文分析了PHP7新特性之抽象文法樹(AST)帶來的變化。分享給大家供大家參考,具體如下:
這裡大部分內容參照 AST 的 RFC 文檔而成:https://wiki.php.net/rfc/abstractsyntaxtree,為了易於理解從來源文件中節選部分進行介紹。
本文並不會告訴你抽象文法樹是什麼,這需要你自己去瞭解,這裡只是描述 AST 給 PHP 帶來的一些變化。
新的執行過程
PHP7 的核心中有一個重要的變化是加入了 AST。在 PHP5中,從 php 指令碼到 opcodes 的執行的過程是:
Lexing:詞法掃描分析,將源檔案轉換成 token 流;
Parsing:文法分析,在此階段產生 op arrays。
PHP7 中在文法分析階段不再直接產生 op arrays,而是先產生 AST,所以過程多了一步:
Lexing:詞法掃描分析,將源檔案轉換成 token 流;
Parsing:文法分析,從 token 流產生抽象文法樹;
Compilation:從抽象文法樹產生 op arrays。
執行時間和記憶體消耗
從以上的步驟來看,這比之前的過程還多了一步,所以按常理來說這反而會增加程式的執行時間和記憶體的使用。但事實上記憶體的使用確實增加了,但是執行時間上卻有所降低。
以下結果是使用小(代碼大約 100 行)、中(大約 700 行)、大(大約 2800 行)三個指令碼分別進行測試得到的,測試指令碼: https://gist.github.com/nikic/289b0c7538b46c2220bc.
每個檔案編譯 100 次的執行時間(注意文章的測試結果時間是 14 年,PHP7 還叫 PHP-NG 的時候):
|
php-ng |
php-ast |
diff |
SMALL |
0.180s |
0.160s |
-12.5% |
MEDIUM |
1.492s |
1.268s |
-17.7% |
LARGE |
6.703s |
5.736s |
-16.9% |
單次編譯中的記憶體峰值:
|
php-ng |
php-ast |
diff |
SMALL |
378kB |
414kB |
+9.5% |
MEDIUM |
507kB |
643kB |
+26.8% |
LARGE |
1084kB |
1857kB |
+71.3% |
單次編譯的測試結果可能並不能代表實際使用的情況,以下是使用 PhpParser 進行完整項目測試得到的結果:
|
php-ng |
php-ast |
diff |
TIME |
25.5ms |
22.8ms |
-11.8% |
MEMORY |
2360kB |
2482kB |
+5.1% |
測試表明,使用 AST 之後程式的執行時間整體上大概有 10% 到 15% 的提升,但是記憶體消耗也有增加,在大檔案單次編譯中增加明顯,但是在整個項目執行過程中並不是很嚴重的問題。
還有注意的是以上的結果都是在沒有 Opcache 的情況下,生產環境中開啟 Opcache 的情況下,記憶體的消耗增加也不是很大的問題。
語義上的改變
如果僅僅是時間上的最佳化,似乎也不是使用 AST 的充足理由。其實實現 AST 並不是基於時間最佳化上的考慮,而是為瞭解決文法上的問題。下面來看一下語義上的一些變化。
yield 不需要括弧
在 PHP5 的實現中,如果在一個運算式上下文(例如在一個賦值運算式的右側)中使用 yield
,你必須在 yield
申明兩邊使用括弧:
<?php$result = yield fn(); // 不合法的$result = (yield fn()); // 合法的
這種行為僅僅是因為 PHP5 的實現方式的限制,在 PHP7 中,括弧不再是必須的了。所以下面這些寫法也都是合法的:
<?php$result = yield;$result = yield $v;$result = yield $k => $v;
當然了,還得遵循 yield
的應用情境才行。
括弧不影響行為
在 PHP5 中,($foo)['bar'] = 'baz'
和 $foo['bar'] = 'baz'
兩個語句的含義不一樣。事實上前一種寫法是不合法的,你會得到下面這樣的錯誤:
<?php($foo)['bar'] = 'baz';# PHP Parse error: Syntax error, unexpected '[' on line 1
但是在 PHP7 中,兩種寫法表示同樣的意思。
同樣,如果函數的參數被括弧包裹,類型檢查存在問題,在 PHP7 中這個問題也得到瞭解決:
<?phpfunction func() { return [];}function byRef(array &$a) {}byRef((func()));
以上代碼在 PHP5 中不會警示,除非使用 byRef(func())
的方式調用,但是在 PHP7 中,不管 func()
兩邊有沒有括弧都會產生以下錯誤:
PHP Strict standards: Only variables should be passed by reference ...
list() 的變化
list 關鍵字的行為改變了很多。list 給變數賦值的順序(等號左右同時的順序)以前是從右至左,現在是從左至右:
<?phplist($array[], $array[], $array[]) = [1, 2, 3];var_dump($array);// PHP5: $array = [3, 2, 1]// PHP7: $array = [1, 2, 3]# 注意這裡的左右的順序指的是等號左右同時的順序,# list($a, $b) = [1, 2] 這種使用中 $a == 1, $b == 2 是沒有疑問的。
產生上面變化的原因正是因為在 PHP5 的賦值過程中,3 會最先被填入數組,1 最後,但是現在順序改變了。
同樣的變化還有:
<?php$a = [1, 2];list($a, $b) = $a;// PHP5: $a = 1, $b = 2// PHP7: $a = 1, $b = null + "Undefined index 1"
這是因為在以前的賦值過程中 $b 先得到 2,然後 $a 的值才變成 1,但是現在 $a 先變成了 1,不再是數組,所以 $b 就成了 null。
list 現在只會訪問每個位移量一次:
<?phplist(list($a, $b)) = $array;// PHP5:$b = $array[0][1];$a = $array[0][0];// PHP7:// 會產生一個中間變數,得到 $array[0] 的值$_tmp = $array[0];$a = $_tmp[0];$b = $_tmp[1];
空的 list 成員現在是全部禁止的,以前只是在某些情況下:
<?phplist() = $a; // 不合法list($b, list()) = $a; // 不合法foreach ($a as list()) // 不合法 (PHP5 中也不合法)
引用賦值的順序
引用賦值的順序在 PHP5 中是從右至左的,現在時從左至右:
<?php$obj = new stdClass;$obj->a = &$obj->b;$obj->b = 1;var_dump($obj);// PHP5:object(stdClass)#1 (2) { ["b"] => &int(1) ["a"] => &int(1)}// PHP7:object(stdClass)#1 (2) { ["a"] => &int(1) ["b"] => &int(1)}
__clone 方法可以直接調用
現在可以直接使用 $obj->__clone()
的寫法去調用 __clone
方法。__clone
是之前唯一一個被禁止直接調用的魔術方法,之前你會得到一個這樣的錯誤:
Fatal error: Cannot call __clone() method on objects - use 'clone $obj' instead in ...
變數文法一致性
AST 也解決了一些文法一致性的問題,這些問題是在另外一個 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.
在新的實現上,以前的一些文法表達的含義和現在有些不同,具體的可以參照下面的表格:
Expression |
PHP5 |
PHP7 |
$$foo['bar']['baz'] |
${$foo['bar']['baz']} |
($$foo)['bar']['baz'] |
$foo->$bar['baz'] |
$foo->{$bar['baz']} |
($foo->$bar)['baz'] |
$foo->$bar['baz']() |
$foo->{$bar['baz']}() |
($foo->$bar)['baz']() |
Foo::$bar['baz']() |
Foo::{$bar['baz']}() |
(Foo::$bar)['baz']() |
整體上還是以前的順序是從右至左,現在從左至右,同時也遵循括弧不影響行為的原則。這些複雜的變數寫法是在實際開發中需要注意的。