php的編譯和執行是分離開的,亦即:先執行完編譯,而後再執行。很多人會說:c++也是如此啊,確實。不過php的這種分離可以給我們提供很多便利,當然不可避免也有很有缺點。
先說一下整個過程:
①php會調用編譯函數zend_compile_file()來進行編譯。 這個函數的具體實現其實是包括兩個主要過程的:詞法分析(Lex實現),文法分析(Yacc實現)。當執行完這個函數之後:php指令碼的編譯就算結束了。 這個函數的輸入是:php指令檔,而輸出則是op_array.簡單一點說:編譯過程就是把指令碼給解析成一條條php虛擬機器可以處理的指令,而op_array就是這些指令做成的一個array而已(這很類似一些編譯型語言編譯產生的彙編代碼了,也是一條條的命令)。
②:之後php虛擬機器會調用zend_execute()這個函數來執行。該函數的輸入就是上邊編譯階段產生的op_array,在這裡他會解析每條命令並進行處理。 由於op命令一共有150左右,所以它需要處理這150中命令。這裡會產生一個很有意思的問題:它是如何處理這150種命令的呢?首先每條命令都是有對應的處理器來進行處理的。所以:虛擬機器會依據op_array中各條命令的類型來分發給響應的處理器來進行處理。
這裡有兩個小問題: 1:這裡的處理器是什嗎? 2:如何分發的?
要解答這兩個問題都是要從分發機制上來解釋:php虛擬機器分發命令的機制有三種:CALL, SWITCH, 和GOTO這三種類型.php預設是使用CALL方式, 也就是所有的opcode處理器都定義為函數, 然後供虛擬機器調用. 這種方式是傳統的方式, 也一般被認為是最穩定的方式.而SWITCH方式和GOTO方式則是通過switch和goto來分發opcode到對應的處理邏輯(段)執行的.
那現在來回答上邊兩個問題:
1:處理器其實是處理op命令的邏輯。其可以以函數的形式存在,也可能是以邏輯段的方式存在,這取決於命令的分發方式。
2:分發方式有call,switch和goto三種。哪種效率高呢?其實從上邊解釋已經可以初步瞭解了。switch和goto都是在zend_execute()這個函數中有對應的邏輯段,直接執行就可以了。而call是在zend_execute()這個函數中執行函數調用。明擺著:函數調用效率是最低的,調用一次就得壓棧啊!所以效率上:call是最低的。對於switch和goto:比如要執行第三種命令的處理:switch還要先挨個判斷是不是前兩種,而goto根本不需要判斷,直接跳到第三種命令的邏輯程式碼片段去執行,這比switch少了順序從上到下判斷的損耗,所以:goto效率又比switch要高。 所以這三種分發方式總體而言:goto > switch > call
題外話:由於php預設是call,如果你想進一步榨乾php的效能,可以更改下其命令分發方式為goto。不過用goto方式雖然提高了執行速度,但是編譯速度上其實最慢的喔。
--------------------------------------------------------------------------------------------------------------------------------------------------
再說一下php這種編譯和執行分離的弱點:
其實也不能算是弱點,雖然zend engine(php的虛擬機器)將編譯和執行嚴格分開,但是對於使用者而言:就跟沒分開一樣,因為我每次執行一個php指令碼請求都是要執行:編譯->執行 這兩個階段。任何一個階段都少不了。那麼這一點我們可以拿來和c++這種編譯型語言做一下對比: 同一個請求運行100遍
①對於c++,由於其前期只要編譯一遍,編譯好就不會再重複編譯了,只需要執行就ok,所以其損耗為:
1次編譯 + 100次執行
②對於php,其每次都要編譯+執行,所以其損耗為:
100次編譯 + 100次執行
顯然:解釋性語言從數量上來看:其消耗是比編譯型語言多的多。說白了就是:php這種編譯和執行相分離並不是真正的分離。而c++那種才算是真正的分離。
php也早就意識到這個問題了,於是就想了一個辦法來解決這個問題:這個解決方案就是eAccelerator。主要思路如下:
當指令碼第一次運行後,以某種方式儲存編譯後指令碼(裡邊存放的是op_array),在我們規定的緩衝有效時間內,當第二次運行該指令碼時就不在進行重複性的編譯工作,而是直接調用執行前面儲存的編譯後檔案,大大提高了程式效能。
這種方式一定程度上提高了php的效率,但不是最終極的方法,最終極的還是改成編譯型語言那種方式好了,吼吼~~~
---------------------------------------------------------------------------------------------------------------------------------------------------
最後說一下php編譯和執行分離的優點;
這個優點其實是針對程式員而言,對使用者而言沒什麼。因為這兩個階段的分離,我們可以在這裡做一些我們想做的事情。
比如想做檔案加解密,你想把一些php指令碼源碼檔案加密,讓使用者看不到源碼。同時呢這個加密後的源碼檔案又可以被php虛擬機器所解析和處理。當然:要實現這個前提是你先想好加解密演算法並保證這個是可逆的過程。
現在你對php源碼檔案已經加密了,此時你需要定義一下這種加密檔案的尾碼,假設為:*.buaa。 那問題就是:我們怎麼讓php虛擬機器可以處理這種尾碼的檔案呢?這就要用到上邊所說的編譯和執行相分離的過程了。
回想一下:編譯階段的輸入是php源檔案,輸出是op_array。 ok,我們就在這個階段做文章。主要思路為:首先在zend_compile_file()這個編譯函數中:看一下輸入檔案的尾碼:如果是正常的.php那就走正常邏輯,如果是*.buaa,那就先解密然後再走正常邏輯。。。
哈~就是這麼簡單。當然:這個過程沒有所說的這麼簡單,而且你也不可能直接修改zend_compile_file()函數,最後是自己擴充實現一個模組來處理這個過程。
本文參考了如下博文:
1:http://www.laruence.com/2008/08/14/250.html
2:http://yanbin.org/archive/zend-engines-fantasy.html
3:http://www.laruence.com/2008/06/18/221.html
4:http://www.laruence.com/2009/10/15/1131.html