百度工程師講PHP函數的實現原理及效能分析(一)_PHP

來源:互聯網
上載者:User
關鍵字 百度 工程師 PHP函數 實現原理
前言

在任何語言中,函數都是最基本的組成單元。對於php的函數,它具有哪些特點?函數調用是怎麼實現的?php函數的效能如何,有什麼使用建議?本文將從原理出發進行分析結合實際的效能測試嘗試對這些問題進行回答,在瞭解實現的同時更好的編寫php程式。同時也會對一些常見的php函數進行介紹。

php函數的分類

在php中,橫向劃分的話,函數分為兩大類: user function(內建函數) 和internal function(內建函數)。前者就是使用者在程式中自訂的一些函數和方法,後者則是php本身提供的各類庫函數(比如sprintf、array_push等)。使用者也可以通過擴充的方法來編寫庫函數,這個將在後面介紹。對於user function,又可以細分為function(函數)和method(類方法),本文中將就這三種函數分別進行分析和測試。

php函數的實現

一個php函數最終是如何執行,這個流程是怎麼樣的呢?
要回答這個問題,我們先來看看php代碼的執行所經過的流程。

從圖1可以看到,php實現了一個典型的動態語言執行過程:拿到一段代碼後,經過詞法解析、文法解析等階段後,來源程式會被翻譯成一個個指令(opcodes),然後ZEND虛擬機器順次執行這些指令完成操作。Php本身是用c實現的,因此最終調用的也都是c的函數,實際上,我們可以把php看做是一個c開發的軟體。通過上面描述不難看出,php中函數的執行也是被翻譯成了opcodes來調用,每次函數調用實際上是執行了一條或多條指令。

對於每一個函數,zend都通過以下的資料結構來描述

代碼如下:


typedef union _zend_function {
zend_uchar type; /* MUST be the first element of this struct! */
struct {
zend_uchar type; /* never used */
char *function_name;
zend_class_entry *scope;
zend_uint fn_flags;
union _zend_function *prototype;
zend_uint num_args;
zend_uint required_num_args;
zend_arg_info *arg_info;
zend_bool pass_rest_by_reference;
unsigned char return_reference;
} common;

zend_op_array op_array;
zend_internal_function internal_function;
} zend_function;


typedef struct _zend_function_state {
HashTable *function_symbol_table;
zend_function *function;
void *reserved[ZEND_MAX_RESERVED_RESOURCES];
} zend_function_state;

其中type標明了函數的類型:使用者函數、內建函數、重載函數。Common中包含函數的基本資料,包括函數名,參數資訊,函數標誌(普通函數、靜態方法、抽象方法)等內容。另外,對於使用者函數,還有一個函數符號表,記錄了內部變數等,這個將在後面詳述。 Zend維護了一個全域function_table,這是一個大的hahs表。函數調用的時候會首先根據函數名從表中找到對應的zend_function。當進行函數調用時候,虛擬機器會根據type的不同決定調用方法, 不同類型的函數,其執行原理是不相同的 。

內建函數

內建函數,其本質上就是真正的c函數,每一個內建函數,php在最終編譯後都會展開成為一個名叫zif_xxxx的function,比如我們常見的sprintf,對應到底層就是zif_sprintf。Zend在執行的時候,如果發現是內建函數,則只是簡單的做一個轉寄操作。
Zend提供了一系列的api供調用,包括參數擷取、數組操作、記憶體配置等。內建函數的參數擷取,通過zend_parse_parameters方法來實現,對於數組、字串等參數,zend實現的是淺拷貝,因此這個效率是很高的。可以這樣說,對於php內建函數,其效率和相應c函數幾乎相同,唯一多了一次轉寄調用。

內建函數在php中都是通過so的方式進行動態載入,使用者也可以根據需要自己編寫相應的so,也就是我們常說的擴充。ZEND提供了一系列的api供擴充使用

使用者函數

和內建函數相比,使用者通過php實現的自訂函數具有完全不同的執行過程和實現原理。如前文所述,我們知道php代碼是被翻譯成為了一條條opcode來執行的,使用者函數也不例外,實際中每個函數對應到一組opcode,這組指令被儲存在zend_function中。於是,使用者函數的調用最終就是對應到一組opcodes的執行。

》》局部變數的儲存及遞迴的實現

我們知道,函數遞迴是通過堆棧來完成的。在php中,也是利用類似的方法來實現。Zend為每個php函數分配了一個活動符號表(active_sym_table),記錄當前函數中所有局部變數的狀態。所有的符號表通過堆棧的形式來維護,每當有函數調用的時候,分配一個新的符號表併入棧。當調用結束後當前符號表出棧。由此實現了狀態的儲存和遞迴。
對於棧的維護,zend在這裡做了最佳化。預先分配一個長度為N的靜態數組來類比堆棧,這種通過靜態數組來類比動態資料結構的手法在我們自己的程式中也經常有使用,這種方式避免了每次調用帶來的記憶體配置、銷毀。ZEND只是在函數調用結束時將當前棧頂的符號表資料clean掉即可。因為靜態數組長度為N,一旦函數調用層次超過N,程式不會出現棧溢出,這種情況下zend就會進行符號表的分配、銷毀,因此會導致效能下降很多。在zend裡面,N目前取值是32。因此,我們編寫php程式的時候,函數調用層次最好不要超過32。當然,如果是web應用,本身可以函數調用層次的深度。

》》參數的傳遞 和內建函數調用zend_parse_params來擷取參數不同,使用者函數中參數的擷取是通過指令來完成的。函數有幾個參數就對應幾條指令。具體到實現上就是普通的變數賦值。通過上面的分析可以看出,和內建函數相比,由於是自己維護堆棧表,而且每條指令的執行也是一個c函數,使用者函數的效能相對會差很多,後面會有具體的對比分析。因此,如果一個功能有對應php內建函數實現的盡量不要自己重新寫函數去實現。

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.