或許你知道,或許你不知道,PHP是一個弱類型,動態指令碼語言。所謂弱類型,就是說PHP並不嚴格驗證變數類型(嚴格來講,PHP是一個中強型別語言,這部分內容會在以後的文章中敘述),在申明一個變數的時候,並不需要顯示指明它儲存的資料的類型:
- <?php
- $var = 1; //int
- $var = "laruence"; //string
- $var = 1.0002; //float
- $var = array(); // array
- $var = new Exception('error'); //object;
動態語言,就是說,PHP的語言結構在運行期是可以改變的,比如我們在運行期require一個函數定義檔案,從而導致語言的函數表動態改變。
所謂指令碼語言,就是說,PHP並不是獨立啟動並執行,要運行PHP我們需要PHP解析器:
- /usr/bin/php -f example.ph
我前面的文章中已經講過,PHP的執行是通過Zend engine(ZE, Zend引擎), ZE是用C編寫的,大家都知道C是一個強型別語言,也就是說,在C中所有的變數在它被聲明到最終銷毀,都只能儲存一種類型的資料。 那麼PHP是如何在ZE的基礎上實現弱類型的呢?
在PHP中,所有的變數都是用一個結構-zval來儲存的, 在Zend/zend.h中我們可以看到zval的定義:
- typedef struct _zval_struct {
- zvalue_value value;
- zend_uint refcount;
- zend_uchar type;
- zend_uchar is_ref;
- } zval;
-
其中zvalue_value是真正儲存資料的關鍵區段,現在到了揭曉謎底的時候了,PHP是如何在ZE的基礎上實現弱類型的呢? 因為zvalue_value是個聯合體(union),
- typedef union _zvalue_value {
- long lval;
- double dval;
- struct {
- char *val;
- int len;
- } str;
- HashTable *ht;
- zend_object_value obj;
- } zvalue_value
- ;
那麼這個結構是如何儲存PHP中的多種類型的呢?
PHP中常見的變數類型有:
- 1. 整型/浮點/長整型/bool值 等等
- 2. 字串
- 3. 數組/關聯陣列
- 4. 對象
- 5. 資源
-
PHP根據zval中的type欄位來儲存一個變數的真正類型,然後根據type來選擇如何擷取zvalue_value的值,比如對於整型和bool值:
- zval.type = IS_LONG;//整形
- zval.type = IS_BOOL;//布爾
就去取zval.value.lval,對於bool值來說lval∈(0|1);
如果是雙精確度,或者float則會去取zval.value的dval。
而如果是字串,那麼:
- zval.type = IS_STRIN
這個時候,就會取:
zval.value.str
而這個也是個結構,存有C分格的字串和字串的長度。
而對於數組和對象,則type分別對應IS_ARRAY, IS_OBJECT, 相對應的則分別取zval.value.ht和obj
比較特別的是資源,在PHP中,資源是個很特別的變數,任何不屬於PHP內建的變數類型的變數,都會被看作成資源來進行儲存,比如,資料庫控制代碼,開啟的檔案控制代碼等等。 對於資源:
- type = IS_RESOURC
這個時候,會去取zval.value.lval, 此時的lval是個整型的指標, 然後PHP會再根據這個指標在PHP內建的一個資源清單中查詢相對應的資源(這部分的內容,我以後會單獨開一個篇文章來介紹),目前,你只要知道此時的lval就好像是對應於資源鏈表的位移值。
- ZEND_FETCH_RESOURCE(con, type, zval *, default, resource_name, resource_type
);
借用這樣的機制,PHP就實現了弱類型,因為對於ZE的來說,它所面對的永遠都是同一種類型,那就是zval。
ps:明天team出去building,我想著應該在走之前寫點東西給我的blog reader來消磨周末。今天就簡單先開個頭,下一次,我將進一步介紹PHP的變數,範圍,以及變數的copy on write和change on write機制, 待續….