PHP5.3的記憶體回收機制(動態儲存裝置分配方案)深入理解_PHP教程

來源:互聯網
上載者:User
記憶體回收機制是一種動態儲存裝置分配方案。它會自動釋放程式不再需要的已指派的記憶體塊。 自動回收記憶體的過程叫垃圾收集。記憶體回收機制可以讓程式員不必過分關心程式記憶體配置,從而將更多的精力投入到商務邏輯。 在現在的流行各種語言當中,記憶體回收機制是新一代語言所共有的特徵,如Python、PHP、Eiffel、C#、Ruby等都使用了記憶體回收機制。 雖然記憶體回收是現在比較流行的做法,但是它的年紀已經不小了。早在20世紀60年代MIT開發的Lisp系統中就已經有了它的身影, 但是由於當時技術條件不成熟,從而使得記憶體回收機製成了一個看起來很美的技術,直到20世紀90年代Java的出現,記憶體回收機制才被廣泛應用。

PHP也在語言層實現了記憶體的動態管理,這在前面的章節中已經有了詳細的說明, 記憶體的動態管理將開發人員從繁瑣的記憶體管理中解救出來。與此配套,PHP也提供了語言層的記憶體回收機制, 讓程式員不必過分關心程式記憶體配置。

在PHP5.3版本之前,PHP只有簡單的基於引用計數的記憶體回收,當一個變數的引用計數變為0時, PHP將在記憶體中銷毀這個變數,只是這裡的垃圾並不能稱之為垃圾。 並且PHP在一個生命週期結束後就會釋放此進程/線程所點的內容,這種方式決定了PHP在前期不需要過多考慮記憶體的泄露問題。 但是隨著PHP的發展,PHP開發人員的增加以及其所承載的業務範圍的擴大,在PHP5.3中引入了更加完善的記憶體回收機制。 新的記憶體回收機制解決了無法處理迴圈的引用記憶體流失問題。PHP5.3中的記憶體回收機制使用了文章引用計數系統中的同步周期回收(Concurrent Cycle Collection in Reference Counted Systems) 中的同步演算法。關於這個演算法的介紹我們就不再贅述,在PHP的官方文檔有圖文並茂的介紹:回收周期(Collecting Cycles)。
如前面所說,在PHP中,主要的記憶體管理手段是引用計數,引入垃圾收集機制的目的是為了打破引用計數中的循環參考,從而防止因為這個而產生的記憶體泄露。 垃圾收集機制基於PHP的動態記憶體管理而存在。PHP5.3為引入垃圾收集機制,在變數儲存的基本結構上有一些變動,如下所示:
複製代碼 代碼如下:
struct _zval_struct {
/* Variable information */
zvalue_value value; /* value */
zend_uint refcount__gc;
zend_uchar type; /* active type */
zend_uchar is_ref__gc;
};

與PHP5.3之前的版本相比,引用計數欄位refcount和是否引用欄位is_ref都在其後面添加了__gc以用於新的的記憶體回收機制。 在PHP的源碼風格中,大量的宏是一個非常鮮明的特點。這些宏相當於一個介面層,它屏蔽了介面層以下的一些底層實現,如, ALLOC_ZVAL宏,這個宏在PHP5.3之前是直接調用PHP的記憶體管理分配函數emalloc分配記憶體,所分配的記憶體大小由變數的類型等大小決定。 在引入記憶體回收機制後,ALLOC_ZVAL宏直接採用新的記憶體回收單元結構,所分配的大小都是一樣的,全部是zval_gc_info結構體所佔記憶體大小, 並且在分配記憶體後,初始化這個結構體的記憶體回收機制。如下代碼:
複製代碼 代碼如下:
/* The following macroses override macroses from zend_alloc.h */
#undef ALLOC_ZVAL
#define ALLOC_ZVAL(z) \
do { \
(z) = (zval*)emalloc(sizeof(zval_gc_info)); \
GC_ZVAL_INIT(z); \
} while (0)

zend_gc.h檔案在zend.h的749行被引用:#include “zend_gc.h” 從而替換覆蓋了在237行引用的zend_alloc.h檔案中的ALLOC_ZVAL等宏 在新的的宏中,關鍵性的改變是對所分配記憶體大小和分配內容的改變,在以前純粹的記憶體配置中添加了垃圾收集機制的內容, 所有的內容都包括在zval_gc_info結構體中:
複製代碼 代碼如下:
typedef struct _zval_gc_info {
zval z;
union {
gc_root_buffer *buffered;
struct _zval_gc_info *next;
} u;
} zval_gc_info;

對於任何一個ZVAL容器儲存的變數,分配了一個zval結構,這個結構確保其和以zval變數分配的記憶體的開始對齊, 從而在zval_gc_info類型指標的強制轉換時,其可以作為zval使用。在zval欄位後面有一個聯合體:u。 u包括gc_root_buffer結構的buffered欄位和zval_gc_info結構的next欄位。 這兩個欄位一個是表示垃圾收集機制緩衝的根結點,一個是zval_gc_info列表的下一個結點, 垃圾收集機制緩衝的結點無論是作為根結點,還是列表結點,都可以在這裡體現。 ALLOC_ZVAL在分配了記憶體後會調用GC_ZVAL_INIT用來初始化替代了zval的zval_gc_info, 它會把zval_gc_info中的成員u的buffered欄位設定成NULL,此欄位僅在將其放入記憶體回收緩衝區時才會有值,否則會一直是NULL。 由於PHP中所有的變數都是以zval變數的形式存在,這裡以zval_gc_info替換zval,從而成功實現垃圾收集機制在原有系統中的整合。
PHP的記憶體回收機制在PHP5.3中預設為開啟,但是我們可以通過設定檔直接設定為禁用,其對應的配置欄位為:zend.enable_gc。 在php.ini檔案中預設是沒有這個欄位的,如果我們需要禁用此功能,則在php.ini中添加zend.enable_gc=0或zend.enable_gc=off。 除了修改php.ini配置zend.enable_gc,也可以通過調用gc_enable()/gc_disable()函數來開啟/關閉記憶體回收機制。 這些函數的調用效果與修改配置項來開啟或關閉記憶體回收機制的效果是一樣的。 除了這兩個函數PHP提供了gc_collect_cycles()函數可以在根緩衝區還沒滿時強制執行循環回收。 與記憶體回收機制是否開啟在PHP源碼中有一些相關的操作和欄位。在zend.c檔案中有如下代碼:
複製代碼 代碼如下:
static ZEND_INI_MH(OnUpdateGCEnabled) /* {{{ */
{
OnUpdateBool(entry, new_value, new_value_length, mh_arg1, mh_arg2, mh_arg3, stage TSRMLS_CC);
if (GC_G(gc_enabled)) {
gc_init(TSRMLS_C);
}
return SUCCESS;
}
/* }}} */
ZEND_INI_BEGIN()
ZEND_INI_ENTRY("error_reporting", NULL, ZEND_INI_ALL, OnUpdateErrorReporting)
STD_ZEND_INI_BOOLEAN("zend.enable_gc", "1", ZEND_INI_ALL, OnUpdateGCEnabled, gc_enabled, zend_gc_globals, gc_globals)
#ifdef ZEND_MULTIBYTE
STD_ZEND_INI_BOOLEAN("detect_unicode", "1", ZEND_INI_ALL, OnUpdateBool, detect_unicode, zend_compiler_globals, compiler_globals)
#endif
ZEND_INI_END()

zend.enable_gc對應的操作函數為ZEND_INI_MH(OnUpdateGCEnabled),如果開啟了記憶體回收機制, 即GC_G(gc_enabled)為真,則會調用gc_init函數執行記憶體回收機制的初始化操作。 gc_init函數在zend/zend_gc.c 121行,此函數會判斷是否開啟記憶體回收機制, 如果開啟,則初始化整個機制,即直接調用malloc給整個緩衝列表分配10000個gc_root_buffer記憶體空間。 這裡的10000是寫入程式碼在代碼中的,以宏GC_ROOT_BUFFER_MAX_ENTRIES存在,如果需要修改這個值,則需要修改源碼,重新編譯PHP。 gc_init函數在預分配記憶體後調用gc_reset函數重設整個機制用到的一些全域變數,如設定gc啟動並執行次數統計(gc_runs)和gc中垃圾的個數(collected)為0, 設定雙向鏈表頭結點的上一個結點和下一個結點指向自己等。除了這種提的一些用於記憶體回收機制的全域變數,還有其它一些使用較多的變數,部分說明如下:
複製代碼 代碼如下:
typedef struct _zend_gc_globals {
zend_bool gc_enabled; /* 是否開啟垃圾收集機制 */
zend_bool gc_active; /* 是否進行中 */
gc_root_buffer *buf; /* 預分配的緩衝區數組,預設為10000(preallocated arrays of buffers) */
gc_root_buffer roots; /* 列表的根結點(list of possible roots of cycles) */
gc_root_buffer *unused; /* 沒有使用過的緩衝區列表(list of unused buffers) */
gc_root_buffer *first_unused; /* 指向第一個沒有使用過的緩衝區結點(pointer to first unused buffer) */
gc_root_buffer *last_unused; /* 指向最後一個沒有使用過的緩衝區結點,此處為標記結束用(pointer to last unused buffer) */
zval_gc_info *zval_to_free; /* 將要釋放的zval變數的臨時列表(temporaryt list of zvals to free) */
zval_gc_info *free_list; /* 臨時變數,需要釋放的列表開頭 */
zval_gc_info *next_to_free; /* 臨時變數,下一個將要釋放的變數位置*/
zend_uint gc_runs; /* gc啟動並執行次數統計 */
zend_uint collected; /* gc中垃圾的個數 */
// 省略...
}

當我們使用一個unset操作想清除這個變數所佔的記憶體時(可能只是引用計數減一),會從當前符號的雜湊表中刪除變數名對應的項, 在所有的操作執行完後,並對從符號表中刪除的項調用一個解構函式,臨時變數會調用zval_dtor,一般的變數會調用zval_ptr_dtor。
當然我們無法在PHP的函數集中找到unset函數,因為它是一種語言結構。 其對應的中間代碼為ZEND_UNSET,在Zend/zend_vm_execute.h檔案中你可以找到與它相關的實現。
zval_ptr_dtor並不是一個函數,只是一個長得有點像函數的宏。 在Zend/zend_variables.h檔案中,這個宏指向函數_zval_ptr_dtor。 在Zend/zend_execute_API.c 424行,函數相關代碼如下:
複製代碼 代碼如下:
ZEND_API void _zval_ptr_dtor(zval **zval_ptr ZEND_FILE_LINE_DC) /* {{{ */
{
#if DEBUG_ZEND>=2
printf("Reducing refcount for %x (%x): %d->%d\n", *zval_ptr, zval_ptr, Z_REFCOUNT_PP(zval_ptr), Z_REFCOUNT_PP(zval_ptr) - 1);
#endif
Z_DELREF_PP(zval_ptr);
if (Z_REFCOUNT_PP(zval_ptr) == 0) {
TSRMLS_FETCH();
if (*zval_ptr != &EG(uninitialized_zval)) {
GC_REMOVE_ZVAL_FROM_BUFFER(*zval_ptr);
zval_dtor(*zval_ptr);
efree_rel(*zval_ptr);
}
} else {
TSRMLS_FETCH();
if (Z_REFCOUNT_PP(zval_ptr) == 1) {
Z_UNSET_ISREF_PP(zval_ptr);
}
GC_ZVAL_CHECK_POSSIBLE_ROOT(*zval_ptr);
}
}
/* }}} */

從代碼我們可以很清晰的看出這個zval的析構過程,關於引用計數欄位做了以下兩個操作:
如果變數的引用計數為1,即減一後引用計數為0,直接清除變數。如果當前變數如果被緩衝,則需要清除緩衝如果變數的引用計數大於1,即減一後引用計數大於0,則將變數放入垃圾列表。如果變更存在引用,則去掉其引用。

將變數放入垃圾列表的操作是GC_ZVAL_CHECK_POSSIBLE_ROOT,這也是一個宏,其對應函數gc_zval_check_possible_root, 但是此函數僅對數組和對象執行記憶體回收操作。對於數組和物件變數,它會調用gc_zval_possible_root函數。
複製代碼 代碼如下:
ZEND_API void gc_zval_possible_root(zval *zv TSRMLS_DC)
{
if (UNEXPECTED(GC_G(free_list) != NULL &&
GC_ZVAL_ADDRESS(zv) != NULL &&
GC_ZVAL_GET_COLOR(zv) == GC_BLACK) &&
(GC_ZVAL_ADDRESS(zv) < GC_G(buf) ||
GC_ZVAL_ADDRESS(zv) >= GC_G(last_unused))) {
/* The given zval is a garbage that is going to be deleted by
* currently running GC */
return;
}
if (zv->type == IS_OBJECT) {
GC_ZOBJ_CHECK_POSSIBLE_ROOT(zv);
return;
}
GC_BENCH_INC(zval_possible_root);
if (GC_ZVAL_GET_COLOR(zv) != GC_PURPLE) {
GC_ZVAL_SET_PURPLE(zv);
if (!GC_ZVAL_ADDRESS(zv)) {
gc_root_buffer *newRoot = GC_G(unused);
if (newRoot) {
GC_G(unused) = newRoot->prev;
} else if (GC_G(first_unused) != GC_G(last_unused)) {
newRoot = GC_G(first_unused);
GC_G(first_unused)++;
} else {
if (!GC_G(gc_enabled)) {
GC_ZVAL_SET_BLACK(zv);
return;
}
zv->refcount__gc++;
gc_collect_cycles(TSRMLS_C);
zv->refcount__gc--;
newRoot = GC_G(unused);
if (!newRoot) {
return;
}
GC_ZVAL_SET_PURPLE(zv);
GC_G(unused) = newRoot->prev;
}
newRoot->next = GC_G(roots).next;
newRoot->prev = &GC_G(roots);
GC_G(roots).next->prev = newRoot;
GC_G(roots).next = newRoot;
GC_ZVAL_SET_ADDRESS(zv, newRoot);
newRoot->handle = 0;
newRoot->u.pz = zv;
GC_BENCH_INC(zval_buffered);
GC_BENCH_INC(root_buf_length);
GC_BENCH_PEAK(root_buf_peak, root_buf_length);
}
}
}

在前面說到gc_zval_check_possible_root函數僅對數組和對象執行記憶體回收操作,然而在gc_zval_possible_root函數中, 針對物件類型的變數會去調用GC_ZOBJ_CHECK_POSSIBLE_ROOT宏。而對於其它的可用於記憶體回收的機制的變數類型其調用過程如下:
檢查zval結點資訊是否已經放入到結點緩衝區,如果已經放入到結點緩衝區,則直接返回,這樣可以最佳化其效能。 然後處理對象結點,直接返回,不再執行後面的操作判斷結點是否已經被標記為紫色,如果為紫色則不再添加到結點緩衝區,此處在於保證一個結點只執行一次添加到緩衝區的操作。

將結點的顏色標記為紫色,表示此結點已經添加到緩衝區,下次不用再做添加
找出新的結點的位置,如果緩衝區滿了,則執行記憶體回收操作。
將新的結點添加到緩衝區所在的雙向鏈表。
在gc_zval_possible_root函數中,當緩衝區滿時,程式調用gc_collect_cycles函數,執行記憶體回收操作。 其中最關鍵的幾步就是
第628行 此處為其官方文檔中演算法的步驟 B ,演算法使用深度優先搜尋尋找所有可能的根,找到後將每個變數容器中的引用計數減1, 為確保不會對同一個變數容器減兩次“1”,用灰色標記已減過1的。
第629行 這是演算法的步驟 C ,演算法再一次對每個根節點使用深度優先搜尋,檢查每個變數容器的引用計數。 如果引用計數是 0 ,變數容器用白色來標記。如果引用次數大於0,則恢複在這個點上使用深度優先搜尋而將引用計數減1的操作(即引用計數加1), 然後將它們重新用黑色標記。
第630行 演算法的最後一步 D ,演算法遍曆根緩衝區以從那裡刪除變數容器根(zval roots), 同時,檢查是否有在上一步中被白色標記的變數容器。每個被白色標記的變數容器都被清除。 在[gc_collect_cycles() -> gc_collect_roots() -> zval_collect_white() ]中我們可以看到, 對於白色標記的結點會被添加到全域變數zval_to_free列表中。此列表在後面的操作中有用到。
PHP的記憶體回收機制在執行過程中以四種顏色標記狀態。
GC_WHITE 白色表示垃圾
GC_PURPLE 紫色表示已放入緩衝區
GC_GREY 灰色表示已經進行了一次refcount的減一操作
GC_BLACK 黑色是預設顏色,正常
相關的標記以及作業碼如下:
複製代碼 代碼如下:
#define GC_COLOR 0x03
#define GC_BLACK 0x00
#define GC_WHITE 0x01
#define GC_GREY 0x02
#define GC_PURPLE 0x03
#define GC_ADDRESS(v) \
((gc_root_buffer*)(((zend_uintptr_t)(v)) & ~GC_COLOR))
#define GC_SET_ADDRESS(v, a) \
(v) = ((gc_root_buffer*)((((zend_uintptr_t)(v)) & GC_COLOR) | ((zend_uintptr_t)(a))))
#define GC_GET_COLOR(v) \
(((zend_uintptr_t)(v)) & GC_COLOR)
#define GC_SET_COLOR(v, c) \
(v) = ((gc_root_buffer*)((((zend_uintptr_t)(v)) & ~GC_COLOR) | (c)))
#define GC_SET_BLACK(v) \
(v) = ((gc_root_buffer*)(((zend_uintptr_t)(v)) & ~GC_COLOR))
#define GC_SET_PURPLE(v) \
(v) = ((gc_root_buffer*)(((zend_uintptr_t)(v)) | GC_PURPLE))

以上的這種以位來標記狀態的方式在PHP的源碼中使用頻率較高,如記憶體管理等都有用到, 這是一種比較高效及節省的方案。但是在我們做資料庫設計時可能對於欄位不能使用這種方式, 應該是以一種更加直觀,更加具有可讀性的方式實現。

http://www.bkjia.com/PHPjc/326234.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/326234.htmlTechArticle記憶體回收機制是一種動態儲存裝置分配方案。它會自動釋放程式不再需要的已指派的記憶體塊。 自動回收記憶體的過程叫垃圾收集。記憶體回收機制可...

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.