PHP 數組遍曆順序理解

來源:互聯網
上載者:User
文章目錄
  • PHP的數組

比如:

<?php
$arr['laruence'] = 'huixinchen';
$arr['yahoo'] = 2007;
$arr['baidu'] = 2008;
foreach ($arr as $key => $val) {
//結果是什麼?
}

又比如:

<?php
$arr[2] = 'huixinchen';
$arr[1] = 2007;
$arr[0] = 2008;
foreach ($arr as $key => $val) {
//現在結果又是什麼?
}

要完全瞭解清楚這個問題, 我想首先應該要大家瞭解PHP數組的內部實現結構………

PHP的數組

在PHP中, 數組是用一種HASH結構(HashTable)來實現的, PHP使用了一些機制, 使得可以在O(1)的時間複雜度下實現數組的增刪, 並同時支援線性遍曆和隨機訪問.

之前的文章中也討論過, PHP的HASH演算法, 基於此, 我們做進一步的延伸.

認識HashTable之前, 首先讓我們看看HashTable的結構定義, 我加了注釋方便大家理解:

typedef struct _hashtable {
uint nTableSize; /* 散列表大小, Hash值的區間 */
uint nTableMask; /* 等於nTableSize -1, 用於快速定位 */
uint nNumOfElements; /* HashTable中實際元素的個數 */
ulong nNextFreeElement; /* 下個空閑可用位置的數字索引 */
Bucket *pInternalPointer; /* 內部位置指標, 會被reset, current這些遍曆函數使用 */
Bucket *pListHead; /* 頭元素, 用於線性遍曆 */
Bucket *pListTail; /* 尾元素, 用於線性遍曆 */
Bucket **arBuckets; /* 實際的儲存容器 */
dtor_func_t pDestructor;/* 元素的解構函式(指標) */
zend_bool persistent;
unsigned char nApplyCount; /* 迴圈遍曆保護 */
zend_bool bApplyProtection;
#if ZEND_DEBUG
int inconsistent;
#endif
} HashTable;

關於nApplyCount的意義, 我們可以通過一個例子來瞭解:

<?php
$arr = array(1,2,3,4,5,);
$arr[] = &$arr;

var_export($arr); //Fatal error: Nesting level too deep - recursive dependency?

這個欄位就是為了防治循環參考導致的無限迴圈而設立的.

查看上面的結構, 可以看出, 對於HashTable, 關鍵元素就是arBuckets了, 這個是實際儲存的容器, 讓我們來看看它的結構定義:

typedef struct bucket {
ulong h; /* 數字索引/hash值 */
uint nKeyLength; /* 字元索引的長度 */
void *pData; /* 資料 */
void *pDataPtr; /* 資料指標 */
struct bucket *pListNext; /* 下一個元素, 用於線性遍曆 */
struct bucket *pListLast; /* 上一個元素, 用於線性遍曆 */
struct bucket *pNext; /* 處於同一個拉鏈中的下一個元素 */
struct bucket *pLast; /* 處於同一拉鏈中的上一個元素 */
char arKey[1]; /* 節省記憶體,方便初始化的技巧 */
} Bucket;

我們注意到, 最後一個元素, 這個是flexible array技巧, 可以節省記憶體,和方便初始化的一種做法, 有興趣的朋友可以google flexible array.

h是元素的Hash值,對於數字索引的元素,h為直接索引值(通過nKeyLength=0來表示是數字索引).對於數字索引來說, 索引值儲存在arKey中, 索引的長度儲存在nKeyLength中.

在Bucket中,實際的資料是儲存在pData指標指向的記憶體塊中,通常這個記憶體塊是系統另外分配的。但有一種情況例外,就是當Bucket儲存 的資料是一個指標時,HashTable將不會另外請求系統分配空間來儲存這個指標,而是直接將該指標儲存到pDataPtr中,然後再將pData指向本結構成員的地址。這樣可以提高效率,減少記憶體片段。由此我們可以看到PHP HashTable設計的精妙之處。如果Bucket中的資料不是一個指標,pDataPtr為NULL(本段來自Altair的”Zend HashTable詳解”)

結合上面的HashTable結構, 我們來說明下HashTable的總結構圖:

HashTable結構

HashTable的pListhHead指向線性列表形式下的第一個元素, 中是元素1, pListTail指向的是最後一個元素0, 而對於每一個元素pListNext就是紅色線條畫出的線性結構的下一個元素, 而pListLast是上一個元素.

pInternalPointer指向當前的內部指標的位置, 在對數組進行順序遍曆的時候, 這個指標指明了當前的元素.

當線上性(順序)遍曆的時候, 就會從pListHead開始, 順著Bucket中的pListNext/pListLast, 根據移動pInternalPointer, 來實現對所有元素的線性遍曆.

比如, 對於foreach, 如果我們查看它產生的opcode序列, 我們可以發現, 在foreach之前, 會首先有個FE_RESET來重設數組的內部指標, 也就是pInternalPointer(關於foreach可以參看深入理解PHP原理之foreach), 然後通過每次FE_FETCH來遞增pInternalPointer,從而實現順序遍曆.

類似的, 當我們使用, each/next系列函數來遍曆的時候, 也是通過移動數組的內部指標而實現了順序遍曆, 這裡有一個問題, 比如:

<?php
$arr = array(1,2,3,4,5);
foreach ($arr as $v) {
//可以擷取
}

while (list($key, $v) = each($arr)) {
//擷取不到
}
?>

瞭解到我剛才介紹的知識, 那麼這個問題也就很明朗了, 因為foreach會自動reset, 而while這塊不會reset, 所以在foreach結束以後, pInternalPointer指向數組最末端, while語句塊當然訪問不到了, 解決的辦法就是在each之前, 先reset數組的內部指標.

而在隨機訪問的時候, 就會通過hash值確定在hash數組中的頭指標位置, 然後通過pNext/pLast來找到特點元素.

增加元素的時候, 元素會插在相同Hash元素鏈的頭部和線性列表的尾部. 也就是說, 元素線上性遍曆的時候是根據插入的先後順序來遍曆的, 這個特殊的設計使得在PHP中,當使用數字索引時, 元素的先後順序是由添加的順序決定的,而不是索引順序.

也就是說, PHP中遍曆數組的順序, 是和元素的添加先後相關的, 那麼, 現在我們就很清楚的知道, 文章開頭的問題的輸出是:

huixinchen
2007
2008

所以, 如果你想在數字索引的數組中按照索引大小遍曆, 那麼你就應該使用for, 而不是foreach

for($i=0,$l=count($arr); $i<$l; $i++) {
//這個時候,不能認為是順序遍曆(線性遍曆)
}
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.