從喜悅村上轉載,以前也讀過此文,講述得還是比較清楚的。
產品分類,多級的樹狀結構的論壇,郵件清單等許多地方我們都會遇到這樣的問題:如何儲存多級結構的資料?
在PHP的應用中,提供後台資料存放區的通常是關係型資料庫,它能夠儲存大量的資料,提供高效的資料檢索和更新服務。然而關係型資料的基本形式是縱橫交錯的表,是一個平面的結構,如果要將多級樹狀結構儲存在關係型資料庫裡就需要進行合理的翻譯工作。接下來我會將自己的所見所聞和一些實用的經驗和大家探討一下。
層級結構的資料儲存在平面的資料庫中基本上有兩種常用設計方法:
毗鄰目錄模式(adjacency list model)
預排序遍曆樹演算法(modified preorder tree traversal algorithm)
我不是電腦專業的,也沒有學過什麼資料結構的東西,所以這兩個名字都是我自己按照字面的意思翻的,如果說錯了還請多多指教。
這兩個東西聽著好像很嚇人,其實非常容易理解。這裡我用一個簡單食品目錄作為我們的樣本資料。 我們的資料結構是這樣的:
Food
|
|---Fruit
| |
| |---Red
| | |
| | |--Cherry
| |
| |---Yellow
| |
| |--Banana
|
|---Meat
|
|--Beef
|
|--Pork
為了照顧那些英文一塌糊塗的PHP愛好者
Food:食物
Fruit:水果
Red:紅色
Cherry:櫻桃
Yellow:黃色
Banana:香蕉
Meat:肉類
Beef:牛肉
Pork:豬肉
毗鄰目錄模式(adjacency list model)
這種模式我們經常用到,很多的教程和書中也介紹過。我們通過給每個節點增加一個屬性 parent 來表示這個節點的父節點從而將整個樹狀結構通過平面的表描述出來。根據這個原則,例子中的資料可以轉化成如下的表:
+-----------------------+
| parent | name |
+-----------------------+
| | Food |
| Food | Fruit |
| Fruit | Green |
| Green | Pear |
| Fruit | Red |
| Red | Cherry |
| Fruit | Yellow |
| Yellow | Banana |
| Food | Meat |
| Meat | Beef |
| Meat | Pork |
+-----------------------+
我們看到 Pear 是Green的一個子節點,Green是Fruit的一個子節點。而根節點'Food'沒有父節點。 為了簡單地描述這個問題, 這個例子中只用了name來表示一個記錄。 在實際的資料庫中,你需要用數位id來標示每個節點,資料庫的表結構大概應該像這樣:id, parent_id, name, description。有了這樣的表我們就可以通過資料庫儲存整個多級樹狀結構了。
顯示多級樹
如果我們需要顯示這樣的一個多級結構需要一個遞迴函式。
<?php
// $parent is the parent of the children we want to see
// $level is increased when we go deeper into the tree,
// used to display a nice indented tree
function display_children($parent, $level)
{
// 獲得一個 父節點 $parent 的所有子節點
$result = mysql_query('SELECT name FROM tree '.
'WHERE parent="'.$parent.'";');
// 顯示每個子節點
while ($row = mysql_fetch_array($result))
{
// 縮排顯示節點名稱
echo str_repeat(' ',$level).$row['name']."n";
//再次調用這個函數顯示子節點的子節點
display_children($row['name'], $level+1);
}
}
?>
對整個結構的根節點(Food)使用這個函數就可以列印出整個多級樹結構,由於Food是根節點它的父節點是空的,所以這樣調用: display_children('',0)。將顯示整個樹的內容:
Food
Fruit
Red
Cherry
Yellow
Banana
Meat
Beef
Pork
如果你只想顯示整個結構中的一部分,比如說水果部分,就可以這樣調用:
display_children('Fruit',0);
幾乎使用同樣的方法我們可以知道從根節點到任意節點的路徑。比如 Cherry 的路徑是 "Food > Fruit > Red"。 為了得到這樣的一個路徑我們需要從最深的一級"Cherry"開始, 查詢得到它的父節點"Red"把它添加到路徑中, 然後我們再查詢Red的父節點並把它也添加到路徑中,以此類推直到最高層的"Food"
<?php
// $node 是那個最深的節點
function get_path($node)
{
// 查詢這個節點的父節點
$result = mysql_query('SELECT parent FROM tree '.
'WHERE name="'.$node.'";');
$row = mysql_fetch_array($result);
// 用一個數組儲存路徑
$path = array();
// 如果不是根節點則繼續向上查詢
// (根節點沒有父節點)
if ($row['parent']!='')
{
// the last part of the path to $node, is the name
// of the parent of $node
$path[] = $row['parent'];
// we should add the path to the parent of this node
// to the path
$path = array_merge(get_path($row['parent']), $path);
}
// return the path
return $path;
}
?>
如果對"Cherry"使用這個函數:print_r(get_path('Cherry')),就會得到這樣的一個數組了:
Array
(
[0] => Food
[1] => Fruit
[2] => Red
)
接下來如何把它列印成你希望的格式,就是你的事情了。
缺點:這種方法很簡單,容易理解,好上手。但是也有一些缺點。主要是因為運行速度很慢,由於得到每個節點都需要進行資料庫查詢,資料量大的時候要進行很多查詢才能完成一個樹。另外由於要進行遞迴運算,遞迴的每一級都需要佔用一些記憶體所以在空間利用上效率也比較低。
現在讓我們看一看另外一種不使用遞迴計算,更加快速的方法,這就是預排序遍曆樹演算法(modified preorder tree traversal algorithm) 這種方法大家可能接觸的比較少,初次使用也不像上面的方法容易理解,但是由於這種方法不使用遞迴查詢演算法,有更高的查詢效率。
我們首先將多級資料按照下面的方式畫在紙上,在根節點Food的左側寫上 1 然後沿著這個樹繼續向下 在 Fruit 的左側寫上 2 然後繼續前進,沿著整個樹的邊緣給每一個節點都標上左側和右側的數字。最後一個數字是標在Food 右側的 18。 在下面的這張圖中你可以看到整個標好了數位多級結構。(沒有看懂?用你的手指指著數字從1數到18就明白怎麼回事了。還不明白,再數一遍,注意要移動你的手指)。
這些數字標明了各個節點之間的關係,"Red"的號是3和6,它是 "Food" 1-18 的子孫節點。 同樣,我們可以看到 所有左值大於2和右值小於11的節點 都是"Fruit" 2-11 的子孫節點