樹形結構的資料庫表Schema設計__資料庫

來源:互聯網
上載者:User

樹形結構的資料庫表Schema設計


    程式設計過程中,我們常常用樹形結構來表徵某些資料的關聯關係,如企業上下級部門、欄目結構、商品分類等等,通常而言,這些樹狀結構需要藉助於資料庫完成持久化。然而目前的各種基於關係的資料庫,都是以二維表的形式記錄儲存資料資訊,因此是不能直接將Tree存入DBMS,設計合適的Schema及其對應的CRUD演算法是實現關係型資料庫中儲存樹形結構的關鍵。

    理想中樹形結構應該具備如下特徵:資料存放區冗餘度小、直觀性強;檢索遍曆過程簡單高效;節點增刪改查CRUD操作高效。無意中在網上搜尋到一種很巧妙的設計,原文是英文,看過後感覺有點意思,於是便整理了一下。本文將介紹兩種樹形結構的Schema設計方案:一種是直觀而簡單的設計思路,另一種是基於左右值編碼的改進方案。

一、基本資料

    本文列舉了一個食品族譜的例子進行講解,通過類別、顏色和品種組織食品,樹形結構圖如下:

二、繼承關係驅動的Schema設計

    對樹形結構最直觀的分析莫過於節點之間的繼承關係上,通過顯示地描述某一節點的父節點,從而能夠建立二維的關係表,則這種方案的Tree表結構通常設計為:{Node_id,Parent_id},上述資料可以描述為如下圖所示:

    這種方案的優點很明顯:設計和實現自然而然,非常直觀和方便。缺點當然也是非常的突出:由於直接地記錄了節點之間的繼承關係,因此對Tree的任何CRUD操作都將是低效的,這主要歸根於頻繁的“遞迴”操作,遞迴過程不斷地訪問資料庫,每次資料庫IO都會有時間開銷。當然,這種方案並非沒有用武之地,在Tree規模相對較小的情況下,我們可以藉助於緩衝機制來做最佳化,將Tree的資訊載入記憶體進行處理,避免直接對資料庫IO操作的效能開銷。

三、基於左右值編碼的Schema設計

    在基於資料庫的一般應用中,查詢的需求總要大於刪除和修改。為了避免對於樹形結構查詢時的“遞迴”過程,基於Tree的前序走訪設計一種全新的無遞迴查詢、無限分組的左右值編碼方案,來儲存該樹的資料。

    第一次看見這種表結構,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何計算出來的,而且這種表設計似乎並沒有儲存父子節點的繼承關係。但當你用手指指著表中的數字從1數到18,你應該會發現點什麼吧。對,你手指移動的順序就是對這棵樹進行前序走訪的順序,如下圖所示。當我們從根節點Food左側開始,標記為1,並沿前序走訪的方向,依次在遍曆的路徑上標註數字,最後我們回到了根節點Food,並在右邊寫上了18。

    第一次看見這種表結構,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何計算出來的,而且這種表設計似乎並沒有儲存父子節點的繼承關係。但當你用手指指著表中的數字從1數到18,你應該會發現點什麼吧。對,你手指移動的順序就是對這棵樹進行前序走訪的順序,如下圖所示。當我們從根節點Food左側開始,標記為1,並沿前序走訪的方向,依次在遍曆的路徑上標註數字,最後我們回到了根節點Food,並在右邊寫上了18。

    依據此設計,我們可以推斷出所有左值大於2,並且右值小於11的節點都是Fruit的後續節點,整棵樹的結構通過左值和右值儲存了下來。然而,這還不夠,我們的目的是能夠對樹進行CRUD操作,即需要構造出與之配套的相關演算法。

 四、樹形結構CRUD演算法

(1)擷取某節點的子孫節點

    只需要一條SQL語句,即可返回該節點子孫節點的前序走訪列表,以Fruit為例:SELECT* FROM Tree WHERE Lft BETWEEN 2 AND 11 ORDER BY Lft ASC。查詢結果如下所示:

    那麼某個節點到底有多少的子孫節點呢。通過該節點的左、右值我們可以將其子孫節點圈進來,則子孫總數 = (右值 – 左值– 1) / 2,以Fruit為例,其子孫總數為:(11 –2 – 1) / 2 = 4。同時,為了更為直觀地展現樹形結構,我們需要知道節點在樹中所處的層次,通過左、右值的SQL查詢即可實現,以Fruit為例:SELECTCOUNT(*) FROM Tree WHERE Lft <= 2 AND Rgt >=11。為了方便描述,我們可以為Tree建立一個視圖,添加一個層次數列,該列數值可以寫一個自訂函數來計算,函數定義如下:

CREATE FUNCTION dbo.CountLayer(    @node_id int)RETURNS intASbegindeclare @result intset @result = 0declare @lft intdeclare @rgt intif exists(select Node_id from Tree where Node_id = @node_id)beginselect @lft = Lft, @rgt = Rgt from Tree where node_id = @node_idselect @result = count(*) from Tree where Lft <= @lft and Rgt >= @rgtendreturn @resultendGO

    基於層次計算函數,我們建立一個視圖,添加了新的記錄節點層次的數列:

CREATE VIEW dbo.TreeViewASSELECT Node_id, Name, Lft, Rgt, dbo.CountLayer(Node_id) AS Layer FROM dbo.Tree ORDER BY LftGO

    建立預存程序,用於計算給定節點的所有子孫節點及相應的層次:

CREATE PROCEDURE [dbo].[GetChildrenNodeList](@node_id int)ASdeclare @lft intdeclare @rgt intif exists(select Node_id from Tree where node_id = @node_id)beginselect @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_idselect * from TreeView where Lft between @lft and @rgt order by Lft ASCendGO

    現在,我們使用上面的預存程序來計算節點Fruit所有子孫節點及對應層次,查詢結果如下:


    從上面的實現中,我們可以看出採用左右值編碼的設計方案,在進行樹的查詢遍曆時,只需要進行2次資料庫查詢,消除了遞迴,再加上查詢條件都是數位比較,查詢的效率是極高的,隨著樹規模的不斷擴大,基於左右值編碼的設計方案將比傳統的遞迴方案查詢效率提高更多。當然,前面我們只給出了一個簡單的擷取節點子孫的演算法,真正地使用這棵樹我們需要實現插入、刪除同層平移節點等功能。

 (2)擷取某節點的族譜路徑

    假定我們要獲得某節點的族譜路徑,則根據左、右值分析只需要一條SQL語句即可完成,以Fruit為例:SELECT* FROM Tree WHERE Lft < 2 AND Rgt > 11 ORDER BY Lft ASC ,相對完整的預存程序:

CREATE PROCEDURE [dbo].[GetParentNodePath](@node_id int)ASdeclare @lft intdeclare @rgt intif exists(select Node_id from Tree where Node_id = @node_id)beginselect @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_idselect * from TreeView where Lft < @lft and Rgt > @rgt order by Lft ASCendGO

(3)為某節點添加子孫節點     假定我們要在節點“Red”下添加一個新的子節點“Apple”,該樹將變成如下圖所示,其中紅色節點為新增節點。


    仔細觀察圖中節點左右值變化,相信大家都應該能夠推斷出如何寫SQL指令碼了吧。我們可以給出相對完整的插入子節點的預存程序:

CREATE PROCEDURE [dbo].[AddSubNode](@node_id int,@node_name varchar(50))ASdeclare @rgt intif exists(select Node_id from Tree where Node_id = @node_id)beginSET XACT_ABORT ONBEGIN TRANSCTIONselect @rgt = Rgt from Tree where Node_id = @node_idupdate Tree set Rgt = Rgt + 2 where Rgt >= @rgtupdate Tree set Lft = Lft + 2 where Lft >= @rgtinsert into Tree(Name, Lft, Rgt) values(@node_name, @rgt, @rgt + 1)COMMIT TRANSACTIONSET XACT_ABORT OFFendGO

(4)刪除某節點

    如果我們想要刪除某個節點,會同時刪除該節點的所有子孫節點,而這些被刪除的節點的個數為:(被刪除節點的右值 – 被刪除節點的左值+ 1) / 2,而剩下的節點左、右值在大於被刪除節點左、右值的情況下會進行調整。來看看樹會發生什麼變化,以Beef為例,刪除效果如下圖所示。

    則我們可以構造出相應的預存程序:

CREATE PROCEDURE [dbo].[DelNode](@node_id int)ASdeclare @lft intdeclare @rgt intif exists(select Node_id from Tree where Node_id = @node_id)beginSET XACT_ABORT ONBEGIN TRANSCTIONselect @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_iddelete from Tree where Lft >= @lft and Rgt <= @rgtupdate Tree set Lft = Lft – (@rgt - @lft + 1) where Lft > @lftupdate Tree set Rgt = Rgt – (@rgt - @lft + 1) where Rgt > @rgtCOMMIT TRANSACTIONSET XACT_ABORT OFFendGO

五、總結

    我們可以對這種通過左右值編碼實現無限分組的樹形結構Schema設計方案做一個總結:

    (1)優點:在消除了遞迴操作的前提下實現了無限分組,而且查詢條件是基於整形數位比較,效率很高。

    (2)缺點:節點的添加、刪除及修改代價較大,將會涉及到表中多方面資料的改動。

    當然,本文只給出了幾種比較常見的CRUD演算法的實現,我們同樣可以自己添加諸如同層節點平移、節點下移、節點上移等操作。有興趣的朋友可以自己動手編碼實現一下,這裡不在列舉了。值得注意的是,實現這些演算法可能會比較麻煩,會涉及到很多條update語句的順序執行,如果順序調度考慮不周詳,出現Bug的話將會對整個樹形結構表產生驚人的破壞。因此,在對樹形結構進行大規模修改的時候,可以採用暫存資料表做中介,以降低代碼的複雜度,同時,強烈推薦在做修改之前對錶進行完整備份,以備不時之需。在以查詢為主的絕大多數基於資料庫的應用系統中,該方案相比傳統的由父子繼承關係構建的資料庫Schema更為適用。

參考文獻:《Storing Hierarchical Data in a Database Article》

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.