Oracle 11g Release (11.1) 索引底層的資料結構

來源:互聯網
上載者:User

本文內容 B-樹(B-tree) 散列(Hash) k-d 樹(k-d tree) 點四叉樹(Point Quadtree)

本文介紹關於 Oracle 索引的結構。大概瞭解 Oracle 索引底層的資料結構,從而更好地理解 Oracle 索引對增、刪、改、查的效能。

B-樹(B-tree)

非索引的結構能滿足所有需要,但自平衡的 B-樹索引結構更能最佳化在大資料集上檢索的效能。每個 B-樹節點擁有多個鍵和指標。特定 B-樹支援的一個節點中鍵的最大數量是那顆樹的順序。每個節點都具有一個潛在的 order+1 指標,指向比它更低一級的節點。

例如, 1 所示,order=2 的 B-樹具有三個指標,分別指向:比它第一個鍵小的子節點(最左邊的指標);比它第一個鍵大,比第二個鍵小的子節點(中間的指標);比它第二個鍵大的子節點(最右邊的指標)。因此,B-樹演算法,最大限度地減少定位記錄所需的讀寫,通過傳遞比二叉樹演算法更少的節點,二叉樹對每個確定的節點,用一個鍵和最多兩個子節點(二叉樹的結構是一個索引值,左右兩個指標,B-樹是二叉樹的擴充)。描述的是克努特變換(Knuth variation),它的索引由兩部分組成:一個順序集(Sequence set),提供快速順序的訪問資料;一個索引集(Index set),提供直接存取順序集。

雖然,B-樹的節點,一般不包含相同數量的資料值,並且他們通常包含一定量的未使用空間,B-樹演算法確保樹保持平衡,和分葉節點在同一級上。

圖 1 B-樹

散列(Hash)

散列根據一個給定欄位值快速直接地訪問一個特定的已儲存的記錄。每個記錄被放置的位置是根據同一個函數,記錄的一些欄位域的Function Compute的。並用相同的函數插入和更新。

散列的問題是記錄的物理順序與它們的邏輯順序沒有任何關係。另外,散列會在磁碟上存在大量未使用的地區。

圖 2 散列

k-d 樹(k-d tree)

具有兩維的資料,例如經度和緯度,可用通過使用 k-d樹變換,稱為 2-d 樹,被有效地儲存和檢索。

在這個結構,每個節點的資料類型,是欄位資訊,兩個座標,和指向兩個子節點的左指標和右指標。

圖 3 2-d 樹

這種結構利於範圍查詢。也就是說,如果使用者指定一個點(xx, xx)和一個距離,那麼,查詢會返回在這個指定的原來點距離內的所有點集合。

2-d 樹很容易實現。但是因為,一個包含 k 個節點的 2-d 樹具有 k 高度,因此,插入和查詢複雜。

點四叉樹(Point Quadtree)

點四叉樹,在圖 4 所示,也用來表示在一個兩維空間中的點資料,但這些結構把地區劃分為四個部分,而 2-d 樹劃分為兩個。節點記錄類型的欄位由屬性資訊組成,包括兩個座標和指向四個子節點的方位點,按順時針,如西北NW,西南SW,東北NE,東南SE。

圖 4 Point Quadtree 索引結構

點四叉樹跟 2-d 樹一樣也很容易實現。一個包含 k 個節點的四叉樹具有 k 高度,插入和查詢複雜。每個比較都要求在至少兩個座標上進行。然而,實際中,從 root 到 leaf 的長度在點四叉樹中往往較短。

複製上面第二個連結裡邊提供的 Python 代碼,做適當修改。因為,網頁提供的代碼只能運行在較低版本 Python。Python 3 之後的版本跟之前的差異較大。因此,下載本文最後原始碼,並在 Python 3.3 的 IDLE 運行。會得到如下輸出:

Python 3.3.0 (v3.3.0:bd8afb90ebf2, Sep 29 2012, 10:57:17) [MSC v.1600 64 bit (AMD64)] on win32

Type "copyright", "credits" or "license()" for more information.

>>> ================================ RESTART ================================

>>> 

<?xml version="1.0" encoding="iso-8859-1"?>

<!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 1.1//EN"

 "http://www.w3.org/Graphics/SVG/1.1/DTD/svg11.dtd">

<svg xmlns="http://www.w3.org/2000/svg" version="1.1" width="400pt" height="400pt" viewBox="0 0 400 400">

 <g fill="none" stroke="blue">

 <line x1="1" y1="1" x2="1" y2="399" />

 <line x1="1" y1="399" x2="399" y2="399" />

 <line x1="399" y1="399" x2="399" y2="1" />

 <line x1="399" y1="1" x2="1" y2="1" />

 <line x1="200" y1="1" x2="200" y2="399" />

 <line x1="1" y1="200" x2="399" y2="200" />

 <line x1="100" y1="1" x2="100" y2="200" />

 <line x1="1" y1="100" x2="200" y2="100" />

 <line x1="50" y1="1" x2="50" y2="100" />

……

複製輸出的結果,命名為 .svg,.html 也行,用瀏覽器開啟,會呈現:

圖 5 一個 8*8 大小的點四叉樹地區

看這個圖,從左上方開始,順時針。你可以當做“根據需要,是否要點,不斷按 4 個分裂其中一個方塊”。

下載 Point Qudatree Python 示範

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.