用asp實現無限級分類的問題

來源:互聯網
上載者:User
分類演算法要解決的問題

在網站建設中,分類演算法的應用非常的普遍。在設計一個電子商店時,要涉及到商品分類;在設計發布系統時,要涉及到欄目或者頻道分類;在設計軟體下載這樣的程式時,要涉及到軟體的分類;如此等等。可以說,分類是一個很普遍的問題。

1、 分類演算法常常表現為樹的表示和遍曆問題。那麼,請問:如果用資料庫中的一個Table來表達樹型分類,應該有幾個欄位?

2、 如何快速地從這個Table恢複出一棵樹;

3、 如何判斷某個分類是否是另一個分類的子類;

4、 如何尋找某個分類的所有產品;

5、 如何產生分類所在的路徑。

6、 如何新增分類;

在不限制分類的級數和每級分類的個數時,這些問題並不是可以輕鬆回答的。本文試圖解決這些問題。

分類的資料結構
我們知道:分類的資料結構實際上是一棵樹。在《資料結構》課程中,大家可能學過Tree的演算法。由於在網站建設中我們大量使用資料庫,所以我們將從Tree在資料庫中的儲存談起。

為簡化問題,我們假設每個節點只需要保留Name這一個資訊。我們需要為每個節點編號。編號的方法有很多種。在資料庫中常用的就是自動編號。這在Access、SQL Server、Oracle中都是這樣。假設編號欄位為ID。

為了表示某個節點ID1是另外一個節點ID2的父節點,我們需要在資料庫中再保留一個欄位,說明這個分類是屬於哪個節點的兒子。把這個欄位取名為FatherID。如這裡的ID2,其FatherID就是ID1。

這樣,我們就得到了分類Catalog的資料表定義:

Create Table [Catalog](

[ID] [int] NOT NULL,

[Name] [nvarchar](50) NOT NULL,

[FatherID] [int] NOT NULL

);

約定:我們約定用-1作為最上面一層分類的父親編碼。編號為-1的分類。這是一個虛擬分類。它在資料庫中沒有記錄。

如何恢複出一棵樹
上面的Catalog定義的最大優勢,就在於用它可以輕鬆地恢複出一棵樹—分類樹。為了更清楚地展示演算法,我們先考慮一個簡單的問題:怎樣顯示某個分類的下一級分類。我們知道,要查詢某個分類FID的下一級分類,SQL語句非常簡單:

select Name from catalog where FatherID=FID

顯示這些類別時,我們簡單地用
來做到:

<%

REM oConn---資料庫連接,調用GetChildren時已經開啟

REM FID-----當前分類的編號

Function GetChildren(oConn,FID)

strSQL = "select ID,Name from catalog where FatherID="&FID

set rsCatalog = oConn.Execute(strSQL)

%>

<%

Do while not rsCatalog.Eof

%>

<%=rsCatalog("Name")%>

<%

Loop

%>

<%

rsCatalog.Close

End Function

%>

現在我們來看看如何顯示FID下的所有分類。這需要用到遞迴演算法。我們只需要在GetChildren函數中簡單地對所有ID進行調用:GetChildren(oConn,Catalog(“ID”))就可以了。

<%

REM oConn---資料庫連接,已經開啟

REM FID-----當前分類的編號

Function GetChildren(oConn,FID)

strSQL = "select Name from catalog where FatherID="&FID

set rsCatalog = oConn.Execute(strSQL)

%>

<%

Do while not rsCatalog.Eof

%>

<%=rsCatalog("Name")%>

<%=GetChildren(oConn,Catalog("ID"))%>

<%

Loop

%>

<%

rsCatalog.Close

End Function

%>

修改後的GetChildren就可以完成顯示FID分類的所有子分類的任務。要顯示所有的分類,只需要如此調用就可以了:

<%

REM strConn--串連資料庫的字串,請根據情況修改

set oConn = Server.CreateObject("ADODB.Connection")

oConn.Open strConn

=GetChildren(oConn,-1)

oConn.Close

%>

如何尋找某個分類的所有產品;
現在來解決我們在前面提出的第四個問題。第三個問題留作習題。我們假設產品的資料表如下定義:

Create Table Product(

[ID] [int] NOT NULL,

[Name] [nvchar] NOT NULL,

[FatherID] [int] NOT NULL

);

其中,ID是產品的編號,Name是產品的名稱,而FatherID是產品所屬的分類。

對第四個問題,很容易想到的辦法是:先找到這個分類FID的所有子類,然後查詢所有子類下的所有產品。實現這個演算法實際上很複雜。代碼大致如下:

<%

Function GetAllID(oConn,FID)

Dim strTemp

If FID=-1 then

strTemp = ""

else

strTemp =","

end if

strSQL = "select Name from catalog where FatherID="&FID

set rsCatalog = oConn.Execute(strSQL)

Do while not rsCatalog.Eof

strTemp=strTemp&rsCatalog("ID")&GetAllID(oConn,Catalog("ID")) REM 遞迴調用

Loop

rsCatalog.Close

GetAllID = strTemp

End Function

REM strConn--串連資料庫的字串,請根據情況修改

set oConn = Server.CreateObject("ADODB.Connection")

oConn.Open strConn

FID = Request.QueryString("FID")

strSQL = "select top 100 * from Product where FatherID in ("&GetAllID(oConn,FID)&")"

set rsProduct=oConn.Execute(strSQL)

%>

<%

Do while not rsProduct.EOF

%>

<%=rsProduct("Name")%>

<%

Loop

%>

<%rsProduct.Close

oConn.Close

%>

這個演算法有很多缺點。試列舉幾個如下:

1、 由於我們需要查詢FID下的所有分類,當分類非常多時,演算法將非常地不經濟,而且,由於要構造一個很大的strSQL,試想如果有1000個分類,這個strSQL將很大,能否執行就是一個問題。

2、 我們知道,在SQL中使用In子句的效率是非常低的。這個演算法不可避免地要使用In子句,效率很低。

我發現80%以上的程式員鐘愛這樣的演算法,並在很多系統中大量地使用。細心的程式員會發現他們寫出了很慢的程式,但苦於找不到原因。他們反覆地檢查SQL的執行效率,提高機器的檔次,但效率的增加很少。

最根本的問題就出在這個演算法本身。演算法定了,能夠再最佳化的機會就不多了。我們下面來介紹一種演算法,效率將是上面演算法的10倍以上。

分類編碼演算法
問題就出在前面我們採用了順序編碼,這是一種最簡單的編碼方法。大家知道,簡單並不意味著效率。實際上,編碼科學是程式員必修的課程。下面,我們通過設計一種編碼演算法,使分類的編號ID中同時包含了其父類的資訊。一個五級分類的例子如下:

此例中,用32(4+7+7+7+7)位整數來編碼,其中,第一級分類有4位,可以表達16種分類。第二級到第五級分類分別有7位,可以表達128個子分類。

顯然,如果我們得到一個編碼為 1092787200 的分類,我們就知道:由於其編碼為

0100 0001001 0001010 0111000 0000000

所以它是第四級分類。其父類的二進位編碼是0100 0001001 0001010 0000000 0000000,十進位編號為1092780032。依次我們還可以知道,其父類的父類編碼是0100 0001001 0000000 0000000 0000000,其父類的父類的父類編碼是0100 0000000 0000000 0000000 0000000。(我是不是太羅嗦了J,但這一點很重要。再回頭看看我們前面提到的第五個問題。哈哈,這不就已經得到了分類1092787200所在的分類路徑了嗎?)。

現在我們在一般的情況下來討論類別編碼問題。設類別的層次為k,第i層的編碼位元為Ni, 那麼總的編碼位元為N(N1+N2+..+Nk)。我們就得到任何一個類別的編碼形式如下:

2^(N-(N1+N2+…+Ni))*j + 父類編碼

其中,i表示第i層,j表示當前層的第j個分類。

這樣我們就把任何分類的編碼分成了兩個部分,其中一部分是它的層編碼,一部分是它的父類編碼。

由下面公式定一的k個編碼我們稱為特徵碼:(因為i可以取k個值,所以有k個)

2^N-2^(N-(N1+N2+…+Ni))

對於任何給定的類別ID,如果我們把ID和k個特徵碼“相與”,得到的非0編碼,就是其所有父類的編碼!

位編碼演算法
對任何順序編碼的Catalog表,我們可以設計一個位編碼演算法,將所有的類別編碼規格化為位編碼。在具體實現時,我們先建立一個暫存資料表:

Create TempCatalog(

[OldID] [int] NOT NULL,

[NewID] [int] NOT NULL,

[OldFatherID] [int] NOT NULL,

[NewFatherID] [int] NOT NULL

);

在這個表中,我們保留所有原來的類別編號OldID和其父類編號OldFatherID,以及重新計算的滿足位編碼要求的相應編號NewID、NewFatherID。

程式如下:

<%

REM oConn---資料庫連接,已經開啟

REM OldFather---原來的父類編號

REM NewFather---新的父類編號

REM N---編碼總位元

REM Ni--每一級的編碼位元數組

REM Level--當前的級數

sub FormatAllID(oConn,OldFather,NewFather,N,Nm,Ni byref,Level)

strSQL = "select CatalogID , FatherID from Catalog where FatherID=" & OldFather

set rsCatalog=oConn.Execute( strSQL )

j = 1

do while not rsCatalog.EOF

i = 2 ^(N - Nm) * j

if Level then i= i + NewFather

OldCatalog = rsCatalog("CatalogID")

NewCatalog = i

REM 寫入暫存資料表

strSQL = "Insert into TempCatalog (OldCatalogID , NewCatalogID , OldFatherID , NewFatherID)"

strSQL = strSQL & " values(" & OldCatalog & " , " & NewCatalog & " , " & OldFather & " , " & NewFather & ")"

Conn.Execute strSQL

REM 遞迴調用FormatAllID

Nm = Nm + Ni(Level+1)

FormatAllID oConn,OldCatalog , NewCatalog ,N,Nm,Ni,Level + 1

rsCatalog.MoveNext

j = j+1

loop

rsCatalog.Close

end sub

%>

調用這個演算法的一個例子如下:

<%

REM 定義編碼參數,其中N為總位元,Ni為每一級的位元。

Dim N,Ni(5)

Ni(1) = 4

N = Ni(1)

for i=2 to 5

Ni(i) = 7

N = N + Ni(i)

next

REM 開啟資料庫,建立暫存資料表

strSQL = "Create TempCatalog( [OldID] [int] NOT NULL, [NewID] [int] NOT NULL, [OldFatherID] [int] NOT NULL, [NewFatherID] [int] NOT NULL);"

Set Conn = Server.CreateObject("ADODB.Connection")

Conn.Open Application("strConn")

Conn.Execute strSQL

REM 調用規格化常式

FormatAllID Conn,-1,-1,N,Ni(1),Ni,0

REM ------------------------------------------------------------------------

REM 在此處更新所有相關表的類別編碼為新的編碼即可。

REM ------------------------------------------------------------------------

REM 關閉資料庫

strSQL= "drop table TempCatalog;"

Conn.Execute strSQL

Conn.Close

%>

第四個問題
現在我們回頭看看第四個問題:怎樣得到某個分類下的所有產品。由於採用了位編碼,現在問題變得很簡單。我們很容易推算:某個產品屬於某個類別的條件是Product.FatherID&(Catalog.ID的特徵碼)=Catalog.ID。其中“&”代表位與演算法。這在SQL Server中是直接支援的。

舉例來說:產品所屬的類別為:1092787200,而當前類別為1092780032。當前類別對應的特徵值為:4294950912,由於1092787200&4294950912=8537400,所以這個產品屬於分類8537400。

我們前面已經給出了計算特徵碼的公式。特徵碼並不多,而且很容易計算,可以考慮在Global.asa中Application_OnStart時間觸發時計算出來,存放在Application(“Mark”)數組中。

當然,有了特徵碼,我們還可以得到更加有效率的演算法。我們知道,雖然我們採用了位編碼,實際上還是一種順序編碼的方法。表現出第I級的分類編碼肯定比第I+1級分類的編碼要小。根據這個特點,我們還可以由FID得到兩個特徵碼,其中一個是本級位特徵碼FID0,一個是上級位特徵碼FID1。而產品屬於某個分類FID的充分必要條件是:

Product.FatherID>FID0 and Product.FatherID
下面的程式顯示分類FID下的所有產品。由於資料表Product已經對FatherID進行索引,故查詢速度極快:

<%

REM oConn---資料庫連接,已經開啟

REM FID---當前分類

REM FIDMark---特徵值數組,典型的情況下為Application(“Mark”)

REM k---數組元素個數,也是分類的級數

Sub GetAllProduct(oConn,FID,FIDMark byref,k)

REM 根據FID計算出特徵值FID0,FID1

for i=k to 1

if (FID and FIDMark = FID ) then exit

next

strSQL = "select Name from Product where FatherID>"FIDMark(i)&" and FatherID<"FIDMark(i-1)

set rsProduct=oConn.Execute(strSQL)%>

<%

Do While Not rsProduct.Eof%>

<%=rsProduct("Name")

Loop%>

<%

rsProduct.Close

End Sub

%> 
 

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.