字典樹c++實現

來源:互聯網
上載者:User

字典樹:

      又稱單詞尋找樹,Trie樹,是一種樹形結構,是一種雜湊樹的變種。典型應用是用於統計,排序和儲存大量的字串(但不僅限於字串),所以經常被搜尋引擎系統用於文本詞頻統計。它的優點是:利用字串的公用首碼來節約儲存空間,最大限度地減少無謂的字串比較,查詢效率比雜湊表高。

  字典樹的準系統是用來查詢某個單詞(首碼)在所有單詞中出現次數的一種資料結構,它的插入和查詢複雜度都為O(len),Len為單詞(首碼)長度,但是它的空間複雜度卻非常高,如果字元集是26個字母,那每個節點的度就有26個,典型的以空間換時間結構。

                     

下面我們選的儲存字典樹節點的資料結構為:

      typedef struct node
      {
        struct node *next[Max];  //表示對於每個節點最多有26個孩子節點
        int num;   //表示儲存的孩子節點的個數
      }Node;

下面以一個例子為例:給你100000個長度不超過10的單詞。對於每一個單詞,我們要判斷他出沒出現過。

      假設我要查詢的單詞是abcd,那麼在他前面的單詞中,以b,c,d,f之類開頭的我顯然不必考慮。而只要找以a開頭的中是否存在abcd就可以了。同樣的,在以a開頭中的單詞中,我們只要考慮以b作為第二個字母的……這樣一個樹的模型就漸漸清晰了……

字典樹代碼實現:

#include <iostream>
using namespace std;
#define Max 26
typedef struct node
{
struct node *next[Max];
int num;
}Node;
//建立一個新節點
Node *createNew()
{
Node *p=new Node;
for(int i=0;i<Max;i++)
{
p->next[i]=NULL;
}
p->num=0;
return p;
}
//插入一個字串
void Insert_str(char str[],Node *head)
{
int len=strlen(str);
Node *t,*p=head;
for(int i=0;i<len;i++)
{
int c=str[i]-'a';
if(p->next[c]==NULL)
{

t=createNew();
p->next[c]=t;
p->num++;
//cout<<p->num<<endl;
p=p->next[c];
}
else
{
p=p->next[c];
}
}
}
int Search_str(char str[],Node *head)
{
Node *p=head;
int len=strlen(str);
int count=0;
for(int i=0;i<len;i++)
{
int c=str[i]-'a';
if(p->next[c]==NULL)
{

cout<<"不存在字串"<<endl;
count=0;
return 0;
}
else
{
p=p->next[c];
count=p->num;
}


}
return count;
}
int main()
{
cout<<"nihao"<<endl;
Node *head=createNew();
char s[10];
while(cin>>s,strcmp(s,"quit"))
{
Insert_str(s,head);
}
int c=Search_str("abc",head);
cout<<c<<endl;
system("pause");


return 0;
}

字典樹的典型應用:

1.統計一組字串中某首碼出現的次數(直接用上面的代碼就行)。

2.判斷一組字串中是否有一個字串是另一個字串的首碼。

    分析:我們只要在結點中添加一個nEndFlag成員變數即可。若nEndFlag == 1,說明該結點字元是某一字串的結尾(假設為A),若在插入B字串的過程中經過這一結點,則說明A是B的    首碼;還有一種情況,當要插入最後一個字元c時,卻發現p->next[c-'a']為真,則說明該字串是一個前置詞字元串,eg:先插入abcde,再插入abc這種情況。

3. 串排序:給定N個互不相同的僅由一個單詞構成的英文名,讓你將他們按字典序從小到大輸出


  用字典樹進行排序,採用數組的方式建立字典樹,這棵樹的每個結點的所有兒子很顯然地按照其字母大小排序。對這棵樹進行先序遍曆即可。


     

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.