oracle全文檢索索引

來源:互聯網
上載者:User

標籤:des   blog   http   java   使用   io   資料   for   

轉載自:http://blog.sina.com.cn/s/blog_613fee860100yhyz.html

 

1.需要對ctxsys使用者解鎖,以獲得ctx_ddl包的操作權。
進入system使用者,輸入如下命令,解鎖ctxsys使用者
alter user ctxsys account unlock;
然後將ctx_ddl包的操作許可權賦給ctfs使用者。
也是在system使用者下,輸入如下命令,賦予目標使用者ctx_ddl包操作許可權
grant execute on ctx_ddl to ctfs;
至此,準備工作已經完成了。

2.建立分析器
這裡使用chinese_vgram_lexer這個分詞器,用ctfs使用者登入,執行下面的命令,建立分析器。
exec ctx_ddl.create_preference(‘ctfs_lexer‘,‘chinese_vgram_lexer‘);
這句話的意思是,建立一個“chinese_vgram_lexer”分析器,名稱為ctfs_lexer。

3.建立過濾片語
用ctfs使用者登入,執行下面的命令,建立過濾片語
exec ctx_ddl.create_stoplist(‘ctfs_stoplist‘);
建立過濾片語成功以後,需要自訂需要過濾的片語
exec ctx_ddl.add_stopword(‘ctfs_stoplist‘,‘有限公司‘);

4.建立表索引
create index ctfs_buy_service_index on ctfs_buy_service(keyword_) indextype is ctxsys.context parameters(‘lexer ctfs_lexer stoplist ctfs_stoplist‘);
create index ctfs_supply_service_index on ctfs_supply_service(keyword_) indextype is ctxsys.context parameters(‘lexer ctfs_lexer stoplist ctfs_stoplist‘);

5.使用索引
select score(1),b.* from ctfs_buy_service where contains(keyword_,‘java開發‘,1)>0 order by score(1) desc;
這裡的score是oracle全文檢索索引對關鍵字的匹配程度所計算的分數,contains裡的最後一個參數“1”就是對這個分數的一個標識

6.索引最佳化(用於資料變動時:添加、刪除、修改)
索引同步:
exec ctx_ddl.sync_index(‘ctfs_buy_service_index‘);
exec ctx_ddl.sync_index(‘ctfs_supply_service_index‘);
索引最佳化:
exec ctx_ddl.optimize_index(‘ctfs_buy_service_index‘,full);
exec ctx_ddl.optimize_index(‘ctfs_supply_service_index‘,full);

7.使用者輸入關鍵詞切詞
要實現這種效果,需要用到oracle 10g的新特性,可以將傳入的關鍵詞先進行切詞,然後在進行檢索。
首先需要先建立一個POLICY過程
exec ctx_ddl.create_policy(‘ctfs_policy‘,lexer => ‘ctfs_lexer‘);

這裡建立了一個名稱為ctfs_policy的policy過程,分析器用到了前面建立的ctfs_lexer分析器。
寫一個oracle函數,來處理關鍵詞切詞:
create or replace function p_split_chinese(p_input in varchar2)
    return varchar2
    as
        v_tab ctx_doc.token_tab;
        v_return varchar2(32767);
    begin
        ctx_doc.policy_tokens(‘ctfs_policy‘,p_input,v_tab);
        for i in 1..v_tab.count loop
            v_return := v_return||‘,‘||v_tab(i).token;
        end loop;
        return ltrim(v_return,‘,‘);
    end;
/

在plsql 中執行這個函數
select * from ctfs_buy_service where contains(keyword_,p_split_chinese(‘java開發‘),1)>0;

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.