標籤:des blog http java 使用 io 資料 for
轉載自:http://blog.sina.com.cn/s/blog_613fee860100yhyz.html
1.需要對ctxsys使用者解鎖,以獲得ctx_ddl包的操作權。
進入system使用者,輸入如下命令,解鎖ctxsys使用者
alter user ctxsys account unlock;
然後將ctx_ddl包的操作許可權賦給ctfs使用者。
也是在system使用者下,輸入如下命令,賦予目標使用者ctx_ddl包操作許可權
grant execute on ctx_ddl to ctfs;
至此,準備工作已經完成了。
2.建立分析器
這裡使用chinese_vgram_lexer這個分詞器,用ctfs使用者登入,執行下面的命令,建立分析器。
exec ctx_ddl.create_preference(‘ctfs_lexer‘,‘chinese_vgram_lexer‘);
這句話的意思是,建立一個“chinese_vgram_lexer”分析器,名稱為ctfs_lexer。
3.建立過濾片語
用ctfs使用者登入,執行下面的命令,建立過濾片語
exec ctx_ddl.create_stoplist(‘ctfs_stoplist‘);
建立過濾片語成功以後,需要自訂需要過濾的片語
exec ctx_ddl.add_stopword(‘ctfs_stoplist‘,‘有限公司‘);
4.建立表索引
create index ctfs_buy_service_index on ctfs_buy_service(keyword_) indextype is ctxsys.context parameters(‘lexer ctfs_lexer stoplist ctfs_stoplist‘);
create index ctfs_supply_service_index on ctfs_supply_service(keyword_) indextype is ctxsys.context parameters(‘lexer ctfs_lexer stoplist ctfs_stoplist‘);
5.使用索引
select score(1),b.* from ctfs_buy_service where contains(keyword_,‘java開發‘,1)>0 order by score(1) desc;
這裡的score是oracle全文檢索索引對關鍵字的匹配程度所計算的分數,contains裡的最後一個參數“1”就是對這個分數的一個標識
6.索引最佳化(用於資料變動時:添加、刪除、修改)
索引同步:
exec ctx_ddl.sync_index(‘ctfs_buy_service_index‘);
exec ctx_ddl.sync_index(‘ctfs_supply_service_index‘);
索引最佳化:
exec ctx_ddl.optimize_index(‘ctfs_buy_service_index‘,full);
exec ctx_ddl.optimize_index(‘ctfs_supply_service_index‘,full);
7.使用者輸入關鍵詞切詞
要實現這種效果,需要用到oracle 10g的新特性,可以將傳入的關鍵詞先進行切詞,然後在進行檢索。
首先需要先建立一個POLICY過程
exec ctx_ddl.create_policy(‘ctfs_policy‘,lexer => ‘ctfs_lexer‘);
這裡建立了一個名稱為ctfs_policy的policy過程,分析器用到了前面建立的ctfs_lexer分析器。
寫一個oracle函數,來處理關鍵詞切詞:
create or replace function p_split_chinese(p_input in varchar2)
return varchar2
as
v_tab ctx_doc.token_tab;
v_return varchar2(32767);
begin
ctx_doc.policy_tokens(‘ctfs_policy‘,p_input,v_tab);
for i in 1..v_tab.count loop
v_return := v_return||‘,‘||v_tab(i).token;
end loop;
return ltrim(v_return,‘,‘);
end;
/
在plsql 中執行這個函數
select * from ctfs_buy_service where contains(keyword_,p_split_chinese(‘java開發‘),1)>0;