FuzzyQuery模糊尋找
/*
* 這種模糊搜尋的方法是根據使用者輸入的單個字進行字串間的尋找,
* 這種演算法被稱為levenshtein演算法。
* 這種演算法在比較兩個字串時會會將動作分為三種,
* 加上一個字母,刪一個字母,改變一個字母。兩個字串之間進行比較時
* 就是在執行將其中一個字串,轉變為另一個字串的操作,
* 沒執行一次上述的操作,則相應的就會扣除一定的分數。
* 當比較完畢後,也就是轉變完成,此時的得分被稱為兩者之間的距離
* 也可以稱為模糊度。
* */
package query;
import java.io.IOException;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.FuzzyQuery;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.MultiPhraseQuery;
public class FuzzyQueryTest {
public FuzzyQueryTest(String INDEX_STORE_PATH){
try{
IndexWriter writer = new IndexWriter(INDEX_STORE_PATH, new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);
//建立3個文檔
Document doc1 = new Document();
Document doc2 = new Document();
Document doc3 = new Document();
Field f1 = new Field("content", "word", Field.Store.YES, Field.Index.TOKENIZED);
Field f2 = new Field("content", "work", Field.Store.YES, Field.Index.TOKENIZED);
Field f3 = new Field("content", "world", Field.Store.YES, Field.Index.TOKENIZED);
doc1.add(f1);
doc2.add(f2);
doc3.add(f3);
writer.addDocument(doc1);
writer.addDocument(doc2);
writer.addDocument(doc3);
writer.close();
IndexSearcher searcher = new IndexSearcher(INDEX_STORE_PATH);
//構建一個Term對象,然後對其進行模糊尋找
Term t = new Term("content","work");
FuzzyQuery query = new FuzzyQuery(t);
//列印查詢結構
Hits hits = searcher.search(query);
for(int i = 0; i < hits.length(); i++){
System.out.println(hits.doc(i));
}
}catch(IOException e){
e.printStackTrace();
}
}
public static void main(String[] args) {
// TODO Auto-generated method stub
System.out.println("即將進行模糊尋找----------------->>>>>>>");
System.out.println("進行中模糊尋找");
FuzzyQueryTest fq = new FuzzyQueryTest("E:\\Lucene項目\\索引檔案");
System.out.println("進行中模糊尋找");
System.out.println("尋找結束----------------------->>>>>>>>");
}
}