NLPIR Java 加入使用者字典__Java

來源:互聯網
上載者:User

        之前一直沒有試過讀取檔案來加入使用者字典,用的都是 NLPIR_AddUserWord手工添加使用者字典,但是這個方法比較適合添加個別詞,詞一多就不太適合

NLPIR提供了一個NLPIR_ImportUserDict(byte[]sPath)匯入使用者詞典的介面。試著用了下,發現都沒有匯入成功。

原來的版本

 

新版(ICTCLAS2013)應該改為

1.詞語與詞性用TAB鍵隔開;

2.詞與詞,';'貌似不行,我每行一個詞,成功;

 

例如:

中科院 n

分詞系統 n

 

前面是NLPIR初始化

String UserDictPath="../file/test.txt";//使用者字典URLint dict=testNLPIR.NLPIR_ImportUserDict(UserDictPath.getBytes());//返回的結果是使用者詞個數nativeBytes= testNLPIR.NLPIR_ParagraphProcess(sInput.getBytes("utf-8"), 1);nativeStr = new String(nativeBytes, 0, nativeBytes.length, "utf-8");System.out.println(dict+"匯入詞典: " + nativeStr);model.addAttribute("fenci1",nativeStr);testNLPIR.NLPIR_Exit();


 

 結果

 

第一行未使用使用者字典,第二行使用了使用者字典

我加入了的使用者詞:資料結構和資料元素  

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.