搜尋引擎中用到的一些拆詞方式解析

來源:互聯網
上載者:User
  •   單詞多形態(Word Stemming)

  單詞多態,主要是關係到單詞的詞根( stem of a word )和通過這個詞根變化出來的多個詞的過程(Word Stemming),比如,works, 詞根是work,可以變成Worker,Workers,Working,Worked等。搜尋引擎可以利用這個特點進行詞根匹配搜尋。但它不是指“近義詞”。

  •  斷詞(Word Truncation)

  斷詞是取單詞的一部分加上萬用字元進行搜尋。比如:Wor* 可以搜尋出Work,Worker,Working等等的單詞。

  •  近義詞(Synonyms)
  近義詞非常容易理解,就是意義相近,或者意義相同但叫法不同。比如“知了”和“蟬”等。  據瞭解,Google不支援Word Stemming和Word Truncation。百度也有不少新的文法,可能大家都不知道,可以多去瞭解一下,比如用“-”號表示排除等。

(部落格中都為原創,引用請註明出處,風焰莊主)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.