仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
搜尋引擎經過幾年的發展和摸索,越來越貼近人們的需求,搜尋引擎的技術也得到了很大的發展。 搜尋引擎的最新技術發展包括以下幾個方面:
一、提高搜尋引擎對使用者檢索提問的理解
為了提高搜尋引擎對使用者檢索提問的理解,就必須有一個好的檢索提問語言,為了克服關鍵字檢索和目錄查詢的缺點,現在已經出現了自然語言智慧答詢。 使用者可以輸入簡單的疑問句,比如「how can kill virus of computer?」。 搜尋引擎在對提問進行結構和內容的分析之後,或直接給出提問的答案,或引導使用者從幾個可選擇的問題中進行再選擇。 自然語言的優勢在於,一是使網路交流更加人性化,二是使查詢變得更加方便、直接、有效。 就以上面的例子來講,如果用關鍵字查詢,多半人會用「virus」這個詞來檢索,結果中必然會包括各類病毒的介紹、病毒是怎樣產生的等等許多無效資訊,而用「how can kill virus of computer?」, 搜尋引擎會將怎樣殺病毒的資訊提供給使用者,提高了檢索效率。
二、對檢索結果進行處理
1)基於連結評價的搜尋引擎
基於連結評價的搜尋引擎的優秀代表是Google,它獨創的「連結評價體系」是基於這樣一種認識,一個網頁的重要性取決於它被其它網頁連結的數量,特別是一些已經被認定是「重要」的網頁的連結數量。 這種評價體制與《科技引文索引》的思路非常相似,但是由於互聯網是在一個商業化的環境中發展起來的,一個網站的被連結數量還與它的商業推廣有著密切的聯繫,因此這種評價體制在某種程度上缺乏客觀性。
2)基於訪問大眾性的搜尋引擎
基於訪問大眾性的搜尋引擎的代表是direct hit,它的基本理念是多數人選擇訪問的網站就是最重要的網站。 根據以前成千上萬的網路使用者在檢索結果中實際所挑選並訪問的網站和他們在這些網站上花費的時間來統計確定有關網站的重要性排名,並以此來確定哪些網站最符合使用者的檢索要求。 因此具有典型的趨眾性特點。 這種評價體制與基於連結評價的搜尋引擎有著同樣的缺點。
3)去掉檢索結果中附加的多餘資訊
有調查指出,過多的附加資訊加重了使用者的資訊負擔,為了去掉這些過多的附加資訊,可以採用使用者定制、內容過濾等檢索技術。
三、確定搜尋引擎資訊搜集範圍,提高搜尋引擎的針對性
1)垂直主題搜尋引擎
網上的資訊浩如煙海,網路資源以十倍速的增長,一個搜尋引擎很難收集全所有主題的網路資訊,即使資訊主題收集得比較全面,由於主題範圍太寬,很難將各主題都做得精確而又專業,使得檢索結果垃圾太多。 這樣以來,垂直主題的搜尋引擎以其高度的目標化和專業化在各類搜尋引擎中佔據了一系席之地,比如象股票、天氣、新聞等類的搜尋引擎,具有很高的針對性,使用者對查詢結果的滿意度較高。 作者認為,垂直主題有著極大的發展空間。
2)非www資訊的搜索
提供FTP等類資訊的檢索
3)多媒體搜尋引擎
多媒體檢索主要包括聲音、圖像的檢索。
四、將搜尋引擎的技術開發重點放在對檢索結果的處理上,提供更優化的檢索結果
1)純淨搜尋引擎
這類搜尋引擎沒有自己的資訊採集系統,利用別人現有的索引資料庫,主要關注檢索的理念、技術和機制等。
2)元搜尋引擎
現在出現了許多的搜尋引擎,其收集資訊的範圍、搜索機制、演算法等都不同,使用者不得不去學習多個搜尋引擎的用法。 每個搜尋引擎平均只能涉及到整個www資源的30-50%(search engine watch資料),這樣導致同一個搜索請求在不同搜尋引擎中獲得的查詢結果的重複率不足34%,而每一個搜尋引擎的查準率不到45%。
元搜尋引擎(metasearch enging)是將使用者提交的檢索請求到多個獨立的搜尋引擎上去搜索,並將檢索結果集中統一處理,以統一的格式提供給使用者,因此有搜尋引擎之上的搜尋引擎之稱。 它的主要精力放在提高搜索速度、智慧化處理搜尋結果、個性搜索功能的設置和使用者檢索介面的友好性上,查全率和查準率都比較高。 目前比較成功的元搜尋引擎有metacrawler、dopile、ixquick等。