仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
國內目前關於元搜索的東西這兩年談得比較少,最近是因為一些原因有關注到國內的搜尋引擎,不經意又翻到關於元搜索的資料,索性就把相關的東西整理一下分享給大家。
公正來說元搜索從理念上來說更接近于使用者的需要,畢竟1+1不一定大於2,但是大於1是一定的。
什麼是元搜索:
元搜尋引擎(Meta-Search Engine)是一種對多個搜尋引擎的搜尋結果進行重新彙集、篩選、刪並等優化處理的搜尋引擎。
相對於元搜尋引擎,可被利用的獨立搜尋引擎稱為「源搜尋引擎」(Source-Search Engine),或「成員搜尋引擎」(Component-Search Engine)。
從功能上來講,元搜尋引擎像是一個過濾通道:以多個獨立搜尋引擎的輸出結果作為輸入,經過一番提取、剔除、萃取等操作,形成最終結果,然後將最終結果輸出給使用者。
元搜索的運行流程:
使用者通過統一的查詢介面輸入查詢請求,元搜尋引擎對查詢進行一定的預處理。
元搜尋引擎根據成員搜尋引擎調度機制,選擇若干成員搜尋引擎。
元搜尋引擎根據選擇的成員搜尋引擎的查詢格式,對原始查詢請就進行當地語系化處理,轉換為成員搜尋引擎要求的查詢格式串。
向各個成員搜尋引擎發送經過格式化的查詢請求,等待返回結果。
收集各個獨立搜尋引擎的返回結果。
對返回結果進行綜合處理,例如,消除重複連結,死連結等,形成最終結果。
以一定的格式將最終結果返回給使用者。
元搜索的特點:
沒有獨立的網頁資料庫。
能夠根據使用者的需求綜合特定的搜尋引擎的搜尋結果。
能夠索引特定類型的搜索,例如圖片、文檔、網頁、視頻等等。
元搜索發展趨勢:
元搜尋引擎的技術研發的研究需要用到了資訊檢索、人工智慧、資料庫、資料採礦、自然語言理解等領域的理論和技術,具有綜合性和挑戰性。
一個理想的元搜尋引擎應該具備以下功能要求:
涵蓋較多的搜索資源,可隨意選擇和調用獨立搜尋引擎,還可根據一定調度策略進行自動調度。
具備盡可能多的可選擇功能,如資源類型(網站、網頁、新聞、軟體、FTP、MP3、Flash、圖像、影視等)選擇、等待時間控制、返回結果數量控制、結果時段選擇、過濾功能選擇、結果顯示方式選擇等。
強大的檢索請求處理功能(如支援邏輯匹配檢索、短語檢索、自然語言檢索等)和不同搜尋引擎間檢索語法規則、字元的轉換功能(如對不支援"NEAR"算符的搜尋引擎,可自動實現由"NEAR"向"AND"算符的轉換等)。
詳盡全面的檢索結果資訊描述(如網頁名稱、URL、文摘、源搜尋引擎、結果與使用者檢索需求的相關度等)。
支援多種語言檢索,比如提供中英文搜索等。
可對結果進行自動分類,如按照功能變數名稱、國別、資源類型、區域等進行分類整理。
可以針對不同使用者提供個人化服務。
在已有的獨立搜尋引擎的基礎上建立一個高效的元搜尋引擎能夠擴展獨立搜尋引擎的處理能力,提高檢索的查全率,並且有可能進一步提高查準率。
但是各個成員搜尋引擎的自治性引起了集成的困難,困難主要來自:檢索介面的差異、文檔索引方法的不同、相關函數的差異、查詢參數的不同、檢索功能的強弱等。 對搜尋引擎檢索效果的評價機制;成員搜尋引擎的自動調度機制;設計了搜尋引擎描述檔方法,使系統具有良好的可擴充性;給出了自己的結果融合演算法;可以更蹤使用者的使用,接受使用者回饋進行自主學習和調整,使系統具有自我調整性。
看了上面的介紹是不是對於元搜索有一定瞭解,國內目前做比較好的元搜索只有比比貓,綜合了包括百度、谷歌、雅虎、搜狗、中搜、有道、Live在內的眾多中文搜尋引擎;國外的元搜尋引擎我推薦大家可以看下Dogpile、Clusty。
原載自XJP的碎碎念:HTTP://www.xjp.cc/2009/04/16/meta-search-engine-guide/