互連網資訊搜尋技術—對稱搜尋

來源:互聯網
上載者:User
互連網

資訊搜尋是互連網資訊共用領域不可阻擋的使用者需求。搜尋技術的突破性進展對於互連網本身和互連網使用者來說同樣舉足輕重。

搜尋技術發展現狀

第一代搜尋引擎採用的基本方法是由網頁製作人自行建立網站名稱、網站內容的文字摘要,並將其加入到搜尋引擎的資料庫中。搜尋引擎根據使用者鍵入的資訊進行匹配、排序和顯示。這種方法的最大缺點是無法針對網頁內容進行全文檢索搜尋;另外,它必須由網頁製作者自行鍵入供搜尋的資料。

第二代搜尋引擎採取的基本方法是由搜尋引擎使用一個程式在網路上擷取資料,並自動將得到的結果存入資料庫中。搜尋引擎根據使用者鍵入的資訊進行匹配、排序和顯示。它的優點是:不需要網站製作人單獨鍵入供搜尋的資訊,並且從理論上講,可將任意網站的所有網頁加入到它的資料庫中。而它最大的缺點是搜尋到的結果太多,實際上使用者仍然難以找到真正想要的資料,並且資料庫容量呈不斷膨脹的趨勢。

如何從龐大的資料庫中精確地找到正確的資料,已被公認為是下一代搜尋技術的競爭要點。

' 當前新興的技術有:

● 智能搜尋

其基本方法是通過對搜尋內容相關性的自動學習,提高搜尋結果的可用度。但問題是面對海量且龐雜的資訊發布內容,如果沒有一個在發布端和檢索端共用的資訊匹配模組,僅靠智能搜尋很難根本改善資訊搜尋的精確度,使使用者真正需要的資訊一定顯示在前兩三頁搜尋結果之中。

● 垂直搜尋 是針對映像資訊、音樂資訊等領域的搜尋技術。

P2P搜尋是未來的搜尋技術之一,它的基本方法是使用者共用所有使用者硬碟上的檔案、目錄乃至整個硬碟。搜尋無需通過Web伺服器,也可以不受資訊文檔格式和宿主裝置的限制,可達到傳統目錄式搜尋引擎(只能搜尋到20%~30%的網路資源)無可比擬的深度(理論上將包括網路上所有開放的資訊資源)。P2P搜尋的首要問題是解決資訊匹配精度問題,以及有可能帶來的個人資訊和公用資訊的失衡。電腦中儲存的資訊通常是個人資訊,而伺服器中的網站資訊才是公用資訊的主流。

未來另一種搜尋技術是“資訊服務網路”,其主要特點是它不僅包括電腦和網頁資訊的搜尋,而且包括各種資訊資源,例如資料庫、軟體以及各種資訊擷取裝置的資訊處理功能一體化。整個網路如同一台巨大無比的電腦,向每個使用者提供一體化的服務。它的主要問題與開展電子商務有某種相似性,即整合所有資訊服務環節和相關技術需要建立統一的標準,而這類標準的建立和推廣絕非三五年之功,並且很難想像只有一種標準出現。另外,從商業角度看,服務的效能價格比也是令人擔憂的問題。

對稱搜尋技術

1.對稱搜尋原理

從本質上講,“發布資訊”和“檢索資訊”是一種對稱的資訊溝通需求。因此,我們可以建立“發布資訊”和“檢索資訊”的對稱資料庫和對稱搜尋技術。而現有搜尋技術的盲點在於,浪費了資訊檢索方在資訊檢索時付出的大量勞動和龐大的資訊資源。

2.對稱搜尋的實現

(1) 建立“對稱資訊摘要通用模版”,其中包括髮布/擷取選擇、資料類型、內容摘要、發行者網域名稱、郵件地址、發布起止時間;

(2) 建立“對稱資訊摘要”資料庫;

(3) 資訊發布和資訊擷取使用者都在“對稱資訊摘要通用模版”上輸入資訊;

(4) 搜尋引擎根據使用者要求,對“對稱資訊摘要資料庫”進行多次匹配;

(5) 根據對稱資訊的匹配程度進行排序;

(6) 根據對稱資訊雙方提供的地址進行匹配結果雙向自動推送;

(7) 由使用者選擇是否連結至相關網站的詳細內容。

資訊分類、資訊摘要、使用者端基本資料是對稱資訊匹配的基本內容,只有合理整合這三類資訊要素,才能設計出一個所有使用者都方便並樂意使用的“對稱資訊人機互動模版”和高品質的“對稱資訊資料庫”。

3.對稱搜尋技術的優越性

對稱搜尋技術使對稱資訊匹配的準確度空前提高;同時,一次性搜尋可多次享用不同時間的搜尋結果,使使用者搜尋操作簡便;另外,摘要資料庫與全文資料庫相比,不會無限膨脹;還有一點很重要,由發布資訊方自行提供摘要資訊和保留時間,加上摘要資料庫空間佔用收費,這實際上是控制垃圾資訊的最有效手段,從而使垃圾資訊大幅度減少。如果既可以大幅度提高資訊發布的針對性,又有操作十分方便的“對稱資訊摘要通用模版”,已經做了網頁和更新了網頁內容的使用者,又豈在乎填一下摘要?

4.對稱搜尋技術的商業應用

(1) 對稱搜尋技術執行個體——“對稱廣告”

互連網現有的廣告形式存在一些缺點,如大幅廣播廣告的成本高,多數中小企業難以承受;分類廣告其資訊發布無強制性,多數廠商和使用者不感興趣;搜尋引擎的隱性廣告要根據廣告方支付費用的高低決定檢索結果排名順序,對使用者不利;郵件廣告僅依靠使用者基本註冊資訊和已有業務的資訊發布廣告,使用者的針對性不強,多數被使用者視為垃圾廣告。

對稱廣告的比較優勢有以下兩方面:一方面,對廣告發布企業而言,前所未有地提高了廣告發布的針對性;其廣告價格任何小型企業都可以承受;同時,企業一次性發布資訊,可多次自動推送至相關客戶;企業可以得到潛在使用者的準確資訊。另一方面,對廣告對象使用者而言,它真正做到使用者需求至上,根據使用者自己提出的具體需求推送廣告資訊,根據廣告資訊和使用者需求資訊的客觀匹配程度進行廣告排序;使用者一次“檢索”資訊,可多次獲得相關資訊的自動推送服務;消除了垃圾郵件,減輕了使用者負擔。

(2) 對稱搜尋的商業運作模式

● 對稱搜尋連鎖經營

各類門戶網站可以通過“對稱資訊資料庫”共用和提供本地客戶結算服務,共用“對稱資訊”資源,聯手實現服務覆蓋面的最大化。

● 對稱廣告瀏覽積分換免費郵箱

郵箱是互連網使用者最無法放棄的鋼性需求。用對稱廣告瀏覽積分換免費郵箱,既是一種使用者可接受的強制廣告方式,也是一種使用者可接受的郵箱變相收費方式。

由於網上對稱廣告具有難以取代的效能價格比,因此可以預計,對稱廣告作為一種廉價通用的點到點廣告方式,將成為大多數中小企業首選的廣告投放方式,從而為互連網廣告業帶來光輝燦爛的明天!

5.對稱搜尋技術的擴充

如果能夠提供“對稱資訊”的高品質多語種轉換技術,便可實現無語言障礙的“對稱資訊”全球通用檢索服務。而“文本語義人機互動統一編碼技術”、“全域數位知識資訊定位技術”在解決多語種翻譯品質問題上也已取得決定性突破。因此,預計在一年內,單語種“對稱資訊檢索”服務將進入普及階段;兩年內,使用者即可享受到可靠實用的多語種通用“對稱資訊”檢索服務。



相關文章

Beyond APAC's No.1 Cloud

19.6% IaaS Market Share in Asia Pacific - Gartner IT Service report, 2018

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。