個性搜尋的技術與市場

來源:互聯網
上載者:User
作者:張中華

      2003年2月,Google 收購了全球最大的Blog 服務之一Blogger.com 的供應商Pyra Labs;2003年9月,Google收購了一家製作個人化和上下文關聯搜尋工具的新興企業Kaltix;2003年10月,Google收購線上廣告網路公司Sprinks;2004年7月,Google宣布收購加州的Picasa數字相片管理廠商;2004年10月,Google收購了總部位於加州的數字地圖服務商Keyhole;2004年12月,Google宣布同世界領先的研究圖書館及牛津大學達成協議,開始把其搜尋內容向數字檔案轉移……這些僅僅是Google推出個人化搜尋的序曲。

現在,Google的股價已經飆升至197.60美元,該公司的市值也因此達到540.27億美元(截至2004年12月31日),可見市場對Google的良好預期。而此時Google對個人化搜尋技術的偏好似乎預示著個人化搜尋將會在搜尋引擎舞台上再創奇蹟。

搜尋技術的新戰場

“個人化”往往是許多商家的制勝法寶,它總是能締造一個又一個的神話,而這條規律對搜尋引擎企業也同樣適用。搜尋引擎已經改變了我們使用互連網的方式,甚至形成了一種“搜尋式”的使用習慣,但這遠遠不夠。搜尋個人化的風暴即將來臨,使用者不僅需要能搜尋到資訊的搜尋引擎,他們更希望做資訊消費的主人,讓搜尋引擎以“我”為中心,而不是“我”以搜尋引擎為中心。

但目前的現狀是,在搜尋引擎面前,各類使用者別無選擇。對個人使用者而言,搜尋引擎服務提供者顯示什麼樣的資訊內容,排列什麼樣的搜尋結果,利用什麼樣的訪問裝置,個人無權選擇;對企業客戶而言,員工不能有效獲得適應業務需求的特定資訊,尤其是整合了內部知識資訊資源和互連網資訊資源的個人化資訊;對廣告客戶來說,結合產品的優質、定向、可追蹤的誘導資訊淹沒在蕪雜的資訊中;而對於網站,無法控制搜尋引擎以提供適合網站特點的資訊源,只能選擇千人一面、千篇一律的搜尋結果,因為提供搜尋服務的主動權壟斷在霸氣十足的搜尋引擎巨頭們的手中……

不過搜尋巨頭們已經意識到,搜尋引擎個人化是在品牌忠誠度以外留住使用者的主要方法,個人化搜尋將成為搜尋技術的新戰場,微軟、雅虎、Google等都在開發個人化的搜尋引擎技術以吸引使用者。

有智慧的“網路蜘蛛”

個人化搜尋的應用需要先進的理念和過硬的技術保證,才能博得使用者的好評。搜尋引擎技術的焦點就是提升使用者的體驗度:精、准、全、快。搜尋速度是搜尋技術商和服務商入行的門票,不會存在問題,但“精、准、全”無一不是和個人化相關的。網路蜘蛛的個人化對搜尋引擎的查全和查准都有重大影響,它決定了搜尋引擎資料容量的大小,而且網路蜘蛛的好壞還會直接影響到搜尋資訊資產庫的品質。

網路蜘蛛就是在網上爬來爬去的爬蟲,它通過網頁的連結地址來尋找網頁,從網站某一個頁面(通常是首頁)開始,讀取網頁的內容,找到在網頁中其它的連結地址,然後通過這些連結地址尋找下一個網頁,這樣一直迴圈下去,直到把這個網站所有的網頁都抓取完為止。如果把整個互連網當成一個網站,那麼網路蜘蛛就可以用這個原理把互連網上所有的網頁都抓取下來。

目前網路蜘蛛基本是瞎眼蜘蛛,依據著簡單可數的幾個規則爬行著,從來就不知道自己要到哪裡去,只會毫無目的地抓取蕪雜的資訊,處理互連網表層資訊,很勤懇但毫無個性。而個人化搜尋引擎則需要有智慧的網路蜘蛛,有方向、有目的、有計劃地抓取資訊,同時肩負著尋找、發現、定位、提交符合要求的資訊的任務。它不僅能自動自發地自我管理,而且能感知自身所處的環境並作出反應;不僅具備專業的知識,而且具有學習能力;對資訊的處理不僅有廣度,而且有深度;不僅有預先處理也有後處理。

智慧的網路蜘蛛的爬行、搜尋引擎個人化,想解決的最根本的問題就是能讓使用者DIY出來一個屬於自己的獨一無二的搜尋引擎。而真正的個人化搜尋要能做到資訊類型的個人化、資訊內容的個人化、資訊裝置的個人化和搜尋過程的動態化。

需求技術兩重天

雖然個人化搜尋引擎的新鮮出爐吸引了許多使用者的目光,但目前的搜尋引擎技術還和使用者的期望相去甚遠,它並不能智能化地理解人類的想法,並與人類的生活完全結合。需求的前瞻性與技術的滯後性在任何領域都是一對雙生兒,如何找到這兩者的平衡點,是我們不得不面對的問題。目前,個人化搜尋引擎面臨的技術挑戰還有很多:

基於語義的多媒體搜尋技術還不成熟,比如搜尋圖片時還只能通過周圍相關的文字進行判斷,而無法根據圖片本身的資訊提供檢索。

搜尋引擎的關鍵詞很容易只輸入一個或者更少的,搜尋引擎無法理解使用者真正的搜尋需求,因此只能將各種結果全部排列出來。自動聚類技術雖然在處理這方面的問題做了一些嘗試,但並沒有帶來太大的改觀。

由於網路上更多的資源和有用的資料以資料庫的形式存在,而搜尋引擎的蜘蛛在爬行這些動態網站的過程中很容易陷入死迴圈,很多搜尋引擎都對深度進行了限制,這卻使得搜尋引擎能獲得的資料量達不到整個網路資料量的30%。

搜尋引擎現在仍然需要依賴於瀏覽器作為提供檢索服務的載體,這大大限制了搜尋引擎個人化的範圍。雖然Google已經開始測試無線購物搜尋服務,聯索科技也開始提供通過手機來搜尋商品及優惠券派送的服務,但要完成的工作還有很多。

差別創造價值

未來的個人化搜尋技術會將使用者的主觀能動性發揮到登峰造極的地步。與其它服務最大的差別就是,搜尋服務完全出於使用者的主觀意願,當互連網第二階段的特徵由被動的“注意力”上升為主動的“搜尋力”,中外搜尋技術供應商各有特色的商業模式和企業戰略便不得不圍繞著這個主觀性很強的技術展開。

不管商業競爭多麼激烈,商業運作如何各有千秋,關鍵的一點還是只有“差別”才能創造價值,技術是關鍵出路之一。表面的個人化並不能代表技術的全部,包括部落格、新聞彙總器、郵件及立即訊息,這僅僅是搜尋領域裡個人化意識複蘇的可喜變化,深入的問題亟待業內高手精心研磨,終究會有人推出新的技術或搜尋工具重新創造資訊返回的途徑,這隻不過是時間的問題。

但是不可忽視的事實是,許多曾經風光無限的搜尋引擎逐漸淡出人們的視線,這一過程中,技術的重要性被極大地凸顯出來,所以多數市場參與者無不重視搜尋技術的研發投入,以期能在將來的市場發展中佔得優勢,不切實際的炒作和浮誇只能導致企業迷失自身的發展方向。


相關文章

Beyond APAC's No.1 Cloud

19.6% IaaS Market Share in Asia Pacific - Gartner IT Service report, 2018

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。