最近國內搜尋行業最大的事莫過於360搜尋的推出,不少人在微博和部落格留言裡問我對360搜尋有什麼評論。作為一個以網路為生卻無法感性體驗國內互連網氛圍的SEO,我其實對幾個搜尋引擎的廝殺、又有誰加入戰局、各自使用了什麼招數之類的事情不太關心,誰贏都沒關係,誰贏了、誰佔了一定市場份額,再去琢磨一下怎麼在這個搜尋引擎排名就行了,如此而已。
不過還是談幾點對360搜尋的印象。
首先,目前360搜尋的結果品質相當高,越是常用詞,搜尋品質越高,長尾詞則品質下降。如果確如360自己所言,360搜尋是他們自己的技術,那相當不容易。要知道,搜尋引擎是個需要積累的、高技術含量的東西。這裡說的積累,不僅是人才(這個倒可以短時間解決),還有演算法的修改評測和資料的累積。尤其是資料的累積,這個幾乎無法短時間彌補。如果360搜尋在沒有曆史資料累積的情況下達到目前水平,那是相當驚人地牛X的。看看百度、Google之外的其它搜尋引擎的品質就知道這有多難了,包括Bing,以微軟在人才、資金上的投入,又做了那麼多年的搜尋,到現在也沒怎麼樣。
不過呢,360搜尋是否真的是他們自己的技術,我有高度疑問。除了上面說的難度問題,還有一些對排名結果的觀察。根據我關注的一部分關鍵詞的排名對比和記錄資料,360搜尋的結果很像百度結果最後排名調整前的資料,而且是一段時間以前的。
這裡可能需要說明一下“最後排名調整”指的是什麼。搜尋引擎收到查詢詞,在資料庫中按正常演算法找到應該排前1000名(Google)或前760名(百度)的URL後,並不是馬上直接顯示出來,而是要在這1000個或760個結果中再最後調整一下排名,包括某些過濾演算法的加入、這些URL之間連結關係的再計算等等。所以,我們有時候會在百度第76頁看到一些很熟悉的、曾經風光過、現在被某種形式懲罰的網站。也不一定總是第76頁,經常也出現在最後幾頁,比如seowhy.com的首頁現在就在第75頁。這些網站既然被降權或懲罰了,乾脆找不到不是更合適嘛?為什麼放到第76頁去?原因很可能就是這是返回結果之後再最後調整的結果。
這種水平的高度相似,如果解釋為巧合,或排名演算法的相似,我比較難以相信。在資料量很大的情況下,演算法的任何微小差異都將導致結果的明顯差別。而且,在360正式推出之前,好像沒人聽說過有什麼360蜘蛛。這個姑且不說了,可以解釋為匿名蜘蛛,雖然匿名爬行網站是相當不尊重站長的行為。
我當然不能肯定360結果就是,或者很大程度上是,百度最後調整前的資料。外人無法肯定。我只能說很像。
網上有人覺得360搜尋是整合了百度和Google結果後再調整排名,我倒不覺得。整合其它搜尋引擎資料的所謂“元搜尋引擎”一直存在,如現在居然還活著的dogpile。不過360搜尋能即時這麼做的可能性很低,百度、Google怎麼可能允許呢,360真這麼做的話早就被屏蔽了(換IP也一樣能屏蔽)。
那麼360怎麼會有百度的資料呢?真的建個關鍵詞庫然後去抓取百度搜尋結果?怎麼想怎麼不可能啊,那太雷人了。百思不得其解,哪位知道指點我一下。又或者是我的幻覺?360真的完全是自己的技術?
至於360以後會佔多少市場份額,這個和搜尋技術、搜尋品質似乎關係不大,要看360搜尋商業模式的發展、哪個巨頭更黑、更狠。最後補一句,在任何市場裡,有競爭都是好事。