HAO123的迷思——談談SEO

來源:互聯網
上載者:User

  都時興WEB2.0了,我還打算談SEO,確實有一點落伍。事情是這樣的,我最近要寫一個無聊的方案書,提綱已經擬了一個月了,就是懶得寫本文。所以我決定把內容拆開了寫,獨立成章,這樣可以發揮我離題萬裡的特性。如果萬幸,我能寫完這一系列文章,那每篇刪去50%,就可以組合成那個方案書。這個方式如果多人合作來做的話,似乎就有那麼點WEB2.0的意思了。好象說遠了。

  HAO123的性質我以為應該是非常的明顯,但後來發現即使是很多IT人士,甚至是高手都得出了錯誤的結論。當然這更大的可能是說明我錯了,但我是那種死不認錯的人,你們拿我沒辦法。

  最開始看的一篇文章,是說HAO123充分照顧了初學者的需求,用簡單的頁面羅列最常去的網站LINK,對網友十分友好、方便,所以很多人都把它當首頁。我當時簡直要噴飯,稍微有點常識也不會如此吧?我很刻薄,在評論裡說作者即使只去個人站長圈子的論壇裡看兩天,也不會發出如此無知的言論。

  但最近我發現幾位大腕層級的IT人士,竟然對HAO123也有類似的看法。一人是說中國網民水平低,但他相信如果有更好的網站出現,大家是會接受的,不會只用HAO123。另一人更直接,說他的網站目標就是HAO123,是讓那些連後退鍵都不會使用的網民也能上的網站。

  HAO123到底是什嗎?是低水平網民愛用的,但IT高手看起來傻的網站嗎?雖然我沒見過,但我不排除有人會喜歡HAO123,並主動把它作為起始頁。不過,我覺得把它定位為低水平者愛用的網站,主要是滿足大家了大家當高手的心理:我還是比很多低水平的人強啊。有多少人(比例)會主動使用HAO123?每一個人都說低水平的人喜歡,可低水平的人在哪裡呢?

  HAO123是隨著搜尋引擎成長起來的網站。搜尋引擎已經鑄造了一代人的上網習慣。想一想我們自己,突然想起什麼事,或是遇到一個不懂的詞,都會立刻用GOOGLE或者百度來搜尋一下。在搜尋過程中,我們經常"誤入"類似HAO123的網站:你要去下載軟體,搜到的是一個有一堆該軟體LINK的頁面。當然這也對我們有用,但搜尋引擎直接搜尋到最終頁面,不是更好嗎?為什麼需要這麼一個中間的頁面呢?用術語來說這叫"橋頁"。

  橋頁是SEO常用的手段。所謂SEO是Search Engine Optimization的縮寫,搜尋引擎最佳化的意思。就是說用的手段可以使使用者搜尋東西的時候,讓你的網站排列在靠前的位置。搜尋引擎既然成為了大家的上網習慣,那排列在搜尋結果前面的網站自然會得到更多的流量。HAO123類的網站不僅僅是讓自己網站在一兩個關鍵詞搜尋中排在前面,它首先要讓基本所有熱門搜尋字詞的結果中都會出現它的結果,而即使這個條目列到很靠後的位置,因為搜尋引擎的使用者驚人,還是會帶來些許的PV。而當你被收錄的和熱門搜尋字詞符合的頁面非常多的時候,你的網站流量就會很快上去了。

  要是一個一般網站要做到這個,需要非常大的人力。比如你是軟體下載網站,那要跟蹤很多流行軟體的更新,發現最新開發的軟體,並且要有安裝、使用等一系列常識。而且沒有人可以在各個方面都做到優秀。一個做軟體下載好的網站,不見得做得好MP3,即使也能做MP3,總不能鈴聲圖片也能做?遊戲網址 ,寬頻電影,軟體下載,愛情交友……

  HAO123能做到。因為他們根本不關心最終結果,即使有錯誤也不影響。它要做的就是預先分析最可能的搜尋字詞,然後搜集做這些的網站網址,來一個大匯總。這樣搜尋什麼關鍵詞,它都有一個頁面等著你,這雖然也要花精力,但比維護一個"正常"網站要省力多了。而這些頁面即使不正確,對使用者沒協助,對HAO123也是沒損失的。

  這樣的頁面為什麼會在搜尋結果中排列的還比較靠前呢?首先要說搜尋引擎的收錄機制。你的網頁做的再好,搜尋引擎不知道也是白搭。搜尋引擎會派出它的"爬蟲",一個自動收集網頁的程式,在網上順著串連,把遇到的每一個頁面帶回去放到搜尋引擎的資料庫中。當它遇到HAO123時,它會發現找到了一個"富礦"。

  搜尋引擎的爬蟲不象人那樣聰明,它只能按照固定的規則來收取頁面。這樣它就會比較偏好簡單的、好分析的頁面。如果一個串連是動態,後面有太多的參數,爬蟲處理起來就會很累,有的爬蟲索性不收錄這樣的頁面,因為這樣的動態網頁面可能都是從資料庫中讀取的,理論上可以隨著你的參數不同,變出無數的頁面。也許會構成一個爬蟲永遠走不出的迷宮。現在搜尋引擎都能對付一些動態網頁面,但它們都更喜歡簡潔的固定式頁面面。

  爬蟲喜歡更有效率的工作,收集完一個頁面會沿著頁面上的LINK再收集下級的頁面。這樣我們就能判斷出它偏好的頁面樣子:簡單,沒什麼多餘的看不懂的結構、程式,最好上面有很多的LINK,可以讓自己繼續收集。如果這LINK通往的下級頁面也是這樣,我們可以想象爬蟲會高興的說:可找到你了。我太擬人化了。其實這些是編寫爬蟲程式的工程師們的想法,他們把這寫進了爬蟲的工作規則。HAO123類的橋頁就符合這樣規則。

  爬蟲有多厲害呢,我曾經做過的網站,有一個類似這樣的橋頁系統。平常的訪問很低,40000左右,但有時會突然暴漲到8萬。不用說,我知道,昨天百度的爬蟲來訪問過了。如果你做的對它的胃口,它會老來,每天吃掉你給它提供的頁面。這對搜尋引擎來說是可以理解的,它也希望收集更多的頁面來提供給使用者。(當然我做的不是垃圾網站,這後面還要說)

  解決了收錄這一步,剩下的要由搜尋引擎分析,什麼樣的網站會排到前面。首先同樣它喜歡簡單的頁面,因為它自己智力有限。其次它喜歡符合規則的頁面,有規則它才能判斷。橋頁因為簡單,這兩點都會做的很好。然後因為搜尋引擎沒法用自己使用這些頁面憑感覺來判斷好壞,所以它重要的參考就是如果別處有更多的這個網站串連,那麼說明這個網站更重要。這道理成立,但是橋頁很容易做到了這點,因為它是專門做串連的。它添加了一個網站,要求對方也做它的友情串連是很正常的互換。不過它是專門做這個的,它可以得到的友情串連要比"正常"網頁要多的多。而且這是相互影響的,當它在搜尋引擎地位提高了,它要求別的網站做友情串連時就更可能得到回應,於是形成正迴圈。

  這還是比較"檯面"上的技巧。具體到HAO123來說,它還有一系列同類型的網站。它們之間互相做串連,搜尋引擎也會因此提高所有這些網站的等級,互相促進。據說ALEXA前列的網站中,HAO123的所有者還有至少10幾個同類型的網站。

  若這些還算只欺騙搜尋引擎的話,剩下的行為就更讓那些要學習HAO123的IT大腕考驗自己的良心了。HAO123早期是靠病毒修改使用者首頁的。不僅僅它這麼做,它的一系列網站也都這麼做,據說它還用過QQ病毒傳播。這些現在已經找不到痕迹,它已經成功洗白了自己。但有一點還存在,就是網頁總會跳出來提示,讓你把HAO123設為首頁。即使現在HAO123本身不這麼做了,它的子網站依然還有這麼做的痕迹。你可能訪問一個看起來無關的網站,而把HAO123設成了首頁。HAO123就是靠它SEO的一系列網站,成功的讓很多電腦把它設成了首頁。

  這也是某些觀察家們所說的,低水平使用者歡迎,甚至喜歡到會把它設成首頁的地步。我們去網吧看看,也確實能發現很多機器這樣,因為大家對網吧的機器更不在乎,讓我按"確定"我就按唄。網吧確實是中國特色,但我不認為HAO123是某些IT人士理解的中國特色。順便說一句,要瞭解一般網民習慣的IT人士請抽出時間,定期去網吧。先觀察大家在幹什麼、比例,然後再著重看某一個瀏覽頁面的人,看他上網具體的點擊習慣,和遇到的困惑。最後找台機器,把記錄考下來,發到自己郵箱裡,回去做網站訪問分析。多做點基本功,別老暢想。

  又說遠了。

  SEO手段還有很多,很細緻具體。我只重點說了橋頁。一方面我不可能詳細介紹,這可以寫專著了。另一方面很多技巧我也不知道。但大家只要想一下,很多站長靠這個就可以吃飯了,就明白這是一個很複雜的系統。

  所以說HAO123類網站在某種程度上是寄生在搜尋引擎上的,而不是為了滿足低水平使用者需求。某種意義上我們說"純潔"的GOOGLE其實也助長了垃圾網站的產生。我要是GOOGLE,早把此類網站手動清除了。但GOOGLE 的原則是相信程式,不會人工幹預。另外它們雖然反對(並準備懲罰)橋頁類的SEO,但可能對中國類型的橋頁應用還不是很重視吧,做起來確實沒看到什麼成效。百度就更奇怪了。HAO123已經靠流量賣廣告實現了贏利,被收購也不奇怪。但誰收購它也不應該是百度收購,因為SEO網站的技巧,搜尋引擎最清楚。誰需要SEO的網站,也不該是百度需要。那些說百度需要一個靜態目錄網站來協助完善的人,完全混淆了dmoz.org類的INDEX服務和HAO123類網站的區別。但這些外人可能混淆,做搜尋引擎的人不會混淆。那麼為什麼收購HAO123呢?

  我不喜歡簡單嘲弄收購傻,能花幾千萬的人都不會太傻。回憶一下,那些我們曾經見過的最傻的網站燒錢行為。嘲笑他們傻?但誰傻了呢?每個過手的人都可能賺的腦滿腸肥。誰傻?是他們還是我們這些沒賺到錢的看客?呵呵,看出來了吧,我開始往惡意度人的道路上引導大家。

  最會SEO的是誰?當然是掌握全部搜尋引擎規則的人。誰掌握全部規則?要是這個人後來又收購了該SEO網站,他傻?呵呵,我本能的反射是:洗錢。當然了,我沒有說我這感覺是對的。反射嘛,不走腦子,也不負責任。只不過暴露一下我的陰暗心理。

  第N次說遠了。

  SEO是不是一無是處?不是。搜尋引擎已經成為使用者習慣,適應使用者習慣本來就是我們應該做的。搜尋引擎是告戒大家不要去適應引擎,只要適應使用者,自然會在引擎上體現。理想情況當然是這樣。但我可以舉例。某個很有名的BLOG,當別人問為什麼搜尋到該BLOG文章時,列出的不同文章標題都是一樣的?答:因為工程師圖省事,是用一段JS程式來改寫某個頁面的TITLE。

  TITLE就是我們開啟瀏覽器顯示在左上方的東西,這個如果顯示的是具體內容的標題,當然比千篇一律的顯示該網站的名稱要符合使用者習慣。但用JS來實現該功能,開發上更省事,對使用者來說也沒什麼大區別。按照搜尋引擎的只要適應使用者原則,應該對該做法一視同仁。但搜尋引擎不是人,它很笨。它不會看JS顯示的結果,它對JS的態度是直接跳過,只去讀它讀的懂的簡單東西。

  而很不幸,一般來說TITLE是搜尋引擎判斷頁面是否符合搜尋字詞的重要因素。所以用這個很方便的對使用者也很友好的方式,對網站訪問卻很吃虧。如果你想改進,就一定不能只考慮使用者,而要專門考慮搜尋引擎,也就是SEO。

  所以,我前面說的要學習HAO123的大腕其實他的網站是很適合SEO的網站,只要他不認為HAO123確實方便使用者,他去採用SEO技巧其實是很對路的----只要你做的本身對網民有用,而不僅僅是垃圾,那麼期望通過搜尋引擎帶來更多的網民訪問就無可非議。

  又比如橋頁,我說的我曾經做的類似橋頁,其實是一個排行列表。它是有一個無數LINK的,假靜態頁。但這個頁對使用者來說是有價值的,從這個頁面找所需要的東西就是很方便。雖然我做了專門對搜尋引擎的最佳化,但不能說我的SEO是不對的。這個頁成為搜尋引擎收錄這個網站的入口。因為每個LINK後面對網民都有價值,所以希望他們從搜尋引擎找到這些頁,就不是垃圾SEO。

  其實所謂WEB2.0(我非常討厭這個詞)的一些東西恰恰無形中適應了SEO要求。比如RSS,這樣規範的XML語言對搜尋引擎非常友好。所以BLOG類的網站在GOOGLE相關結果上都會排的比較高(當然了GOOGLE的規則本身也對這類網站有利,這個從其他地方能看出來,就不深說了)。還有WEB2.0站台碼都很規範、簡潔,不為SEO考慮,這本來也是我們應該做的。早期國內門戶繁雜的頁面,混亂的代碼,影響了大家的審美是小事,代碼混亂對開發、再組織,都會是很頭疼的事。所以某種意義上,我們的大站、門戶,還不如HAO123做的好。

  我們看FLICKR,沒有人會說它試圖SEO吧?但你看,它分給每個人地址就是http://www.flickr.com/photos/williamlong/ 這樣簡單。僅僅這個很多網站還能做到,但它裡面所有的串連,都是假靜態地址形式,這就很考驗工程師的水平和耐心了。難道它不知道動態串連開發起來要簡單的多嗎?對於FLICKR的細緻我們不能只佩服,要去學到它每一點小地方的用意。

  所以SEO雖然產生了很多垃圾網站,但一個優秀的網站,它也應該去學習SEO技術,協助搜尋引擎,也同時協助網民,最重要的是這會協助它自己。(轉自天涯,作者:煎餅)



相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.