該系列的之前兩篇文章已經把幾乎所有SEO的思想都涵蓋了,如一開始說的那樣,SEO無非是去對搜尋引擎友好、或是對搜尋引擎的方便使用,不可能有再多的了。接下來就會陸陸續續提一些更細節的東西。因為在群博的公開環境下能夠分享的內容有限,所以會偏向一些和SEO效果未必有直接關係,但也應該被SEO所注重的技術層面方面的內容。
對於SEO而言,良好的URL結構是什麼樣的?和前面的文章一樣,讓我們來看下SEO頂尖網站Amazon的做法,這是它的一個產品頁:
http://www.amazon.com/Zune-Video-MP3-Player-Platinum/dp/B002JPITY8
1.
URL的第一段是產品名,以中劃線分隔——Google在其網站站長工具協助中推薦過的符號(略有類似的,百度搜尋引擎友好指南中提出網頁標題與網站名稱間的分隔最好是底線。當然這些和搜尋引擎的識別機制無關,它們無論如何都不可能認不出這些是分隔字元,但對於使用者而言會是相對更友好的。)
2.
dp,或許指的是Detail Product,是產品頁面的特殊標識。只要有這一段URL在,無論是在流量統計工具或是日誌分析中,都可以非常方便的把產品類型頁面的流量等情況給細分出來。
3.
B002JPITY8此類的是商品的ASIN碼,對於每個產品這都是獨一無二的,這樣能保證商品絕對不會重複發布。是每一個產品的唯一標識。
但這樣的URL也存在著一些問題,比如訪問:http://www.amazon.com/abcdefg/dp/B002JPITY8這樣的URL,也會出現和前面相同的頁面。萬一這些頁面被搜尋引擎收錄的話,至少是對SEO絕無好處的。(不排除少數情況下競爭者會以此陷害自己網站SEO的可能性)
那麼技術上的解決方案是什麼呢?如果去問程式人員,他們或許給出的方案是:當頁面被請求時,讀取URL第一段,並將其與產品的名字對比。如果吻合即返回正常頁面,不然拋出404異常。
但SEO上面有更好些的方案,直接輸出一個canonical屬性來指定規範的網址就好了,Amazon正是這麼做的。這是一個用來處理網址正常化的標籤,在Google網站站長工具協助裡面有說明:http://support.google.com/webmasters/bin/answer.py?hl=zh-Hans&answer=139394(而百度是否支援canonical標籤我也不確定)
但Amazon做的還不止是這些,對於URL第三段的ASIN碼,還有其它玄機在。這是Amazon官網上對ASIN碼的說明中的一小段:
You will find an item’s ASIN on the product detail page alongside further details relating to the item, which may include information such as size, number of pages (if it’s a book) or number of discs (if it’s a CD).
大意是很多對於產品而言很多關鍵的參數資訊,都被記錄在了這短短一小段ASIN碼中,這樣資料分析的時候就能以它來判斷哪類產品賣得好等等。且加密過的ASIN碼也可以使得競爭者無法輕易的獲知自己的資訊。
綜合已經提到的一些,和另一些限於篇幅還沒提到的因素,這邊將URL結構在SEO裡面額外需要注意的地方按大致重要性列出:
1. 唯一性(保證頁面不能重複)
2. 易分析性(最多用一個簡單的正則即可將一類頁面細分出來,能夠不用正則的話最好)
3. 語義化(如example.com/blog/1.html, example.com/gallery/2.html,讓使用者只通過看URL就知道自己將訪問的是什麼樣的頁面)
4. 程式實現起來的效率
沒法說那一種URL結構絕對是完美的。依網站類型、規模等等因素的不同,也得看網站技術架構上如何更便捷,可能還要參照其它各個部門的需求,最終的URL形式自然是需要權衡各方面的利弊來得出的,這邊也就不妄論了。
原文地址:http://semwatch.org/2012/03/seo-practice-4/
SEO實踐(3) 讓網站對搜尋引擎的方便使用
SEO實踐(2)——讓網站對搜尋引擎友好
SEO實踐(1)——開展SEO前的資料準備