網站內部結構最佳化對網站建設起到計劃和指導的作用,對網站的內容維護、後期SEO起到關鍵作用。下面主要從網站結構、頁面元素、導航結構、後期最佳化等方面來講述網站的內部最佳化,從網站建設的前期就為SEO最佳化、後期維護提供方便和基礎。
URL地址最佳化
為網站上的檔案建立具有良好描述性的分類名和檔案名稱,不僅可以更好地組織網站結構,還有助於搜尋引擎更有效地抓取檔案。雖然搜尋引擎能夠抓取複雜的URL,但提供相對簡單的URL,對於使用者和搜尋引擎來說都是有協助的。
最佳化URL結構的主要方法有,網站自始至終都使用一個URL地址,不要來回變更地址,如果用帶www的網域名稱地址,則將不帶www的網域名稱使用301重新導向技術重新導向到主要地址,避免使用大小寫字母的URL,網站的URL盡量使用靜態URL,避免使用動態URL,URL越短越好,URL的內容使用拼音或者英文最好,方便記憶。
對於動態網站來說,使用偽靜態技術可以讓網站的外部看起來和靜態網站一樣,利於搜尋引擎的索引。
目錄結構
目錄結構最好用一級到二級,不要超過三級。目錄的組織方式盡量採用:首頁-》欄目頁-》內容頁。目錄名採用拼音或者英文。避免使用多層嵌套的子目錄。
robots.txt
robots.txt是一種存放於網站根目錄下的文字檔,用於告訴搜尋引擎的爬蟲(spider),此網站中的哪些內容是不應被搜尋引擎的索引,哪些是可以被索引。robots.txt協議並不是一個規範,而只是約定俗成的,通常搜尋引擎會識別這個檔案,但也有一些特殊情況。
當我們不希望網站中的某些頁面被搜尋引擎抓取,也許這些網頁在搜尋結果中出現對於使用者來說並沒多大用處,就可以把這些頁面放在robots.txt裡,這可以保證網站的某些內容不出現在搜尋結果中。
Sitemaps
Sitemaps可方便網站管理員通知搜尋引擎他們網站上有哪些可供抓取的網頁,有點象BLOG的RSS功能,是一個方便自己的服務,如果大家(互連網上所有的資訊源)都採用了這種方式提交自己的更新的話,搜尋引擎就再也不用派出那麼多爬蟲辛辛苦苦的到處亂竄了,任何一個網站,只要有更新,便會自動“通知”搜尋引擎,方便搜尋引擎進行索引。
Sitemaps檔案通常是XML格式的,格式比較簡單,Sitemaps協議以 <urlset> 開始標記開始,以 </urlset> 結束標記結束。 每個網址包含一個作為父標記的 <url> 條目。 每一個 <url> 父標記包括一個 <loc> 子標記條目。<loc>是網頁檔案的網址。此網址應以http開始並少於2048個字元。 <lastmod>表示該檔案上次修改的日期。此日期允許刪除時間部分,例如YYYY-MM-DD。
目前百度、Google、雅虎、微軟等搜尋引擎都支援Sitemaps,Sitemaps的提交可以通過各個搜尋引擎的站長平台提交,也可以將其地址放在robots.txt檔案裡供搜尋引擎查詢,具體方法是:在robots.txt的最後一行增加 Sitemap:http://www.domain.com/sitemap.xml。
網站導航
網站的導航功能對於協助使用者迅速找到他們想要的內容來說是很重要的,它對協助搜尋引擎理解該網站有哪些重要內容同樣非常重要。網站地圖是將網站上用於展示網站結構的網頁以層級式列表的方式展示。網站導航的主要目的是為了方便使用者,但同時它也有利於搜尋引擎對整個網站頁面更全面地抓取。
主要的網站導航方法有,創造一個自然的層疊結構的網站地圖頁面,這個導航頁面可以讓使用者很容易地從主幹頁面找到他們需要的特定內容,有必要的話可以在保證內部連結結構合理的基礎上添加導航頁。
使用麵包屑(breadcrumb)導航模式,麵包屑導航是指在網頁頂端或者底部放置的一排內部連結,它使使用者可以方便地回到上一層結構中的網頁或者首頁。大多數麵包屑導航通常會從最具概括性的頁面開始(通常是首頁),越往右指向的頁面內容越具體,例如“首頁-》欄目-》具體文章標題”。
Nofollow的使用
nofollow標籤是由Google領頭新創的一個標籤,目的是盡量減少垃圾連結對搜尋引擎的影響,減少部落格的垃圾留言,目前百度、Google、Yahoo、微軟都支援這一標籤。當超級連結中出現nofollow標籤後,搜尋引擎會不考慮這些連結的權重,也不用使用這些連結用於排名。
nofollow標籤通常有兩種使用方法:一種方法是將"nofollow"寫在網頁上的meta標籤上,用來告訴搜尋引擎不要抓取網頁上的所有外部和包括內部連結。例如:<meta name="robots” content="nofollow” /> 。另一種方法是將"nofollow"放在超連結中,告訴搜尋引擎不要抓取特定的連結。例如:<a rel="nofollow" href="url"> 。
需要注意的是,如果一個網站鏈向了某些被搜尋引擎認為是垃圾網站的地址,那麼這個網站的權重也會受到影響。因此對於一個網站來說,為了安全保險起見,所有那些有可能是第三方提交的超級連結都應該添加nofollow標籤。
404頁面
404 網頁是使用者嘗試訪問網站不存在的網頁(由於使用者點擊了損壞的連結、網頁已被刪除或使用者輸入了錯誤的網址)時看到的頁面。之所以稱為 404 網頁,是因為針對丟失網頁的請求,網路伺服器會返回 404 HTTP 狀態碼,表明該網頁未找到。
使用者偶爾會因點擊失效的連結或輸入錯誤的URL而訪問一些在網站網域名稱下但並不存在的頁面。使用自訂404網頁能有效地協助使用者回到網站中有效頁面,大大提高使用者體驗。404網頁最好能提供回到網站首頁的連結以及到網站中熱門內容頁面的連結。
通常使用者最好建立一個自訂的 404 網頁,以便獲得這部分使用者流量。一個好的自訂 404 網頁可以協助使用者找到所需資訊、提供其他實用內容及吸引使用者進一步瀏覽使用者的網站。
不過,很多網站設計的404頁面都很簡單,不少網站為了不損失流量,在404頁面裡面自動重新導向到首頁的方式,這並不是一個改善使用者體驗的設計方法。
統計代碼的使用
網站統計分析工具可以深入瞭解使用者是如何找到網站以及他們有哪些行為習慣,同時發現網站上最受歡迎的內容,還可以衡量對網站進行最佳化之後的效果(例如,修改標題和描述性的元標籤有沒有協助增加從搜尋引擎帶來的流量?),還能搞清楚訪問者來自哪裡,訪問者在尋找什麼,訪問者從那些頁面進入,從哪些頁面退出。
使用網站統計分析工具的前提就是要在網站增加統計代碼,目前較為常見的統計工具有百度統計、Google分析等。為了不影響網站的載入速度,統計代碼最好放在網站底部。
添加好統計代碼後,就可以依據網站統計系統進行分析,看看頁面是否需要進一步最佳化。