1、 學會分析網站日誌
在網站日誌中我們可以看出很多問題,網站日誌可以記錄各搜尋引擎蜘蛛機器人爬行網站的詳細情況,例如:哪個IP的百度蜘蛛機器人在哪天訪問了網站多少次,訪問了哪些頁面,以及訪問頁面時返回的HTTP狀態代碼。
如何查看網站日誌?
網站日誌一般存放在虛擬機器主機的logfiles檔案夾下,可以通過FTP工具將網站日誌下載下來,通過txt文檔方式查看。在日誌中我們常會看到這個代碼,以下是百度和google蜘蛛機器人正常爬行代碼(不同作業系統日誌格式不一樣)
2009-11-16 16:07:29 W3SVC181 218.16.119.161 GET /blog/post/373.html – 80 – 220.181.7.103 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 30999
2009-11-16 16:07:00 W3SVC181 218.16.119.161 GET /blog/feed.asp cate=3 80 – 203.208.60.164 Mozilla/5.0+(compatible;+Googlebot/2.1;++http://www.google.com/bot.html) 200 0 0 13205
這裡面需要知道的,就是那個奇怪的數字“200”(另外那個數字表示抓取的檔案大小)。“200”就是HTTP狀態代碼。一般顯示200表示正常收錄,如果在搜尋中找不到,那就是還沒有放出來。
SEO過程中最常見的HTTP狀態代碼有:
* 200 – 伺服器成功返回網頁
* 404 – 請求的網頁不存在
* 503 – 伺服器逾時
網站日誌是我們SEO人必須學會看的一個檔案,當你網站收錄不好時,網站日誌會告訴你答案,搜尋引擎蜘蛛機器人有沒爬行你的網站,如果爬行了,顯示的狀態是什麼。
2、你的網站內容是原創,還是採集?
搜尋引擎都特別喜歡原創,如果你是採集怎麼辦?愛煮飯建議你通過良好的布局和內鏈結構來解決,採集方法我會在以後的文章詳細介紹。
3、 網站外鏈品質和數量
從網站收錄角度看,你的外鏈越多,你的網站被搜尋引擎蜘蛛機器人爬行的機會就越多,只有搜尋引擎蜘蛛機器人來爬行了,你的網站內容才有可能會被收錄。
4、 網站開啟速度
當一個網站收錄量不理想,大家就應該去看看那些頁面是不是被搜尋引擎爬蟲瀏覽過。如果一個頁面都沒有被搜尋引擎爬蟲瀏覽過,是不可能會被收錄的。一個網站的收錄量沒有上去,那SEO流量的提升就會有很大的一個瓶頸。