摘要: 作為一名站長不但要懂得如何寫原創,如何發外鏈,還要學會分析網站的日誌。 站長會分析網站的日誌,就能瞭解你的網站在搜尋引擎中是否比較重要。 通過網站日誌你能得到哪些重要
作為一名站長不但要懂得如何寫原創,如何發外鏈,還要學會分析網站的日誌。 站長會分析網站的日誌,就能瞭解你的網站在搜尋引擎中是否比較重要。 通過網站日誌你能得到哪些重要的資訊,下面來詳細說明下:
一、看網站的抓取情況
1、新站剛上線,看看搜尋引擎有沒有來你網站抓取了;
2、網站收錄異常,或者被k,通過日誌可以瞭解搜尋引擎是否還有來光顧你的網站;
3、對於網站的問題進行解決,必須要讀懂日誌;
二、怎麼查找網站日誌?
一般在FTP一個名為logs的資料夾,不同的伺服器可能日誌檔命名不一樣,不過一定會包含logs這個關鍵字,如下圖:
三、怎麼打開日誌?
下載,解壓後,可以用文字編輯器打開,如果打開是亂碼的話,可以用Editplus或dreamweaver等網頁編輯器打開。
四、各大搜尋引擎蜘蛛名稱:
打開日誌後我們可以看到如下的這些搜尋引擎蜘蛛名稱,分別代表的就是哪個搜尋引擎到過你的網站。
百度:baiduspider
Google=Googlebot
Msn:msnbot
yahoo:Slurp
yodao:YoudaoBot
sogou:Sogou+get+spider
360:360Spider
五:日誌拆解
在日誌裡面搜索下以上蜘蛛的名稱就能清楚瞭解蜘蛛有沒有來過你的網站,並且知道蜘蛛抓取你的網站頁面情況。
123.125.71.33 - - [19/Apr/2013:00:47:39 +0800] "GET /page/contact/contact.php HTTP/1.1" 200 21978 "-" "Mozilla/5.0 (compat ible; Baiduspider/2.0; +HTTP://www.baidu.com/search/spider.html)"
具體分析如下:
123.125.71.33 訪問IP
[19/Apr/2013:00:47:39 +0800] 存取時間與時區
GET /page/contact/contact.php HTTP/1.1 根據HTTP/1.1 協定 抓取(功能變數名稱下)/page/contact/contact.php 這個頁面(GET表示伺服器動作)
200 伺服器回應狀態碼。
21978 表示抓取了21978個位元組。
Mozilla/5.0 表示訪問者使用火狐瀏覽器訪問端資訊
六、網站日誌對seo有關于的資訊
不同的伺服器或虛擬主機設置的日誌記錄內容不同。
有的如:200 0 33834 237 953 我們通過多看幾條記錄,觀察規律,可以判斷第三個數字代表位元組數。
有的如:200 0 0或200 0 64 這是沒有記錄抓取位元組數。 注意:200 0 0和200 0 64 沒代表什麼問題。 所謂200 0 64代表要被K的言論沒有根據,一般的網站都有64代碼。
在日誌裡,發現比較多的HTTP狀態碼是,200(正常)、304(沒變化)、404(錯誤連結)。
304代表,自從上次抓取後,該內容沒有更新。 一般情況下,網站的圖片經常會返回該值。
404代表,訪問的這個連結是錯誤連結。 這個錯誤連結,一方面來自原本存在後來刪除了網頁,另一方面可能來自本來就不存在,但其他人外鏈了這麼個死連結。