仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
各位站長朋友通常都會給自己的網站安裝cnzz、百度統計等站長統計工具,可是,這些站長統計工具不會記錄網路蜘蛛的爬取情況。 一些站長朋友通常會用日誌分析工具對網站日誌分析蜘蛛爬取情況。 我個人認為,可能大部分站長對網站日誌的統計分析過程中,忽略了一些小的細節,下面就列舉兩條:
一、網站日誌檔應該按訪問量多少,來確定是否需要按小時生成。
我的一個站長朋友,網站是每天生成一個日誌檔,前段時間他參加了電商圈比賽,網站排名保持在首頁,每天的流量有上千IP,每天的網站日誌檔案大小大約50M左右,有點杯具的是他的電腦舊了點,一打開網站日誌檔不是沒反應就是死機。 他只好通過網路把日誌傳給我,讓我幫著分析一下,50M的檔雖然不大,問題是他用電信網路,我用網通網路,在傳日誌的時候經常杯具。 50M的日誌檔,我用的日誌分析程式也經常資料溢出、崩潰,無奈只好用文本編輯打開查看,面對密密麻麻的日誌文本,統計分析這些資料實在非常非常困難。 所以,建議網站訪問量比較大的站長朋友,最好按小時生成網站日誌,雖然生成檔多了點,但更有利於網站日誌的分析。
二、網站日誌記錄的資訊實際並不完整。
不知道各位站長朋友,有沒有注意到,網站日誌裡很少出5xx的返回代碼。 例如,500返回代碼表示伺服器內部錯誤,503返回代碼表示服務不可用。 各位站長朋友都知道,5xx返回代碼一般意味著網站伺服器出了故障,一般情況下,伺服器出了故障是無法生成網站日誌的。 換個說法,當網站伺服器宕機了,或者dns解析不了,所有人都無法訪問,蜘蛛也無法訪問,在這段時間裡,網站日誌肯定是無法記錄任何資訊的。 為了更好的監控網站情況,我個人建議大家去註冊並使用谷歌站長管理工具,可以有效的記錄伺服器訪問錯誤資訊。
以上兩點,是我個人對網站日誌分析過程中想到兩點小問題,希望能夠抛磚引玉,歡迎各位站長朋友拍磚。
本文源自北京家電維修網HTTP://bbs.bjjdwx.com/thread-135013-1-1.html,轉載請注明出處,謝謝合作。