SEO診斷:透過Log日誌找到網站死結

來源:互聯網
上載者:User

  前幾天和一位朋友聊天,互相交換了下對8月末百度演算法更新的一些看法。結束的時候朋友讓我幫他分析一下他的新站,網站的問題是快照停留在8月15日,並且快20天百度沒有收錄新內容。從簡單的交談得知,網站上線2個月,每日堅持更新原創內容和外鏈。自打百度收錄後,文章隔天收錄,長尾詞排名也不錯。但是8月19日快照回檔到815後,快照再未更新過。通過分析這個站的整體結構和內容,發現整站結構清晰明了,並沒有嚴重的結構上的問題,文章內容圖文並茂,寫的也不錯,而且長尾詞排名確實不錯,這對一個新站來說做的很不錯。

  為什麼快照不更新,新內容不再收錄?難道是百度自身的問題,還是有其他“肉眼”看不到的癥結?這個時候想起了日誌分析,有的時候只有透過內在看問題。從朋友處要來了前一天的網站LOG日誌,下圖是日誌分析工具得出來的蜘蛛概要截圖。從圖上我們可以看到三大主流搜尋引擎的蜘蛛訪問次數、停留時間和總抓取量等資訊。

  

 

  朋友這個站屬於一個新站,外鏈不多,整個網站的資訊量也不是很大。依據個人的經驗分析,蜘蛛單次抓取量(總抓取量÷訪問次數)達到80-100已經算是一個非常不錯的數字了。緣何網站的新內容不收錄?

  第二步來到了網站目錄的抓取情況。下圖是截取了三大主流蜘蛛目錄抓取Top3目錄的一個截圖,從圖上我們可以看到圖上的archiver目錄的抓取量遠遠超過於其他的網站目錄。這個資料讓我有點不安心了。

  

 

  從朋友的網站瞭解到,這是一個每日歸檔目錄,從圖上我們可以看到的是2010年09月05日返回的當日發布內容為空白(朋友這個站建站才2個多月)。

  

 

  通過站長工具可以看到,該URL返回的是200狀態代碼。此時心理大概有個底了,蜘蛛在這個目錄的爬行一定遇到了困難。

  

 

  為了驗證自己的判斷,通過Editplus開啟了LOG檔案,不出所料幾大蜘蛛在抓取archive目錄時陷入了死胡同。

  

 

  癥結找到了,接下來就是如何處理這個問題。由於這個文檔歸檔功能是朋友購買的一款外掛程式,所以朋友還是希望能夠保留這個每日歸檔欄目,畢竟錢花了得用到實處,不求該欄目能帶來流量但卻是個有益的補充。剛開始考慮通過NOFOLLOW來屏蔽蜘蛛爬取,但是想來想去還是不妥,畢竟已經收錄的頁面還是給了蜘蛛爬行的餘地,又會出現文中所說的死迴圈。

  最後,給了朋友兩條建議:

  1、 聯絡外掛程式開發人員修複此BUG;

  2、 刪除整個archive目錄返回404狀態代碼,並且在robots中屏蔽archive目錄;

  整個的診斷過程就是這樣。很多時候當我們網站出現問題的時候,請不妨開啟你的網站LOG日誌,仔細對比並分析裡面的資料,將會對你找到問題的所在有很大的協助。

  本文由瘦樂吧減肥藥熱門排行榜 www.shou68.net 原創供稿,歡迎大家轉載,轉載時請保留此連結,謝謝合作!



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。