SEOer人員要養成看日誌的習慣

來源:互聯網
上載者:User

  大家好,我是魏東東!對於很多站長來說,分析iss日誌都知道很重要,但是卻很少去重視它。通常網站的基本資料都可以通過ga又或者百度統計、站長工具可以查到,但是有些東西想通過這些常用的 工具並不能全名連結網站的一些細節方面。比如說蜘蛛的爬去方式。通過iss日誌我們可以很好的觀察到網站被搜尋引擎蜘蛛爬去的方式。那麼我們為何要進行網站日誌分析呢。大 家可能發現自己網站的內頁,通常情況下,搜尋引擎不都是能收錄你網站的內容頁。這在一方面其實跟我們的蜘蛛爬去的方式可能存在一定的關係。

  iss日誌我們可以做些什麼呢?

  1、可以間接的分析網站的外鏈效果

  2、我們的空間的好壞

  3、蜘蛛對我們的頁面哪些頁面比較喜歡哪些頁面不喜歡?

  4、蜘蛛什麼時候頻繁訪問我們的網站,我們究竟什麼時候需要更新網站內容

  通常我們看我們的iss日誌的時候,通常情況下是看有多少的200狀態嗎,那麼iss日誌就那麼點功能吧,其實不然,下面通過一些方面給大家介紹一下為什麼seoer要養成看日誌的習慣。

  一、iss日誌重要型表現在那些方面?

  1.通過iss日誌我們可以間接的發現蜘蛛在爬去你網站的時候的頻繁度,外鏈的數量其實可以間接的反應你網站的的外鏈做的成功度。蜘蛛通過外部連結來爬去你網站的的時 候的內容,可以通過iss日誌發現蜘蛛的抓取方式與軌跡。

  2.iss日誌的更新頻率與網站的內容更新頻率有一定的關係,網站的更新同時與網站的微調也有一定的關係!這些我們同時可以通過網站的iss日誌可以看見

  3.我們可以通過iss日誌去發現我們空間那些地方出現問題了。這些東西都可以提前做好預警。通過iss日誌分析我們可以間接的分析出一個網站空間的穩定性,我們可以很好

  的發現到底哪個空間商不錯!

  4.通過蜘蛛我們可以發現到底哪些頁面蜘蛛頻繁抓取,這些頁面頻繁抓取對於我們的頻寬嚴重浪費。所以我們就要好好的分析這些頻繁的頁面到底是哪些頁面老是被頻繁抓取,而 這些頁面對你並沒有多大的作用,那麼我們可以通過網站的robots,屏蔽這些頁面被頻繁抓取。

  二、如何下載日誌及日誌設定注意事項?

  1.首頁我們的空間log日誌分析檔案中會出現這個iss記錄檔案通過ftp從下載到本地。然後我們通過一些常用的日誌分析工具可以發現一些規律,推薦大家使用光年日誌分析 工具

  2.對於大型網站一個iss日誌會很大,用工具開啟的時候會造成死機,對於小型的網站我們會發現還可以,可是大網站的話,確實是一件難事,不過我們可以採用即時下載 iss日誌。會很好的解決這些問題,不過目前很多情況下發部分日誌分析工具都可以解決這些問題,具體問題具體分析吧

  三、iss日誌的具體分析。

  1.日誌的尾碼名是log的我們用記事本開啟,選擇格式裡的自動換行這樣看起來方便,對於BaiduSpider和Googlebot

  百度蜘蛛

  2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu /search/spider ) 200 0 0 15256 197 265

  Google機器人

  2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31

  我們分段來解釋

  2012-03-13 00:47:10 蜘蛛什麼時候訪問了你網站

  W3SVC177 這個是機器碼這個是惟一的 我們不去管它

  116.255.169.37 這個IP地址是伺服器的IP地址

  GET 代表事件

  GET後面就是蜘蛛爬取的網站頁面,斜杠就代表首頁

  80 是連接埠的意思

  220.181.51.144 這個IP則是蜘蛛的IP,這裡告訴大家一個鑒別真假百度蜘蛛的方法,我們電腦點擊開始運行輸入cmd開啟命令提示字元,輸入nslookup空格加蜘蛛IP點擊斷行符號 ,一般真百度蜘蛛都有自己的伺服器IP而假蜘蛛則沒有。

  如果有時候你發現你的空間很多情況下又冒充百度蜘蛛的假蜘蛛來頻繁訪問你的網站,那麼這個時候我們就要好好的去屏蔽這個ip,過度去採集我們網站的內容。

  200 0 0 200反應蜘蛛抓取正常

  197 265最後兩個數字則代表著訪問和下載的資料位元組數。

  2.我們分析的時候先看看狀態代碼 200代表下載成功,304代表頁面未修改,500代表格服務器逾時,這些東西可以去搜尋下,網上都有詳細的說明。

  3.我們可以通過蜘蛛喜歡那些頁面,來預計估測蜘蛛到底喜歡什麼內容,以後我們可以判斷我們到底該怎麼寫我們網站內容。

  4.有時候我們可以發現蜘蛛在爬去我們網站的時候到底出現了那些問題,對症下藥!

  5.我們通過蜘蛛抓取的頻率可以很好的分析出那些時間段,時間頻段蜘蛛常來,然後我們趕在這個時間對岸前把我們的網站更新,這樣可以讓搜尋引擎知道咱們網站是最新 的

  6.蜘蛛對於我們的頁面的抓取是分等級的,是根據權重依次遞減的,一般順序為首頁、目錄頁、內頁。

  7.不同IP的蜘蛛他們的抓取頻率也是不相同的

  作為一個合格的seoer人員要養成看日誌的習慣,在日誌中可以很清楚的看到我們網站的一切!

  轉載請手下留情請保留http://www.weidongdong.com/seoer-kan-rizhi.html



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。