如何在IIS裡設置並查詢搜尋引擎蜘蛛

來源:互聯網
上載者:User

仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳

昨天發生了一件令木木很鬱悶的事情。 木木一個網站的快照停止在9號了,去伺服器上查看該網站日誌記錄!竟然沒發現蜘蛛記錄,以為網站要掛了!仔細一看,原來IIS該網站日誌屬性中沒設置記錄爬蟲這些!百度下竟然在網上沒有這方面的文章, 為了讓以後更多的兄弟不浪費寶貴的時間,木木就把這個全套設置全部寫出來。

一、IIS中網站的日誌的設置。

打開IIS。 選擇所要設置的網站屬性。 彈出如下視窗:

  

「啟用日誌記錄」,勾選,選擇「W3C擴展日誌檔案格式」。

再次點擊這裡的「屬性」按鈕,常規選項裡面,選擇新日誌計畫為「每天」,當然也可以選擇其他,選擇好保存日誌檔的目錄。

  

按照一般情況,設置到這裡就可以記錄日誌了,但是有些主機無論如何都找不到搜尋引擎爬蟲的痕跡,類似于Baiduspider+怎麼都看不到。 這個時候我們就需要啟用剩下的三個選項了!

選擇高級選項。 勾選底下的使用者代理(cs(User-Agent))等下面三個選項,這樣我們就可以看到百度蜘蛛了!

  

二、如何分析網站IIS日誌中的蜘蛛

首先來認識下國內主流搜尋引擎的蜘蛛的名稱:

1. Google爬蟲名稱

1) Googlebot:從Google的網站索引和新聞索引中抓取網頁

2) Googlebot-Mobile針對Google的移動索引抓取網頁

3) Googlebot-Image:針對Google的圖片索引抓取網頁

4) Mediapartners-Google:抓取網頁確定 AdSense 的內容。 只有在你的網站上展示 AdSense 廣告的情況下,Google才會使用此漫遊器來抓取您的網站。

5) Adsbot-Google:抓取網頁來衡量 AdWords 目標網頁的品質。 只有在你使用 Google AdWords 為你的網站做廣告的情況下,Google才會使用此漫遊器。

2. 百度(Baidu)爬蟲名稱:Baiduspider

3. 雅虎(Yahoo)爬蟲名稱:Yahoo Slurp

4. 有道(Yodao)蜘蛛名稱:YodaoBot

5. 搜狗(sogou)蜘蛛名稱:sogou spider

因為咱們國內比較關注百度所以我們來分下百度的蜘蛛,從剛剛記錄的日誌搜索「Baiduspider+「選取一段

00:00:06 GET /Class/Class.asp ID=38 61.135.168.142 Baiduspider+(+HTTP://www.baidu.com/search/spider.htm) 200 0 214

上面這個日誌說明是在0點的時候 訪問了 Class/Class.asp ID=38頁面。 蜘蛛IP位址為61.135.168.142。 其中的200 表示搜尋引擎蜘蛛爬行後返回HTTP的狀態碼,代表成功爬行並抓取。

下面列出常見數位代碼:

2xx 成功

200 正常;請求已完成。

201 正常;緊接 POST 命令。

202 正常;已接受用於處理,但處理尚未完成。

203 正常;部分資訊 — 返回的資訊只是一部分。

204 正常;無回應 — 已接收請求,但不存在要回送的資訊。

3xx 重定向

301 已移動 — 請求的資料具有新的位置且更改是永久的。

302 已找到 — 請求的資料臨時具有不同 URI。

303 請參閱其它 — 可在另一 URI 下找到對請求的回應,且應使用 GET 方法檢索此回應。

304 未修改 — 未按預期修改文檔。

305 使用代理 — 必須通過位置欄位中提供的代理來訪問請求的資源。

306 未使用 — 不再使用;保留此代碼以便將來使用。

4xx 客戶機中出現的錯誤

400 錯誤請求 — 請求中有語法問題,或不能滿足請求。

401 未授權 — 未授權客戶機訪問資料。

402 需要付款 — 表示計費系統已有效。

403 禁止 — 即使有授權也不需要訪問。

404 找不到 — 伺服器找不到給定的資源;文檔不存在。

407 代理認證請求 — 客戶機首先必須使用代理認證自身。

410 請求的網頁不存在(永久);

415 介質類型不受支援 — 伺服器拒絕服務請求,因為不支援請求實體的格式。

5xx 伺服器中出現的錯誤

500 內部錯誤 — 因為意外情況,伺服器不能完成請求。

501 未執行 — 伺服器不支援請求的工具。

502 錯誤閘道 — 伺服器接收到來自上游伺服器的無效回應。

503 無法獲得服務 — 由於臨時超載或維護,伺服器無法處理請求。

瞭解蜘蛛的爬行痕跡,有助於我們分析自己的網站。 木木才疏學淺,就簡單的總結下!

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.