搜尋引擎蜘蛛原理深入剖析

來源:互聯網
上載者:User

 

  經常與站長打交道,定期組織A5雜談站長錄活動,對於搜尋引擎蜘蛛工作原理也有一定瞭解,再此總結個人的一些心得,沒有涉及到任何的技術,重在思維。認真讀的朋友,一定會有收穫。

  搜尋引擎好比總司令,蜘蛛就是他的手下。蜘蛛也分等級,我們就簡單分成3個等級,初級蜘蛛(普通士兵),中級蜘蛛(普通軍官),進階蜘蛛(進階軍官)。

  我們一直認為蜘蛛很神秘,其實很簡單,其原理是。它就相當一個我們有經常用到的採集器,能抓取到你網站的頁面,將你網站頁面的內容放入自己的資料庫,將採集到的結果與資料庫原有的資訊一一進行匹配,從而判斷你文章的原創度。這個過程相當複雜,龐大,需要有非常強大的伺服器。我們把文章分成5個等級,人氣高度的原創文章等級為5,一般原創文章等級為4,高度偽原創等級為3,依次類推。搜尋引擎就將對應的文章放入對應的位置,人氣高度的原創文章給予的權重是最高的,從而會給你這個文章的頁面帶來排名(當然還要經過一些簡單的最佳化,比如做四處一詞等)。

  整個過程就這麼簡單,那麼蜘蛛如果才能來到你的頁面呢。前面提到過,蜘蛛分成3個等級,權重高的網站,由進階蜘蛛去負責,比如A5雜談、SEOWHY、落伍者等,這些網站進階蜘蛛來的最勤快,所以給與這些網站的文章和簽名權重高於一般的普通論壇,進階蜘蛛有秒收的權利,所以這就是為什麼這些論壇的高品質文章都能秒收。中級蜘蛛,中級蜘蛛通過你的外鏈或友情連結等來到你的網站,抓取你網站的內容,然後按照上訴的文章的等級進行劃分,放入相對應的資料庫,從而在決定收不收錄,這個需要一定時間,所以為什麼有的站長網站收錄和快照有多有少,有快有慢。初級蜘蛛,這類型的蜘蛛基本上都是打醬油的,主要任務是負責新站,負責新站文章的採集,所以這就是為什麼新站收錄需要時間,因為它對你有個觀察期。它得逐級的向上彙報,直到總司令點頭同意,在收錄你網站。

  我們就以這篇文章為例,這篇文章的權重如何去判斷呢?取決於大家的回複。一篇文章,回複率越高,權重越高。回複也分等級和權重的,所以為什麼很多人喜歡搶樓,第一名和到第三名的簽名錨文本權重是最高的。那麼後面的簽名是不是就沒有權重了呢?不是的。假如這篇文章回複超過100,有5個回複頁面,首頁的簽名權重是最高的,第二頁稍微低一些,依次類推。如果這篇文章獲得4的PR值,那麼第一頁第一名的回複權重至少是2!相當於一個單向的友鏈!第一頁最後一名的權重至少是1。如果這篇文章回複超過500,PR值到5,第一頁第一名的回複權重至少是3,第一頁最後一名的權重至少是2。同時其他越靠前的頁面獲得的權重越高。第二頁能獲得5的PR值!如果這篇文章回複超過1000,PR值到7,那麼前500個回複簽名受益最大!回複的人越多,你的簽名越靠前,你的簽名PR值越高!

  用心讀完的朋友一定從中能夠得到收穫,寫下你的心得,不要用刷貼機或者複製內裡面的話進行回複,一定要用心寫下你讀文章的心得,這樣你的簽名獲得的權重是最高的!哪怕是最後一名,也會得到一些權重,至少能獲得一次蜘蛛爬行你網站的機會。



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。