搜尋引擎準系統:爬取和索引 並依相關性和重要性排序

來源:互聯網
上載者:User

  搜尋引擎有兩個主要功能:爬取和索引,並依據相關性和重要性將結果答案排序。

  試想一下,全球資訊網網路彷彿停留在一個大城市的地鐵系統裡面

  

 

  每到一站,是它自己的獨特的檔案(通常是一個網頁,但有時是PDF,JPG或其他檔案)。搜尋引擎需要一種方式來“爬行”整個城市以找到所有的沿途停靠點,所以他們使用的最佳路徑是——連結。

  1、抓取和索引。抓取和索引的數十億文檔,網頁,檔案,新聞,視頻和媒體的全球資訊網。

  2、提供答案。提供使用者查詢,最經常的是通過相關的網頁的列表,通過檢索和排名。

  通過連結,搜尋引擎的自動機器人,被稱為“爬蟲”或“蜘蛛”可以達到數十億相互連結的檔案。一旦引擎找到這些網頁上,他們就會將這些資訊以快照的方式儲存在海量的硬碟上,以供使用者在需要的時候進行搜尋查詢,這些伺服器支援搜尋引擎能完成這麼巨大的搜尋任務,幾十億的網頁,可以在幾分之一秒的訪問,搜尋引擎已經建造了世界各地的資料中心。這些巨大的倉儲設施容納數千台機器處理大量的資訊。畢竟,當一個人在任何主要的搜尋引擎進行搜尋時,他們需要的結果瞬間,甚至是1或2秒的延時可能都會導致不滿,所以搜尋引擎努力提供儘可能快的答案。

  搜尋引擎是答案的機器。當一個人通過搜尋引擎查詢所需要的資訊時,搜尋引擎會在自己的資料庫中,索引尋找數十億的檔案,並同時做好兩件事:第一,返回只有那些結果相關或有用的搜尋者的查詢;第二,排名這些結果,以提供最有用的結果。所以說,搜尋引擎是答案的提供者,“相關性”和“重要性”缺一不可,SEO就是為了影響這兩個因素。

  一個搜尋引擎,相關性意味著更多的過程不僅是簡單地找到一個頁面。在早期的網路,搜尋引擎不有考慮到這個簡單的因素,其搜尋結果的品質可想而知。因此,在進化的過程中,聰明的工程師將搜尋引擎設計出更好的方法來發現有價值的結果,搜尋者會更容易接受並滿意。今天,SEO對相關性的影響,是大多數提供網站最佳化和關鍵詞排名技巧的人所最關注的方面。

  搜尋引擎如何確定重要性?

  目前,主要的搜尋引擎通常理解的重要性,必須是較受歡迎的網站,網頁或檔案,更有價值的資訊包含其中。在實踐中,這種假設已經被證明相當成功,作為搜尋引擎繼續使用的度量,是作息品質的提高,並提升使用者的滿意度。

  

 

  人氣和相關性不能手動確定。相反,搜尋引擎越來越智能,集合數學方程、演算法、排序等各種技術於一身,去偽存真,然後依重要性將最有價值的資訊排名在最前面。

  這些演算法通常又包括數百個小的演算法,在搜尋營銷領域中,我們經常提到網頁的“排名因素”,只是針對主要的演算法,很多微小的演算法改進或進化,我們常常容易忽略,而他們卻最終深深地影響了搜尋引擎演算法的整個發展。

  本文由鄭州動獅網路整理,鄭州seo網站最佳化、網路營銷推廣、網站建設,歡迎與我們聯絡、相互交流學習 QQ 361461588。轉載請註明:http://www.movelion.com/archives/06102417.html 謝謝



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。