seo,搜尋引擎的規則

來源:互聯網
上載者:User
 搜尋服務,為所有的互連網使用者提供了資訊尋找的方便之門,能夠在億萬條網路資訊中,準確協助使用者尋找到所需要的資訊服務。在某種程度上,搜尋引擎,在引領著互連網的發展。

    下面的文章中,我將講述我個人對搜尋引擎,及搜尋引擎服務的理解和闡述。

    首先,作為seo工作者,我的工作就是研究搜尋引擎的演算法,並通過實踐找到迎合搜尋引擎規則的方式或方法,應用到網站的最佳化工作中,以提高網站的搜尋排名。由於接觸seo工作的時間並不是很長,所以現在我只能算作是一名seo愛好者,並以此為謀生的手段,賺取點薪水,填補家用。

  言歸正傳,我認為作為一名seo工作者,無論你處於什麼樣的地位或者位置,提出過什麼樣的最佳化方法,或者察覺到多少搜尋引擎的漏洞,都必須對搜尋引擎得發展或者說曆史,有所瞭解,甚至是研究。我記得有這麼一句話,"曆史,將協助你追溯源頭,發現事物的本源!"。只有瞭解和研究搜尋引擎的概念,技術,發展曆程,將會有效協助你理解當前搜尋引擎的規則。

  在這裡,你首先需要知道,就是最初的檔案檢索功能的主要技術參數,也就是搜尋引擎的原型,它的基本運算規則,瞭解最初的邏輯運算規則,察看相關搜尋技術升級以及新技術專利的描述,因為就是這些東西,這些技術的不斷髮展,不斷的更新,才構成了當前的搜尋引擎,而搜尋引擎的演算法,其實就是通過這些技術進行邏輯判斷得到的參數,再經過多重計算和判斷,最終得出的結果。

  由於這些資料大多都是英文著作權,所以我建議閱讀者最好用有金山詞霸這個軟體,或者是使用中英文漢語詞典,這將有效協助你對文章的理解。

  推薦一篇作為seo工作人員必須要研究的文章《The Anatomy of a Large-Scale Hypertextual Web Search Engine》,這片文章是賽吉-布林與拉裡-佩奇所著,也就是google的兩位創始人在斯坦福大學畢業前的一片學術文章,中文翻譯過來為《剖析一個大型超文本web搜尋引擎》。google作為搜尋引擎服務當中無可爭議的霸主,就是建立在此篇學術文章的理論基礎上。有效閱讀,深入地瞭解,你會發現當前的搜尋引擎有很多這片文章種所提到過的參數及其資料設定。

  對以百度搜尋同樣也是這樣,百度的創始人,李彥宏先生在美國時期的專利,《超連結分析》專利,如今也應用在百度搜尋上。綜上所述,我要表達的主要意思就是,seo的工作,不要只注重當前搜尋的排名結果的,你可能能夠發現搜尋引擎一時的漏洞,你的方式或方法能夠得到短期的應用,但如果你不能夠把握搜尋引擎的方向,瞭解和掌握搜尋引擎的技術資訊,那你就無法將seo工作發揮到極致。

  ok,下面我將敘述的是,我個人對百度搜尋的一些理解,在文章中,會涉及到一些具體的搜尋參數,但由於要擷取準確的參數並反映具體的運算公式需要的大量的計算,我個人並沒有進行過具體的運算,所以,所提供的參數可能會存在很大的誤差,如果有興趣深入瞭解的話,可以留意我的連絡方式,然後一起探討。

百度搜尋

網域名稱、空間對搜尋排名服務的影響

  作seo工作的都知道,網站的空間,網域名稱對搜尋引擎及搜尋引擎的排名結果會有一定的影響,但影響會有多大,除了參與設定的搜尋引擎研發人員外沒有人知道,其實像下面我將要說到的網頁的title、keywords、description等條件,或者說是因素,它們在搜尋引擎排名結果中,都只是搜尋運算中的一個參數。

  不同的是,我們可以通過不同的關鍵詞搜尋,並通過搜尋結果的排名比對,得到大概的答案,這個答案已經被眾多的seo工作者所熟知,並已經應用到實際的seo操作中。

.com的網域名稱的網站,在同等條件下,要比.CN的網域名稱的網站具有排名優勢。同樣的,英文單片語成的網域名稱,要比拼字的網域名稱具有優勢。獨立單詞的網域名稱,要比片語網域名稱有優勢。另外,還有許多類似的規則,

     例如網站的空間,我個人認為,搜尋引擎在更新收錄的同時,會給與一定的參數,並作記錄。可能會有以下幾個參數,根據空間類型,得到一個參數,並根據空間是否獨立,給出一個判斷,如果是非獨立空間,會依據空間分割的數量,給出一個變數。通過一個恒定值比對,或者計算,最終得到一個關於網站空間的最終參數。而這個參數將最終影響到網站權重的分配。

百度對建立網站的扶持

  我個人認為,百度對於建立網站,會提高一定的權重分配。這點可以通過詞性定義廣泛的關鍵詞搜尋結果的比對中可以看到(生僻的關鍵詞)。在此我就不做過多的說明。

收錄量的問題

  有的許多人認為,網站的收錄量越高,網站的權重就越高。我也持相同觀點。但需要說明的是,影響網站權重分配的不單單就只有收錄量一個因素,高的收錄量只能作為一個變數影響網站的權重,卻不能決定一個網站的權重。

  搜尋引擎演算法,包括它的排名,都是建立在"公正,公平"的基礎之上的,就算是百度也是一樣,哪怕百度已經開始走向排名商業化運作的道路。高收錄量,是搜尋引擎對網站的一種認可,我認為對網站的排名結果,沒有太大的影響。

影響搜尋排名的主要因素

  這裡我要說明的是我個人的觀點,當然,提出這種觀點是有一定的資料依據,但我所依據的資料量還不足以證明我的觀點,所以在這裡,我只是與大家一起分享我的一些想法。當然這些想法,我會利用時間逐步的進行論證和完善。

頁面內容

  影響網站排名的最重要的因素,我認為不是網站關鍵詞,title或者其他的什麼因素。而是內容,網站內容,或者說是網站頁面的內容。

     我之所以,持這種觀點,是因為搜尋引擎的本質,而它的本質也就是檔案檢索功能。決定了只要頁面中的內容符合搜尋關鍵詞,哪怕是title、keywords、description等條件中沒有出現關鍵詞,搜尋引擎也會將其放入到排名結果中。事實上,keywords、description等條件,在1996年法國巴黎召開的word wide web會議發布HIML3.0代碼之前並不存在。有興趣的seo愛好者可以通過搜尋比對發現。當然隨著網頁編寫技術的不斷升級,當前沒有title這些因素的的網頁,就算頁面內容中出現了關鍵詞,他的排名結果,也不具備競爭優勢,這是由於網頁製作技術不斷升級造成的。我之所以說明這點,就是為了要讓瀏覽者清楚,影響搜尋排名的根本因素。

頁面標題(title)

     Title的作用,相信大多數的瀏覽者,都非常清楚。在這裡我只做簡短的說明。title最初的作用,是對頁面內容的簡短概括,一般是文章的標題。但隨著搜尋技術的不斷升級和更新,title逐漸轉變為頁面內容的高度概括和總結,並逐漸的採用關鍵詞作為title主要表現形式,以突出頁面資訊的主體內容和方便搜尋引擎的識別和抓取。
搜尋引擎排名計算上,對title主要看中的是是否出現關鍵詞,關鍵詞的位置,及相似關鍵詞出現的比例,以上三點將直接影響title在搜尋引擎中的表現。

關鍵詞(keywords

     如果說title是對頁面內容的高度概括和總結,那麼關鍵詞(keywords)就是對頁面內容的補充概括,或者說是補充說明,內容關聯度的解釋。

     關鍵詞(keywords)的作用就是利用短語或片語的形式體現頁面的主要內容,並根據頁面內容進行相關性的表述,使搜尋引擎能夠快速準確的識別頁面的內容。搜尋引擎將根據頁面關鍵詞的前後排列順序,頁面建設者人為的關鍵詞側重和頁面內容的關鍵詞比率,建立搜尋引擎的關鍵詞索引目錄。而搜尋引擎將根據索引目錄的內容進行關鍵詞搜尋結果的排序。

影響關鍵詞索引目錄的幾個主要因素

  關鍵詞的位置

     搜尋引擎認為,關鍵詞的位置越靠前,越能夠表現給頁面的主題內容。所以在越靠前的關鍵詞,在索引目錄中,獲得的權重越高。當然,前提是此關鍵詞確實符合頁面內容,並能夠通過內容中高關鍵詞出現的比率得到搜尋引擎的認可。

  關鍵詞頁面內容中出現的比率

     頁面中,關鍵詞的出現比率,決定了搜尋引擎對關鍵詞的權重分配,高比率的關鍵詞能夠得到較好的索引目錄的權重。

  關鍵詞在title中的表現

     就像上面說到的,title中關鍵詞的位置,同樣也決定了搜尋引擎對關鍵詞的側重,並通過內容的比對,安排索引目錄。

  連結文字中的關鍵詞

     搜尋引擎認為,連結中出現的關鍵詞,能夠更好的體現連結內容。所以當前主流的搜尋引擎,對連結都是非常重視。能夠在連結文字中自然的體現關鍵詞,是博得搜尋引擎好感,增加索引中權重的好方法。

  圖片中的相關設定

     圖片中的alt,圖片的檔案名稱等,雖然當前的搜尋技術還無法有效地判斷圖片的內容,但,搜尋引擎對於圖片的相關設定還是相等的重視,這一點同網路上的一些說法完全相同,所以,有效地圖片設定上的最佳化,雖然看不到具體的效果,但還是可以影響到網站的總體效果。

  標籤中的內容

     這裡所要說的內容同網路上眾多高手所說的一樣,熟練的使用標籤及字型方面的設定,是一種很好的表現手法,儘管許多人看不起這一小小的改動,但細節往往決定結果。

  欄目的設定

     很重要,當前很多網站的欄目標題,往往是製作人員或是策劃人員,隨意的根據內容設定的。這點上,完全背離了seo最佳化的目的,也忘記了搜尋引擎設計及抓取的初衷。

     欄目標題的設定,再搜尋引擎看來,其實就是相當於欄目連結頁面的tetle,草率的欄目標題設定,在一定程度上會影響網站的總體效果。

詳細的搜尋引擎抓取,計算,排名等流程

  抓取

     熟悉搜尋引擎的人都清楚地知道,搜尋引擎是通過機器人,或者說是蜘蛛爬蟲,對網路上的網頁進行檢索和抓取。蜘蛛爬蟲會將頁面資訊轉換成為代碼資訊,發送到儲存伺服器中。

  儲存伺服器的分析計算

     儲存伺服器會將蜘蛛爬蟲發送過來的網頁進行壓縮,並對網頁的url等資訊進行分析記錄下網頁的長度,大小,url,url長度,網頁內容等資訊,最終會分配給該網頁一個docID(文檔號)。

  索引目錄的產生

     索引器(Indexer)將從儲存伺服器中調取頁面資訊,將讀取的資料解壓縮後進行分析,它將網頁中每個有意義的詞進行統計後,轉化為關鍵詞(wordID)的若干索引項目,產生索引項目列表,該列表包括關鍵詞、關鍵詞的位置、關鍵詞的大小和大小寫狀態等。

     索引器除了對網頁中有意義的詞進行分析外,還分析網頁的所有超文本連結,將其Anchor Text、URL指向等關鍵資訊存入到Anchor文件庫中。

  搜尋結果的排名

其實就是關鍵詞索引項目比對結果的排名。

    由於接觸seo工作的時間並不是很長,這裡只是我的一些觀點,可能文章中某些觀點並不正確,還請個位朋友幫忙指正。使徒在這裡謝謝個位了!
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.