淺析網站收錄的影響因素(一)

來源:互聯網
上載者:User

  網站不收錄怎麼辦?權重不夠,買點友鏈;外鏈不夠,多發點;文章不是原創,好好寫。一個問題,有那麼多的答案,可是我們不能靠猜測去工作。今天我給大家說說我認為的網站收錄的影響因素。

  很久以前光年論壇的張國平老師就提出一個公式:網站收錄量=頁面抓取量×頁面品質。收錄本來就是靠蜘蛛抓取,能被蜘蛛留下的頁面就是品質高的,這個公式的正確是大家不會懷疑吧?我們來看下面的分析。

  頁面抓取量應該和你的伺服器,網站程式有關係的,如果它們對百度蜘蛛的訪問不干涉、不限制,都很正常很穩定。另外外鏈的作用呢,基本就是兩點1、提 高其他網站對你的投票數2、引蜘蛛。如果你的外鏈發到位了,能引來蜘蛛,而且伺服器正常,那麼你網站已經做好一半了。其實這個是很好做的,一 般站長進行網站建設會選擇虛擬機器主機,找個有口碑的品牌,你的網站一般不會有這些問題,網站程式不是自己開發的話,那麼主流的開來源程式預設都不對蜘蛛進行幹涉,所以程式也不會有問題,所以這個方面大家基本可以忽略。

  頁面有哪些類型呢?我認為頁面有這些類型:1、連結型2、文字型3、圖片型。如果一個頁面既有圖片又有文字,那麼我們可以將其分到文字型,因為這種頁面還是文章主導。連結型是一個頁面裡面內容以連結為主,最明顯的是導航站的頁面,其實門戶也是一個連結頁面。連結型和圖片型不在我們的討論範圍之內,因為現在多數網站還是主打文字型,多數頁面甚至全部都是文章。所以我說文章是目前收錄的主導因素。

  我們細細說下文章頁面的細節問題。判斷一個網頁是好是壞應該有兩個直接因素,文章的品質和頁面的布局。這其中最主要的應該是文章品質,最難做的也是文章品質。布局設計到的是使用者體驗和內鏈的設計,這點只要遵循基本的seo標準不會出現大問題。我只說兩點,第一:內鏈主要是形成一張連結網,為的是讓蜘蛛好爬取;第二:內鏈主要是為了傳遞權重,比如欄目頁、首頁、專題頁。拋開使用者體驗,一個seoer搞頁面配置,這兩點都做到就是很好了。

  然後我們說文章的品質,文章品質這個概念太模糊了。其實站在站長的角度來說網站的品質也有兩個點:1、是不是符合使用者體驗,可讀性怎麼樣?2、不要讓百度認為是偽原創,百度飄紅不要多。第二點是多數seoer們所認為的。可讀性這點應該可以做到,寫文章一定要有相關性,而且最好是使用者感興趣的,這樣降低跳出率,而有人研究說跳出率也是判斷頁面品質的因素之一。

  剩下的重點是不要讓百度認為你是偽原創,或者說原創度很低。搜尋引擎判斷文章是否為偽原創是有自己的機制的,一般有幾種方法:

  1、TF/IDF演算法,將兩篇文章分別用TF/IDF演算法計算後,各產生一個內容特徵向量,特徵向量可以理解成某個詞在文章中出現的頻率或者次數吧。如果兩篇文章的特徵向量相近,搜尋引擎就認為這兩篇文章的內容相似,如果兩個特徵向量一致,就認為這兩篇文章是重複的。

  2、資訊指紋技術,這種技術指截取一個詞,一句話或者一段文字,將之轉化為代碼,然後這組代碼就成為標識這個資訊的指紋。如果兩篇文章的資訊指紋相同,搜尋引擎就認為這兩篇文章是重複的。

  百度鑒證偽原創的方法肯定不止這些,還有一些我在這裡沒法寫出來,都是些很複雜的演算法。當然在這裡說的或許早就過時了,我想表達的是不要進行偽原創,偽原創的文章瞞不過搜尋引擎。

  如果你的網站收錄不增加,或者索引量不增加,那麼你就可以在以上幾個方面下工夫。以上僅僅是思想原創文章團隊http://www.sixiang.cc/的見解,歡迎大家指正,轉載請尊重原創資訊。



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。