搜尋引擎如何確定你的就是原創內容

來源:互聯網
上載者:User
關鍵字 搜尋引擎

仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳

很多人在群裡聊到一些事情,比如原創是如何被搜尋引擎確定的?核桃今天分享一下自己對搜尋引擎確定原創內容的看法。

首先我們明確兩個概念:原創與偽原創

原創:簡單地理解就是第一次在網路上發表的內容。

偽原創:就是對原創進行的第二次或者第N次經過修改的轉載發表。 比如修改標題,增加摘要,轉載不完整內容等等。

搜尋引擎對於原創的判斷是如何進行的呢?

一般來講有以下幾個方面的因素決定:

1、快照日期。

2、蜘蛛抓取日期。

3、頁面外鏈的多少。

4、文章修改的程度。

舉例:如果一篇標題為《搜尋引擎如何確定你的就是原創內容》的文章在今天10點第一次發表在一個博客或者網站上。 會有什麼結果呢?

搜尋引擎蜘蛛來到這個博客或者網站,發現這個頁面,分析內容,放入資料庫,並且被確定為首次發現,這肯定就是原創了!

那麼這個收錄與判斷的過程中間有幾個細節方面問題:

1、必要條件

——假如這個網站沒有被收錄,這篇文章會認為是原創嗎?

——當然不是!因為它根本不可能出現在搜索資料庫裡!

——如何讓它成為原創內容?

——第一個條件,網站必須有被搜尋引擎收錄。

——假如這個網站收錄了,但是不經常更新呢?

——很簡單,如果不經常更新,發表的文章到收錄的時候也會認為是原創的。

3、轉載與採集

——如果文章被轉載了呢?

——如果文章被轉載,那麼看轉載這篇文章的站更新週期與首次發表站的更新週期哪個更快。

——不太明白更新週期。

——比如在A站發表,B站轉載,如果蜘蛛先訪問了A站,發現了文章,再來到B站發現了文章,很明顯的,原創權重歸A站。

——採集的情況是否符合這種情況?

——是的,採集的情況一樣。 如果B採集A,但B收錄比A早,B就可能變成原創嘍!

4、存取時間

——如果蜘蛛先訪問了B站呢?

——當然權重給B站,一般的情況下都會這樣!

——如果B站轉載的文章帶了A站的原文章頁面連結呢?

——這就很明白了,剛收錄的時候,如果排名,兩條結果一起出現,有可能還是B站的排名好一點。

當然,文章轉載次數多了以後,A站的連結越多,對A站的文章越有好處,排名會慢慢變成A站在前面。

——如果另外轉載的文章帶的是B站頁面的連結呢?

——這種情況就搞笑了,給搜尋引擎開了個玩笑,但它們如果判斷不好,就變成了一個連結17891.html">流行度的比賽了。

不過,如果都有很多外部連結,並且相差不大,那麼判斷的規則應該回到原點,誰先被收錄誰就是原創。

5、快照日期

——快照日期顯示時間最早的,一般就是原創了吧!

——不一定,這個說法要在一個更新週期之內,比如說文章發表後一周內,快照時間越早的位址將越有被認可為原創的可能。

但如果文章都發表了幾個月了,說不定搜尋引擎已經重新獲取過快照了,快照的日期就變了!

——還有其它的可能嗎?

——有,一般比如百度收錄,他可能會有一個收錄的資料庫,經過過濾後,收錄的內容才會到搜尋結果裡來。 在這個期間就有一些問題了,比如A站首次發表,B站轉載。 蜘蛛先訪問A站再訪問B站。 而後可能先把B站的結果放出來了,而A站還在資料庫裡。

所以說搜尋引擎沒有收錄並不表示搜尋引擎蜘蛛沒有訪問過這些內容,也許在搜尋引擎的庫存裡已經有記錄了,只是你查的時間沒有放出來而已,就像25號才放出來的內容,但是快照是20號的,這就是搜尋引擎的庫存內容, 同時這也是檢驗原創的核心時間點。

這種情況一般出現在新站與老站之間,A站發表,B站轉載,但A站在搜尋引擎的信任度並不高的時候。 不過只要是A站先被訪問到的,原創權還是A站的,這是最難分出來的情況,因為我們不知道蜘蛛先訪問哪個站,除非你知道兩個站的網站空間日誌內容,能看到搜尋引擎對兩個頁面的存取時間。

6、偽原創

——偽原創也會被認為是原創?

——大多時候是這樣的,搜尋引擎蜘蛛智力相當於三歲小孩子一樣,不能明確分別這些東西,因為它的思維太程式化了。 如果你的標題改過,文章的段落改過,那麼蜘蛛將很難確定這篇文章是否有過收錄,也許它可以確定有部分內容是重複的,但它也不能因為這些而將這篇文章確認為是轉載!當然,隨著搜尋引擎程式設計的提高,應該會有一個相似度的東西出來, 比如文字內容相似度超過百分之幾就會被認為是轉載。

這樣分析下來,相信大家應該瞭解了吧。 只是核桃自己的看法,希望大家吸收自己想要的東西,不認同的了也來提下自己的意見!

另外提幾個建議:

1、如果你的站是新站,權重不高,如何讓蜘蛛首頁找到你的頁面並放入資料庫?其實很簡單:用網摘、百度收藏這些工具讓蜘蛛更快的找到你的頁面!

2、大家都有過建議,就是加上自己的版權及內容頁面的位址,別人採集的時候你就爽了,收錄雖然不會快,但最後連結多了,你依然是原創內容。

3、發表文章等到自己收錄以後再去其它的網站進行發表,同時加上自己的原文位址,這種辦法很有保障!大站被采的機率很大!

博客:HTTP://www.abseo.cn/

原創文章,轉載請大家手下留情!

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.