感動新做了一個論壇,收錄了幾個頁面之後,收錄的頁面就沒有增長,於是將日誌開啟來分析了一下。發現了來自123.125.71.95的百度蜘蛛比較頻繁,仔細查看了一下這個IP段的蜘蛛,發現這個IP段的蜘蛛代表是來抓取內面收錄的,網站權重較低,爬過的內頁文章不過很快放出來,因為不是原創,或是採集文章。
感動就比較納悶了,因為論壇還在建設初期,大部分都是感動自己的原創文章和一些朋友發的心情分享類文章。原創都能保證的。
筆者又對其中一個全部由感動原創的文章的版塊抽出來分析。發現這些頁面依然是這個IP段的地址訪問的多。筆者就納悶了。更具體的抽出一篇文章“關鍵詞競爭度分析”。又從百度搜尋“關鍵詞競爭度”找到相關結果。隨便選取了一些頁面測試了他們的相似性。感動原創的“關鍵詞競爭度分析”與百度搜尋相關結果的相似性基本都在20%以上。最高的一篇相似性達到27%。
大家也可以通過這個網站http://www.webconfs.com/similar-page-checker.php查詢自己網站各個頁面的相似性。這個相似性的演算法與百度的演算法可能不太一樣。但27%的相似對於兩個不同網站的頁面來說,確實已經很大了。我們不能肯定百度通過自己的演算法得出這兩個網頁的相似性會更高。但這隻是我隨便選的兩個網頁。
這個事實說明,SEO的這個行業都難有原創文章了。因為SEO的知識就是那些,再怎麼原創,其核心、表現形式也大同小異罷了。
無專屬偶。前一段時間一位朋友問我,他的網站為什麼總是在收錄的第二天就全部被K掉所有頁面。我提議讓他原創。可朋友卻說原創的也是一樣。將他的網站看了一下,這個網站是做淘寶刷鑽的。我隨便閱讀了幾篇,發現其中的意思都差不多。看來刷鑽也就是那些方法,那些規則。
當一個行業競爭度大到一定程度,沒有創新就難再有原創。這對於一個權重不高的網站,尤其是新站來說是非常致命的。我們如何面對這樣的情況呢?感動為大家提出了三點建議:
1.網站前期不局限於SEO,可以多做網站推廣。有人氣的網站才會得到搜尋引擎更高的關注。網站建設初期通過適當的推廣方法獲得人氣是吸引搜尋引擎抓取頁面的必要手段。
2.用內鏈將整個網站串聯起來。這是減少與其它網站頁面相似性,增加本網站相關性的重要方法。內鏈結構要豐富,通過內鏈指向相關但不重複的頁面。不僅可以增加文章的可讀性,還能引導流量延伸與轉化。
3.利用百度統計工具。網站的優點應該讓百度知曉。利用百度統計工具無疑是一個告訴百度網站流量,受眾範圍,使用者體驗等資訊的好方法。百度為了更加完善搜尋引擎演算法。我們大膽猜測,它極可能調用百度相關產品的資料。就像百度也調用百度搜藏的資訊一樣。
當然,如果能夠在行業內創新,那就最好不過了。
本文由SEO互動論壇www.seohu.net投稿,轉載請註明。謝謝。