退稿原因: 文章可讀性不高 繼續努力
前言:網。顧名思義,由蜘蛛編織的網,包羅永珍,海納百川。功能性非漁之網,乃網之構思也。
談結構(連結):
大家都知道漁人捕魚用的網,網口至少得有3個交叉點是構成的基礎,我可以假設:每個交叉點都是一個獨立的網站,百度機器人是蜘蛛,當只有兩個交叉點的時候,獵物粘網的時候(有內容更新時),蜘蛛只能從一個交叉點到另一個交叉點,三個交叉點時(你鏈他,他鏈我,我鏈你),四個交叉點的時候,可形成方形,還可加上中間對角交叉,五和交叉點等等。交叉點數量決定網的大小和密度,但是當網足夠大的時候,一隻蜘蛛是跑不完的,但是誰也不能保證有多少蜘蛛,所以如果在精確到秒分的話,百度不管多麼強大,其實並不不具備完全根據收錄的前後時間來判斷其內容是否原創(發布時間),有很多朋友會遇到這種情況,說我的原創文章第一發布,但是並不是第一個收錄的,在同等網站下,原創文章不能完全佔據排位優勢,也就是說文章的收錄時間越靠前佔據的排位就越高。
原創、偽原創和完全偷襲:
因為創造內容的成本太高,偽原創成了互連網泛濫的源頭,這種趨勢的增長完全是藉助於百度沒有分辨原創和偽原創的很強能力。我不知道百度對抄襲的判斷根據有多準確,理論上說:是根據收錄的時間,兩內容相似性高度多少。就算是人工操作,按照現在趨勢,我不覺得判斷有完全的準確,更別說百度的機器人了,我在幾個網站上做了很多次實驗,收錄數量和百度更新時間差不多,用了一些很偏的關鍵字(防止其他站幹擾),每個網站發布同一篇文章,標題,關鍵字,描述都一樣,但是發布的時間不一樣,每隔12小時發布一次,結果顯示原創的網站排位在最前的幾率不超過65%。以上是偷襲和原創內容的權重實驗,接著我也做了原創和偽原創的對比實驗,條件和前個實驗差不多,結果並不樂觀,搜尋同一個關鍵字,原創的網站排位在最前的幾率不超過30%,而且一個更重要的是在搜尋同一個關鍵字的時候,偽原創的內容顯示出來,原創的前10頁內沒有結果,這不僅證實百度對中文內容的分析能力不足外,還證實了百度引索過分依賴標題、描述和關鍵字,不知道是百度權重規則太複雜話引起的後果還是什麼原因有待證實。
後言:
還有一些高權重和低權重網站,原創內容的排位實驗情況就不做探討,我想說的是機器永遠是機器,對於人來說,存在觀察和被觀察的區分,規則也是可以運用的,但是為了集體利益,不踐踏道德的底線,呼籲大家尊重原創,花更多時間用在使用者身上,花更多金錢用在內容產方和媒體方的功利上。