仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
什麼是網站資訊採集?
網站資訊採集是將非結構化的資訊從大量的網頁中抽取出來保存到結構化的資料庫中的過程。 當你看到一些好的文章,而這些文章又是很多,這個時候有些人就會想到,複製過來挺麻煩的,直接採集過來也就是幾分鐘的事情,在網路資訊浩如煙海的今天,如何有效挖掘網路資訊資源,如何收集企業外部大量的有效資訊, 對於站長們來說這個至關重要。
首先還是舉例說明
我在2010年的時候開始運營考試網門戶:www.exam66.cn這個網站,這個功能變數名稱註冊的時間比較久,算是一個老站了,是我一個朋友3年前註冊的,後來他註冊公司了,這功能變數名稱也就沒管了,我就買了過來,收錄只有首頁,快照也比較舊,當時我也是做站不久, 算是懂一點皮毛;第一步我先是把網站先建立起來,然後就是內容方面了,開始的時候還是每天偽原創,每天30-50左右,堅持了兩個多月,收錄慢慢漲到幾百頁,後來一看人家那些大網站收錄都是幾百萬的,流量又特別大, 感覺合適才能和人家比,合適流量才能大起來,漸漸的我也開始採集了,剛開始採集的時候每天100-300篇,採集了一個多周,不見百度收錄,我想可能是文章品質問題,然後就慢慢把採集過來的文章又重新編輯,加上一些自己的話語, 使文章的品質又一步一高,就這樣觀察了兩個周左右,果然被收錄了,而且之前採集的資訊全部被收錄了,就這樣我的貪念之心就起來了,每天採集的數量開始增加從100-300漲到300-500,持續了一個多月收錄漲到了一萬多, 那時候確實挺高興的,一直覺得收錄越高,網站就越牛,又採集了一段時間,當收錄漲到5萬多的時候,流量已經達到5000多了,漸漸的感覺到人心不足蛇吞象,就這樣一直採集收錄漲到了13萬,慢慢的流量竟然下降了, 從每天持續5000以上的ip下降到百度搜尋引擎占幾十個iP,其他全部是谷歌的,當時我真的是暈了,第一時間感覺就是被百度懲罰了,然後接下來的幾天裡就沒採集了開始偽原創,手工加文章,就這樣過了幾天百度竟然只剩下幾個IP了, 這時候我才感到網站的末日到來了。
採集有益
採集能使一個網站的收錄在短時間內得到大幅度的提升(前提是你網站的權重要足夠高),能夠網路大部分的流量,抓住其他競爭對手的流量。
採集有害
大量的採集,會讓百度認為你這站裡面根本就沒有客戶想要的資料,純屬一垃圾站,如果你今天採集一百篇,明天採集兩百篇,後天又不採集了,這樣就屬於更新頻率不均勻,百度就要關注你了。
結論
採集的資訊需要與網站的主題相關比較好,如果你的站是剛剛建立的,勸你少採集一些或者手工來加;權重高一點的網站你最好定一個主題,相對於比較泛泛的網站,專業度比較強的網站更好一些。 其實網站的內容相關性還是比較重要的,如果你網站的內容很強,即使在seo方面做的是很好也可以有一個比較好的表現,畢竟在網站排名演算法裡,網站內容是最重要的一個方面;整個網站內容或者是大部分內容都是採集的,影響很大。 如果你繼續採集,搜尋引擎就會認為你是一個低品質的採集站,這樣以後你的收錄更困難。 所以從現在開始要不斷堅持原創或高品質的偽原創,以前收集的也不要刪了,以免做太大的改動;最好挑選出很多網站來進行採集,不要抓住一個網站去每天採集,這樣下來你的網站大部分內容就和這個網站的一部分內容相似了,這樣也是不好的; 採集是可以的,但是在適當的寫一些偽原創和原創的文章進去,這樣也是可以的,不過本人建議還是不要採集,畢竟沒有苦頭也是嘗不到甜頭的。
上面說的這些都是我採集資訊到現在的一些體會和經驗,希望對新手朋友有所説明,堅持了兩個多月的偽原創和發外鏈,到現在我的網站慢慢有點恢復了,流量也慢慢漲到4000多了,有交流的可以加我QQ:446405905(元少)