張棟偉
一、直接向搜尋引擎提交
實施搜尋引擎營銷,首先就是要使得網站被搜尋引擎收錄。要被搜尋引擎收錄,除了等待搜尋引擎的爬蟲程式找到你的網站後進行索引之外,還可以主動向搜尋引擎提交網站。目前國內各類搜尋引擎供應商大約有100家,而且基本都提供直接提交網站服務。本章討論主流大型搜尋引擎的網站提交。
第一節 向搜尋引擎提交網站
常用搜尋引擎登入入口
百度提交入口: http://www.baidu.com/search/url_submit.html
特點:
一個免費登入網站只需提交一頁(首頁),百度搜尋引擎會自動收錄網頁。符合相關標準您提交的網址,會在1個月內按百度搜尋引擎收錄標準被處理。百度不保證一定能收錄您提交的網站。
Google提交入口: http://www.google.cn/intl/zh-CN/add_url.html 特點:
Google每次抓取網頁時都會向索引中添加並更新新的網站,同時Google也邀請站長提交網站的網址。Google不會將所有提交的網址都添加到索引中,也無法預測或保證這些網址是否會顯示以及何時會顯示。提交同時還可以添加評論或關鍵字,或者對網頁的內容進行描述。這些內容僅供Google參考,並不會影響 Google 如何為您的網頁編排索引或如何使用網頁。站長只需提供來自託管服務商的頂層網頁即可,不必提交各個單獨的網頁。Google的抓取工具 Googlebot 能夠找到其他網頁。Google 會定期更新它的索引,因此無需提交更新後的或已到期的連結。無效的連結會在Google下次抓取時(即更新整個索引時)淡出Google的索引資料庫。
雅虎提交入口: http://search.help.cn.yahoo.com/h4_4.html 特點:
站長可以通過本服務將網址提交給雅虎搜尋引擎,搜尋引擎會隨著搜尋資料庫的更新,自動抓取您的網站。網站被收錄的速度根據搜尋引擎更新速度而定,可能需要花費數盩厔數月時間。由搜尋引擎自動抓取網站資訊,不保證會收錄所有的網站,也不提供網站描述語編輯及相關修改服務。
有道提交入口: http://tellbot.yodao.com/report?keyFrom=help
特點:
有道會經常在網上搜尋新的資料,更新自己的資料庫。有道也非常歡迎提供新的網站資訊,讓搜尋結果和使用體驗更為豐富。有道會對提交的網站內容進行分析,以確定是否使用以及使用周期。在登入網站時只需提交最上層的網頁,有道會自行尋找其它頁面。需要注意:有道會定期檢索並更新所有網站,刪除失效網頁,因而無需煩勞您頻繁提交更新網頁資訊。
二、提交注意事項
1.確保提交網站地址格式的正確性,一般搜尋引擎建議的網站地址為包含“http://”的完整網址,例如 http://www.sohu.com/;只需要提交網站的首頁便可,不需要一個網頁一個網頁進行提交;搜尋引擎自有爬蟲程式完成全站的遍曆。有些搜尋引擎登入需要提交網站的簡要描述,請注意按照實際情況書寫,也可以提交網站的描述資訊。搜尋引擎對提出登入請求網站的收錄周期一般為一個月。如果一個月後依然發現搜尋引擎沒有收錄該站,可以再次向搜尋引擎提交登入申請。
2.搜尋引擎更為喜歡內容健康的網站。如果你的網站展示的資訊內容與我們所處社會的基本道德相違背,那搜尋引擎將也不會對你的網站進行收錄。
3無論如何也要確保你的網站正常運行。等你向搜尋引擎提交了登入網站地址,搜尋引擎決定派出它的搜尋機器人去對你的網站進行爬行索引,如果你的網站在搜尋引擎機器人造訪的時候伺服器當機,爬蟲程式就無法完成索引工作。
附錄:百度搜尋引擎收錄規範
如何讓我的網站(獨立網站或者blog)被百度收錄?
百度會收錄符合使用者搜尋體驗的網站和網頁。
為促使百度Spider更快的發現您的網站,您也可以向我們提交一下您的網站的入口網址。提交地址是:http://www.baidu.com/search/url_submit.html。您只需提交首頁即可,無需提交詳細的內容頁面。
百度的網頁收錄機制,只和網頁價值有關,與競價排名等商業因素沒有任何關聯。
如何讓我的網頁不被百度收錄?
百度嚴格遵循搜尋引擎Robots協議(詳細內容,參見http://www.robotstxt.org/)。
您可以寫一個Robots檔案以限制您的網站全部網頁或者部分目錄下網頁不被百度收錄。如果您的網站是在被百度收錄之後再設定Robots檔案,則Robots檔案通常在兩周內生效,被檔案限制的內容,將從百度搜尋結果中移除。
如果您的拒絕被收錄需求非常急迫,也可以發郵件給webmaster@baidu.com請求處理。
為什麼我的網站內一些不設連結的私密性網頁,甚至是需要存取權限的網頁,也會被百度收錄?
百度Spider對網頁的抓取,是通過網頁與網頁之間的連結實現的。
網頁之間的連結類型,除了網站內部的頁面連結之外,還有不同網站之間的互相連結。因此,某些網頁即便通過您的網站內部連結無法訪問到,但是,如果別人的網站上有指向這些頁面的連結,那麼這些頁面還是會被搜尋引擎所收錄。
百度Spider的存取權限,和普通使用者是一樣的。因此,普通使用者沒有許可權訪問的內容,Spider也沒有許可權訪問。之所以看上去某些存取權限限制內容被百度收錄,原因有兩點:
A. 該內容在Spider訪問時是沒有許可權限制的,但抓取之後,內容的許可權發生了變化
B. 該內容有許可權限制,但是由於網站安全性漏洞問題,導致使用者可以通過某些特殊路徑直接存取。而一旦這樣的路徑被公布在互連網上,則Spider就會循著這條路徑抓出受限內容
如果您不希望這些私密性內容被百度收錄,一方面可以通過Robots協議加以限制;另一方面,也可以聯絡webmaster@baidu.com進行解決。
我的網頁為什麼會從百度搜尋結果中消失?
百度並不允諾所有網頁都可從百度搜尋到。
如果您的網頁長時間無法從百度搜尋到,或者突然從百度的搜尋結果中消失,可能的原因有:
A. 您的網站所在伺服器不穩定,被百度暫時性去除;穩定之後,問題會得到解決
B. 您的網頁內容有不符合國家法律和法規規定的地方
C. 您的網頁不符合使用者的搜尋體驗
D. 其他技術性問題
以下的說法是錯誤的和毫無根據的:
A. 參與了百度競價排名但未續約,會從百度搜尋結果中消失
B. 參與了其他搜尋引擎的廣告項目,會從百度搜尋結果中消失
C. 與百度旗下網站產生了競爭,會從百度搜尋結果中消失
D. 從百度獲得的流量太大,會從百度搜尋結果中消失
什麼樣的網頁會被百度認為是沒有價值而不被百度收錄或者從現有搜尋結果中消失?
百度只收錄百度認為有價值的網頁。任何網頁在搜尋結果中的去留變化,都是機器演算法計算和調整的結果。下述類型的網頁,百度明確不會歡迎:
A. 網頁做了很多針對搜尋引擎而非使用者的處理,使得使用者從搜尋結果中看到的內容與頁面實際內容完全不同,或者使得網頁在搜尋結果中獲得了不恰當的排名,從而導致使用者產生受欺騙感覺。
如果您的網站中有較多這種頁面,那麼這可能會使您的整個網站的頁面收錄和排序受到影響。
B. 網頁是複製自互連網上的高度重複性的內容。
C. 網頁中有不符合中國法律和法規的內容。
如果我的網站因為作弊行為而從百度搜尋結果中消失,是否還有被重新收錄可能?
凡是作出完全修正的網站,是有機會被百度重新收錄的。百度會定期對被處理網站進行自動評估,並對符合條件者重新收錄。
需要說明的是,百度技術和產品部門只對使用者搜尋體驗負責。以下的說法都是錯誤的和毫無根據的:
A. 我成為百度的廣告客戶或者聯盟網站,就可以重新被收錄
B. 我給百度若干鈔票,就可以重新被收錄
C. 我認識百度的某某人,就可以重新被收錄
我的網站更新了,可是百度收錄的內容還沒更新怎麼辦?
百度會定期自動更新所有網頁(包括去掉死連結,更新網域名變化,更新內容變化)。因此請耐心等一段時間,您的網站上的變化就會被百度察覺並修正。