搜搜SoSo搜尋引擎最佳化SEO規範

來源:互聯網
上載者:User

  前言

  搜尋引擎最佳化,即SEO(Search Engine Optimization),指為了提升網站/網頁在搜尋引擎搜尋結果中的收錄數量和排序位置,為了從搜尋引擎中擷取更多免費流量、高品質使用者,針對搜尋引擎的檢索特點、排序規律,合理調整最佳化網站設計和建設方法,使其符合搜尋引擎的檢索規則的網站建設、網站運營行為。除此之外,SEO工作還有利於搜尋引擎快速收錄新頁面,提高收錄覆蓋率的效果。

  SEO是網路營銷的重要手段,通過瞭解搜尋引擎工作原理和使用者需求,在尊重搜尋引擎使用者價值的前提下,對網站進行合理最佳化,可以擷取更多的使用者、流量和品牌。SEO具有成本低、易操作、有益於使用者體驗等特點,是網站自我營銷時必須重視的一個環節。

  搜尋引擎簡介和SEO基礎

  搜尋引擎及其使用者價值

  搜尋引擎,是對互連網的資料資訊進行收集、整理,並提供檢索查詢服務的系統。搜尋引擎擅長理解使用者搜尋需求、對海量資料抓取、資訊甄別和打分、快速查詢等工作。

  搜尋引擎根據使用者的檢索查詢要求,對資料資訊進行打分排序,並按照順序輸出呈現,協助使用者方便、快速、準確、全面地找到所需資訊,這是搜尋引擎最重要的使用者價值。

  [提示]一切SEO工作,都應以遵循搜尋引擎工作原理和使用者價值為前提。

  白帽SEO和黑帽SEO

  白帽SEO,指通過合理最佳化網站,提升使用者體驗,與搜尋引擎良好互動,真實反映網站品質和權威性的搜尋引擎最佳化方法。

  黑帽SEO,以搜尋引擎禁止的方法影響搜尋引擎排序(作弊),與使用者價值和搜尋體驗相背離,以短期利益為主要目標的搜尋引擎最佳化方法。搜尋引擎會維護互連網網站的公正排序,給使用者提供正確合理的搜尋結果,而黑帽SEO的做法與此相違背。

  搜尋引擎在不斷通過技術革新、策略最佳化來識別作弊行為。任何利用搜尋引擎的策略缺陷漏洞,利用惡意手段擷取與網頁品質不符的排名,引起用搜尋結果品質和使用者搜尋體驗下降的行為都可能被搜尋引擎識別為作弊行為。對待作弊行為,輕則被搜尋引擎剝奪作弊權重,重則可能整個網站被搜尋引擎拒絕收錄。

  搜尋引擎工作流程圖

  

 

  [提示]對外,面向使用者和整個互連網內容;對內,分為抓取、索引、檢索幾個重要模組。

  搜尋引擎爬蟲

  搜尋引擎的爬蟲程式(也叫Spider、蜘蛛、爬蟲機器人),是搜尋引擎收集資訊、資料的工具。爬蟲程式不斷髮現和下載互連網網頁,這個過程是互連網網頁進入搜尋引擎內部必須經曆的一關。

  爬蟲程式擅長:分配下載資源,海量並發下載,讀取文字(特別是網頁文本),分析網站地圖並依此指引抓取頁面。相反爬蟲程式不擅長:讀取圖片、flash、JS、Ajax、frame,深層次、持久性抓取,讀取有許可權控制的頁面,發現孤島頁面。

  針對爬蟲程式的SEO工作應該根據其特點針對性進行。

  

 

  [提示]搜尋引擎爬行軌跡示意圖

  搜尋結果排序

  搜尋引擎通過理解使用者搜尋字詞、對資料進行檢索,可以得到諸多可能的搜尋結果。對這些結果的排序要靠成百上千的相關性策略實現。

  相關性排序的目的是將結果按照對使用者價值的高低排列,整個排序過程會參考網站、頁面的相關度、品質、時新性、權威性等諸多因素綜合考察。

  SEO工作很大一部分跟搜尋引擎相關性策略有關,簡單來講即通過SEO來告訴搜尋引擎:哪些頁面更有價值,哪些頁面更搜尋字詞更相關,而應該被排序到更靠前的位置。

  網站建立

  網域名稱註冊

  網域名稱是網站的重要品牌印象。網域名稱註冊時應選擇簡單、易記、方便輸入、貼近網站名稱、能反映網站內容的網域名稱。如fanli.qq.com、www.paipai.com。

  網域名稱一旦選定,不應隨意變更;同一網站擁有多個網域名稱應確定主要網域名稱,並設定其他網域名稱向主要網域名稱跳轉。

  服務部署和網站上線

  網站需要部署上線才能被使用者訪問。

  租用/購買安全可靠、高速穩定的伺服器部署網站,是使用者訪問體驗的有效保障,同時會影響搜尋引擎爬蟲的爬取。

  網站部署上線並進行網域名稱解析後,即面向使用者開發訪問,同時也意味著向搜尋引擎爬蟲開放。

  讓搜尋引擎發現網站

  建立立的網站是互連網中的孤島,搜尋引擎也很難發現和收錄它。在網站建立之初,可以將網站推薦給搜尋引擎或者引導爬取收錄。

  向搜尋引擎提交網站網域名稱或入口。如向SOSO的提交新網站,http://www.soso.com/help/usb/urlsubmit.shtml;

  建立外鏈,如建立友情連結、嚮導航網站申請收錄等;

  網站建立之初可重點經營內容列表頁,在不影響使用者體驗的前提下,方便搜尋引擎爬蟲一次發現更多連結。

  內容建設

  樹型扁平網狀結構

  層級分明的樹型扁平網狀結構是較理想的網站部署結構,每個頁面與其父子頁面有連結關聯,可以協助使用者快速定位到感興趣的頻道、本文,也有利於搜尋引擎理解網站結構層次和更好的爬取內容。

  

 

  明確區分出,網站首頁、列表頁/索引頁/頻道頁、內容頁,根據各個頁面所在層級用連結相連,無孤島頁面;

  層級、各層級分支內容不要過多,便於搜尋引擎爬蟲爬取;

  內容和品質相似的頁面組織在同一層級/目錄中,便於搜尋引擎進行彙總挖掘;

  越重要的內容,越應放置於高層級位置,或在高層級頁面中有連結直接可達;

  

 

  [提示]騰訊網新聞頻道,頭條新聞放置於醒目位置

  在頁面中建立導航連結、麵包屑,便於使用者和爬蟲理解網站結構和在不同層級內容間跳轉;

  網站中新的內容應該盡量在深度較淺的列表頁或首頁發布入口,便於被搜尋引擎爬蟲快速發現。

  頁面標題

  頁面標題是頁面內容的重要標識,準確簡潔的標題有助於使用者快速識別頁面內容。頁面標題會被搜尋引擎展現在搜尋結果列表中,是使用者通過搜尋進入網站頁面的重要入口。

  標題內容在頁面代碼中被<title>標籤包圍,會被展現在搜尋結果頁、瀏覽器標題、頁面標籤、工作列等位置,是使用者識別/區分頁面的重要依據;

  

 

  標題內容是頁面的最佳概括,應當主題明確,突出重點,內容不宜過長;

  每個頁面都應該擁有標題內容,避免不寫標題,或無意義標題(如“無標題文檔”、“網站建設中”);

  避免不同頁面使用相同標題(甚至全站公用相同標題);

  不在標題內容中堆砌關鍵詞,避免影響可讀性和被判作弊;

  “標題黨”、“文不對題”對使用者搜尋體驗和搜尋引擎收錄排序均有副作用,應堅決杜絕。

  Meta資訊

  Meta資訊中,keywords和description分別以關鍵詞和概括摘要兩種方式描述頁面內容,會被搜尋引擎特別關注。

  keywords部分應填入最能表現頁面內容的幾個關鍵詞,詞與詞之間以半形逗號間隔開;

  description部分應填入一段介紹頁面內容的文字,這段文字有可能被搜尋引擎選取作為結果摘要。網站首頁、索引頁、頻道入口等無大篇幅頁面本文的頁面,應該儘可能提供description資訊。

  keywords和description資訊缺失不會對排序權重產生直接影響;在keywords和description資訊中堆砌關鍵詞作弊可能受到搜尋引擎懲罰。

  騰訊網的description資訊:

  

 

  騰訊網在網頁搜尋結果中的摘要展現:

  

 

  連結

  制定規範統一、簡潔、可讀的url,有利於搜尋引擎的收錄和排序,也會方便使用者識別頁面內容,記錄和輸入連結。

  每個頁面都應擁有其獨一無二的正常態url:

  網站內統一使用正常url,不出現異常url;

  指向同一頁面異常url,應跳統一跳轉到正常url上;

  必須帶有參數的url需要精簡參數個數和內容,對頁面功能/展現無作用(如統計參數)的應盡量去除。

  連結結構設計建議:

  url結構的設計應同時考慮使用者和搜尋引擎的需求,方便使用者識別、記憶,並利於搜尋引擎爬取和展現;

  url應盡量短。較短的url會在搜尋結果頁完全展現,方便使用者通過讀取其以瞭解頁面內容,也易於記憶和傳播。搜尋引擎本身不會對url進行限制,排序跟url長度無關;

  url目錄層級越少越好。層級過多的url設計可能對搜尋引擎的爬取形成障礙,使得收錄變少或不收錄;

  url中目錄名、檔案名稱應具有描述性,不使用無意義的名稱;

  url中盡量只使用小寫字母或數字,特別注意不要使用特殊字元,如“.”“,”“;”等;

  去除url中不必要參數和靜態化。無論動態或靜態url ,搜尋引擎均可正常爬取和檢索,但建議盡量精簡去除url中不必要的參數,特別是與頁面功能/展現無關的參數。

  錨文本設計建議

  連結應選擇文字作為連結描述,即錨文本,盡量少使用圖片作為連結內容,必須使用圖片時,應同時使用alt標記補充文字描述,不要用flash、js替代文本連結(特別是重要入口);

  錨文本應簡潔精鍊,明確描述頁面內容;不要在錨文本裡編寫與頁面內容無關的文字,更不要堆砌關鍵詞或者“標題黨”;

  非必要的情況下,不要使用url本身作為錨文本。

  連結設計GoodCase

  http://finance.qq.com/stock,http://t.qq.com/liuxiang,子網域名稱、目錄描述了頁面主題或內容;

  http://finance.qq.com/a/20110317/005789.htm,新聞頁面目錄標識了發布日期;

  連結設計BadCase

  連結url為js產生,搜尋引擎無法爬取到連結指向頁面。

  

 

  

 

  http://7.sixjoy.com/webplat/info/news_version3/87/97/98/99/m51/201103/2763.shtml,連結陷阱/黑洞,這類url目錄構造對使用者和搜尋引擎均無意義,搜尋引擎可能不會爬取或者不索引這類url。

  錨常值內容無意義。類似“更多”“返回”的文本對頁面內容的描述沒有貢獻,不建議使用。

  

 

  首頁連結全部在flash內部,無法擷取更多站內連結,同時結果頁摘要顯相關較差。

  

 

  全站頁面標題全部相同,無法體現頁面內容,在搜尋結果和瀏覽器中均不易讓使用者識別,同時搜尋引擎無法通過標題瞭解頁面內容;

  

 

  頁面內容和服務

  提供高品質的網站內容和服務是網站的立足之本,同時也是影響搜尋引擎對網站內容評價的重要因素和指標。

  提供圍繞網站主題或頁面主題的內容或資料,自然、美觀的書寫頁面內容,滿足使用者的閱讀需求,這是對使用者最有價值的服務:

  給使用者提供便於閱讀的頁面。頁面配置合理,突出展現重點內容,內容間有主次、段落,避免一大堆文字的粗暴羅列;

  在頁面中放置麵包屑導航。麵包屑對使用者辨識頁面作為位置、層級有協助,還能快速在不同頻道間切換。SOSO音樂/SOSO問問/騰訊網新聞頻道的麵包屑導航:

  提供與眾不同的原創內容或服務,避免抄襲內容或重複發布相似、相同內容;

  與主題不相關或弱關性的內容,如廣告、站內推廣連結等,應放置於頁面次要內容,並且不佔用過多篇幅;

  不要有拼字錯誤或錯別字。

  同時,頁面內容建設也照顧搜尋引擎讀取頁面的“感受”:

  頁面本文用文本書寫,不要用圖片、flash代替,或用ajax產生;

  站內導航和麵包屑易於搜尋引擎爬取頁面、擷取錨文本和分析連結權重;

  使用圖片作為內容時,為圖片添加alt資訊,圖片檔案使用簡潔直白的命名(類似給頁面的命名);

  不要使用iframe構造頁面。

  robots.txt和Sitemap

  robots.txt和sitemap是站長和搜尋引擎交流的工具,為搜尋引擎的爬取、收錄、排序行為提供參考。robots.txt和sitemap均不涉及對使用者體驗的直接影響。

  robots.txt:

  robots.txt檔案,需要準確命名為”robots.txt”(檔案名稱小寫,副檔名為txt,),放置於網站網域名稱的根目錄下,能被正常訪問;

  可以使用robots.txt限制搜尋引擎爬蟲訪問某些頁面、目錄或者整合網站。如供網站管理員使用的線上管理系統,或使用者隱私資訊頁面,均可以此方法控制;

  可以在robots.txt指定sitemap地址。

  User-agent: *

  Disallow: /admin/

  Disallow: /ads/

  Sitemap: http://www.soso.com/sitemap.xml

  [提示]以上是一段robots.txt檔案的樣本。標識了拒絕搜尋引擎訪問的路徑和sitemap地址

  Sitemap:

  Sitemap中可以指定url的更新時間、更新頻率、相對權重等資訊;

  重要的url應該出現在Sitemap中,給予較高權重;

  搜尋引擎會參考Sitemap中的資訊進行爬取、索引和排序,但不會完全遵守;

  其他

  搜尋引擎在響應網站內容變化需要時間,特別是針對網站內容建設的SEO是逐漸生效的,改變網站幾個頁網頁內容就能迅速提高網站排名的觀點是錯誤的;

  搜尋引擎對於不符合規範的網站建設方式或者過度SEO有一定容忍能力,並不會因為網站建設不當而直接拒絕爬取、收錄、索引某個網站;

  面向SEO的網站建設策略和使用者體驗應兼顧,甚至更多考慮使用者體驗,避免為了SEO而SEO。

  網站運營和推廣

  面向使用者的網站運營和推廣工作,可以起到引入和沉澱使用者、建設網站口碑、增強使用者黏性的作用。而然,網站運營和推廣同樣可以在SEO工作中發揮作用,下面從這個維度來簡單介紹。

  內容運營

  原創內容建設

  網站建設以內容為王,在內容品質、原創、全面、權威等方面有優勢的網站,更容易贏得使用者好感,同時也會贏得搜尋引擎收錄和排序的傾向。

  搜尋引擎非常喜歡原創內容(特別是對於新站來說)在網站上主動發布或引導使用者來發布原創內容,增加原創內容比例,會讓搜尋引擎更快收錄,同時在內容排重、排序上佔得優勢。

  規律的內容維護

  規律的內容更新時間和更新規模,有助於搜尋引擎合理調度爬蟲進行抓取。更新較快較多的網站,也容易贏得搜尋引擎爬蟲的高頻率光顧。

  廣告內容運營

  廣告能為網站帶來收入,是網站運營不能迴避的運營工作。從SEO角度看來,也有些應注意的最佳化點。

  網站內容和廣告內容應區分出主次,突出頁面核心內容,利於搜尋引擎理解頁面內容,而不應滿屏廣告;

  廣告內容應配合頁面內容,與頁面內容、主題相關(搜尋引擎爬蟲可能採集廣告內容作為頁面本文);

  不要將廣告內容偽裝成頁面本文或連結,誘導點擊。

  增加外鏈和積累有效錨文本

  站外連結和錨文本是網站的重要SEO資源,承擔著入口、頁面內容識別、權重引入等諸多參與搜尋引擎爬取、排重、排序工作的資訊。對外鏈和錨文本的建設,是SEO工作中極重要的一環。

  以下是一些外鏈、錨文本建設的建議:

  互換友情連結、申請導航站收錄;

  建設外鏈資源時,應合理設定錨文本,盡量不要以url做錨文本;

  不止網站首頁需要外鏈,二級列表頁、專題頁、頻道首頁、特色頁面等,同樣需要外鏈建設;

  發行就緒網站功能特色介紹的文章,期間包含網站外鏈;

  部落格博文、微博、論壇文章中出現的網站連結,對外鏈和錨文本建設有益,可將網站介紹文章轉寄於此,但不要泛濫建設;

  部落格評論區、留言板、bbs簽名檔等非主要區域的外鏈價值極低,可能被搜尋引擎忽略;

  外鏈、錨文本應避免泛濫建設,否則可能被判為作弊。

  使用者推薦和評價

  使用者有鑒別內容品質的能力,通過使用者對網站內容的推薦和評價,可以協助網站篩選好的內容,甚至製造外鏈。

  建立使用者對內容投票機制,擷取使用者評價;

  提供方便的分享工具,可將內容推薦到其他產品平台,形成有價值外鏈;

  

 

  [提示]一個常見的分享功能設計

  培養使用者黏性,並適當鼓勵使用者對朋友推薦網站內容(包括在IM、部落格、論壇等平台上推薦)。

 

  來源:郝聰SEO部落格 http://www.bloghuman.com/soso-seo-standard/



相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.