Title和Meta標籤
標題(title):
網頁最佳化可以說是從title開始的,在搜尋結果中,每個抓取內容的第一行顯示的文字就是該頁的title,同樣在瀏覽器中開啟一個頁面,地址欄上方顯示的也是該頁的title.因此,title可謂一個頁面的核心.對Title的書寫要注意以下問題:
1.Title簡短精鍊,高度概括.含有關鍵詞,而不是只有一個網站名稱.但關鍵詞不宜過多,不要超過3個片語.
2.前7個字對搜尋引擎最重要,因此關鍵詞位置盡量靠前.總字數不超過30個漢字.
例如: google手機搜尋,可以砍到排在前面的幾個都是大公司手機頻道,手機這個詞是排在最前面的.
Meta屬性 關鍵詞(Keywords):
Keywords 提示搜尋引擎:本網站內容圍繞這些詞彙展開.
因此keywords書寫的關鍵是每個詞都能在內容中找到相應的匹配才有利於排名.
例如: 網易手機頻道. 關鍵詞時"手機,手機報價,諾基亞,摩托羅拉"不過最近搜尋引擎對Keywords屬性的權重降低,不如原來那麼重要了.
描述(Description)
描述部分用簡短的句子告訴搜尋引擎和訪問者關於本網頁的主要內容.用該網站的核心關鍵詞搜尋後得到的搜尋結果中,描述往往顯示為標題後的幾行標題文字.Description一般被認為重要性在title和keywords之後.描述的書寫要注意以下問題:
1.描述中出現關鍵詞,與本文內容相關,這部分內容是給人看的,所以要寫的很詳細,讓人感興趣,吸引使用者點擊
2.同樣遵循簡短原則,字元數含空格在內不要超過120個漢字.
3.補充在title和keywords中未能充分表述的說明.
例如:www.51edu.com 的在Google搜尋結果裡面描述:中國領先的教育門戶和國內最大的招生引擎,為使用者提供萬門優質課程優惠報名服務,為教育機構提供基於互連網的招生營銷,市場管理,品牌宣傳等專業化服務.
另外百度對頁面最開始的內容比較感興趣,通常以這部分內容作為現實結果.
例如:http://www.baidu.com/s?wd=site%3Awww.51edu.com&cl=3 顯示的頁面功能表列:
首頁 商學院/研究生 高考 中小學 外語 IT 職業教育 管理 考研 留學 音樂美術體育 使館文教處 專區 社區 進階搜尋 拉薩爾三年國際本科 考研
其他Meta標籤:
為了限制搜尋引擎對內容的抓取,可以採用以下幾個Robots Meta 標籤:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow|noarchive">
其中: all - 檔案將被檢索,且頁面上的連結可以被查詢
none - 檔案將不被檢索,且頁面上的連結不可以被查詢
index - 檔案將被檢索
follow - 頁面上的連結可以被查詢.
noindex - 檔案將不被檢索,但頁面上的連結可以被查詢
nofollow - 檔案被檢索,頁面上的連結不被查詢.
noarchive - 檔案不被緩衝
這些值是可以組合在一起使用.
說道這裡,不得不提一下Google另外的一個屬性 rel="nofollow". 使用方法:
<a rel="nofollow" href="http://www.1234567.com"> 小電影</a>
作用呢:就是告訴搜尋引擎這個連結不是經過作者自己編輯的,所以這個連結不是一個可信任的連結.搜尋引擎看到這個標籤就可能減少或完全取消連結的投票權重.但並不是所有的搜尋引擎都支援meta中的robots標籤.
綜合運用範例:
<title>親自教育-萬花筒兒童教育集團</title>
<meta name="Robots" content="all">
<meta name="keywords" content="親自教育">
<meta name="description" content="對於親子教師來說系統完善的親子遊戲教具是他們在親子活動前必不可少的實用性教材,北京智泉萬花筒教育研究院親子中心為教師及加盟商提供全套的親子遊戲教具">
訪問結構
訪問結構即通過幾層訪問到最終頁面,Google最好為三層,百度不限
較好的例子:
以 www.seochat.org為例.
www.seochat.org首頁為第一層, 百度最佳化為第二層,百度如何最佳化為第三層.這樣的結果便與搜尋引擎索引.百度如何最佳化這個頁面在百度和google裡面都有收錄.
次層網域訪問結構:
由於三層的目錄,容納的頁面有限,需要多級目錄.
這個時候使用前面我們講過的次層網域方式擴大級數.因為次層網域算獨立網站,目錄層次從當前次層網域算起.
外域訪問結構:
有的網頁在本網站層數很多,但也被Google收錄,這是因為這些網頁在被其他網站引用,而Goole從其他頁面進入這個頁面.可以使用Link命令查詢該頁的反相連結.
目錄和檔案命名
目錄和檔案名稱中的關鍵詞
目錄名稱和檔案名稱中可以使用到關鍵詞.如果是關鍵片語,則需要用分隔字元分開.我們常用連字號"-" 和底線"_"進行分割,URL中還經常出現空格碼"%20". 因此,如果以"中國製造"作檔案名稱,就可能出現以下三種分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
連在一起之後,關鍵詞就失去了意義.但事實上,至少在目前Google並不認同"_"為分隔字元.對Google來說,made-in-china和made%20in%20china都等於 made in china,但made_in_china就被讀成了madeinchina.
因此,目錄和檔案名稱如果有關鍵片語,要用連字號"-" 而不是底線"_"進行分隔.
URL應該越短越好
有人為了單純增加關鍵字而額外建多一個帶有關鍵字的子目錄,改變目錄結構.由於URL中含有關鍵字本身對排名提高協助並不大,因而這種做法多此一舉,也是搜尋引擎反感的.
不好的例子:
要做英文關鍵詞computer,這樣的目錄 http://www.ibm.com/computer/computer/computer.html是錯誤的.
好的例子:
http://www.ibm.com/computer/ 該目錄在根目錄下的第一級,權重相對第二級較大.
GB2312中文路徑
現在搜尋引擎對GB2312的中文URL能正常收錄了.最佳化無處不在,URL上的關鍵詞相比較題權重要少一些,但還是有效,有條件可以增加上.
動態網頁靜態化
雖然大多數搜尋引擎的蜘蛛程式現在基本都可以解讀符號"?"後的字元,但搜尋引擎更喜歡靜態檔案,所以要對動態網頁靜態化.
在介紹靜態化之前,介紹一些常用的Regex:
符號 匹配字元 樣本
\d
任何十進位數字 等價於[0-9]
\D 任何非數字 等價於[^0-9]
\s 任何空白字元 空格,定位字元,分頁符
\S 任何非空白字元 等價於"[^\f\n\r\t\v]"
\w 任何單詞字元 等價於"[A-Za-z0-9_]"
\W 任何非單詞字元 等價於"[^A-Za-z0-9_]"
\n 斷行符號換行
. 除\n以外的任何字元 (.)+匹配除分行符號以外的所有字串
? 0個或1個前面的字元 ab?c? 可以且只能匹配"abc","abbc","abcc"和"abbcc"
* 0個或多個所有的字元 ab* 可以匹配"ab","abb","abbb"
+ 1個或多個所有字元 ab+ 可以匹配"abb","abbb"等,但不匹配"ab"
{n} n表示數量,如果是2,表示2個字元 a{2} 可以匹配"aa",但不匹配"a"
{n,n} 從幾個字元開始到幾個字元結束,如果不寫,表示至少或者至多 a{3,} 匹配"aaa","aaaa"等,但不匹配"a"和"aa"
x|y 匹配"x"或"y" "ab(c|x)yz"匹配 "abcyz" 和 "abxyz"
\? \. \* + ? . * +
這種介紹下幾種靜態化方法:
1.使用IIS_ReWrite 靜態化處理,適合PHP,ASP,ASP.NET程式.
2.使用虛擬機器主機的ASP網站,需要使用404錯誤操作實現靜態化.
3.使用asp.net開發的網頁程式,使用URLRewriter.all實現靜態化.
4.基於Apache HTTP Server 靜態化
5.靜態化後檔案格式
架構結構
架構結構,即幀結構(Frame),包括IFrame,Frame.
架構型網站的優越性體現在頁面的整體一致性和更新方便上.尤其對於那些大型網站而言,架構結構的使用可以使網站的維護變得相對容易.但架構對搜尋引擎來說是一個很大的問題,這是由於大多數搜尋引擎都無法識別架構,也沒有什麼興趣去抓取架構中的內容.此外,某些瀏覽器也不支援架構頁面.
如果網頁已經使用了架構,或出於某種原因一定要使用架構結構,則必須在代碼中使用"Noframes"標籤進行最佳化,把Noframe標籤看做是一個普通常值內容的首頁.在<Noframe></Noframe>地區中包含指向frame頁的連結以及帶有關鍵詞的描述文本