仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
很多新手站長在做網站的時候忽略了SEO優化的重要一步,那就是搜尋引擎的作原理, 搜尋引擎的工作原理簡單分為這麼幾個步驟:第一步是抓取→第二部是建庫→放到資料庫中進行排序→百度通過分析使用者的需求把使用者最需要的結果展示的使用者面前。 如果網站需要被搜索到,那麼必須知道你的站存在,抓取,過濾,目前中國400萬個網站,資料是以億計算的,百度是不會把所有的頁面都抓取的。 當然百度認為有價值的才會建立索引,就是我們經常說的收錄,前提是知道連結的存在。
那麼怎樣才能讓網站內容被搜尋引擎更好的抓取到並且有良好的收錄呢?這裡有兩個方式:1.主動提交sitemap網站地圖到站長平臺;2.被動抓取。 發外鏈引蜘蛛,很多人發的是首頁的連結,這對網站權重以及排名是非常有影響的,這一點大家一定要注意!
主動提交和被動抓取到底哪個好?其實這兩者沒任何區別。 首先要瞭解知道你的站為什麼不抓取。
第一、分析這個功能變數名稱以前是否被處罰過。 如果被處罰過,那就需要4至6周的考核期,這個時間段如果網站正常操作,就不會有問題。 如果百度即使知道連結的存在,還不會抓取。 就要做個功能變數名稱調查,先把功能變數名稱在百度或谷歌查下,看看這個功能變數名稱是否有人用過,有可能別人用過的功能變數名稱,沒有繼續續費,說明這個功能變數名稱以前是有過違規操作的。
第二、蜘蛛根本來不了。 蜘蛛訪問這個功能變數名稱的時候進行dns解析,功能變數名稱轉為ip,找到ip所在伺服器進行訪問,如果dns做了手腳,或者空間商做手腳,導致蜘蛛沒法抓。 空間商遮罩蜘蛛,是會產生壓力。 曾經有一個朋友問過重慶SEO曾曉龍,聽說他的網站20天或者十幾天新站開始收錄,讓我幫他分析一下原因,我告訴他可以去驗證百度站長平臺,接著會收到百度站長平臺的資訊提醒,搜尋引擎訴法抓取網站,網站對搜尋引擎進行全站封禁。 這個時候就需要換個空間,他換了空間之後馬上就可以收錄。 (SEO最新技術交流群→_→138426856)
百度站長平臺裡面壓力回饋,抓取壓力即搜尋引擎在單位時間內對一個網站伺服器訪問的頻率和總次數。 如果0,證明沒去。 壓力值716,這個數值只能證明搜尋引擎去,但是去哪些頁面不知道。 如果去了只去首頁,或你想被收錄的頁面都沒去,沒訪問到內頁,你看這個值也沒什麼用,那怎麼看有沒有來抓取呢?
伺服器日誌
看蜘蛛訪問哪些頁面。 如果有獨立的伺服器,vps可以自己搞(光年日誌分析是一款很不錯的工具),還要去判斷真假蜘蛛,因為百度蜘蛛不一定是真的,在站長工具對網站查詢時,也會產生假蜘蛛。
1.看日誌,需要判斷真假蜘蛛,有些蜘蛛並不是真的,有些人類比蜘蛛對網站採集,這個時候就會產生假蜘蛛。
2.如果網站是動態程式,把網站設置成偽靜態,日誌記錄的路徑都是動態的,不會記錄偽靜態,如果是純靜態的就可以直接看。 因為做成偽靜態很難分析路徑。
問題分析:
1、許可權設置 有些是需要會員才可以進入的,所以蜘蛛是進不去的。 robots把這些路徑遮罩了也抓取不了。
2、結構問題 爬取困難。 如果一個網站的結構非常複雜,雜亂無章,很有可能搜尋引擎爬著爬著就放棄爬行了,這個對於任何SEOer都是應該注意的。 這篇《怎樣優化網站才能穩居首頁排名》就分析了網站結構以及路徑優化的方法。
3、信用度 如果發現垃圾資訊太多,爬回的頁面過濾,分類整理,然後篩選 ,建立索引。 它會剔除空頁面和無意義的頁面。 整個頁面是flash 登陸頁面 註冊頁面 或產品頁面就是一張圖片,則有的是空頁面,無意義的,這樣的是沒有必要被收錄的。
判斷頁面價值得分
達到收錄標準,本身得分的高與低,這裡分為兩點:
1、這些取決於網站本身權重的高與低。 權重高,收錄很容易,標準也降低很多。
2、頁面的品質得分 內容是否原創,還是複製,是不是稀缺性的文章,對網站的客戶有用。 要知道百度推出的星火計劃鼓勵原創而且原創會加分,並且會有很好的排名。 如果實在寫不了原創,也可以在原本內容上添加附加內容和價值,這也是一篇很好的文章。
3、內頁是否有外部連結。 外部連結可以對內頁投票,就更好的達到收錄標準。
如果想要自己寫的描述被抓,想做的關鍵字儘量的出現在描述裡面。
除了上面講的,還要考慮自然性連結,需求頁面的主題是什麼?相關的需求及問題,小的標題要有吸引力,要讓客戶看下去的理由,吸引使用者快速定位他想要的東西,層次清晰。
總結:要想解決內容收錄的問題,先看功能變數名稱是否是被處罰過的,空間商有沒有遮罩蜘蛛,經常查看伺服器日誌,要回辨別真假蜘蛛,內頁的得分要做好內頁外鏈。