仲介交易 SEO診斷 淘寶客 雲主機 技術大廳
搜尋引擎的歷史並不長,但搜尋引擎為互聯網所作出的巨大貢獻卻顯而易見,搜尋引擎改變了世界,改變了使用者的使用習慣,讓我們對互聯網的未來充滿信心。
搜尋引擎起步的時候做的並不好,第一個搜尋引擎甚至沒有分析網頁的副本,而且沒有排名的標準,為了深度挖掘商業潛力,這才推動搜尋引擎漸漸發展,研發更先進的系統。
第一個比較大的商業搜尋引擎是在美國的斯坦福大學,它在2001年花65億美元購買了@主頁。 在開始推廣的時候,最大的競爭對手是網址站,主要是因為那時候搜尋結果中很多都是垃圾郵件,而且人們還不習慣用搜尋引擎。
元標記是説明搜尋引擎排序的一個工具,通常叫做關鍵字堆砌。 一旦搜索關鍵字,那關鍵字和元標記就會告訴搜尋引擎內容是在哪一頁,在很短的時間做好中繼標記工作,提供相關搜尋結果,但隨著一些企業的市場行銷經驗增加,他們很容易提高關鍵字的排名,那時候比較流行「貸款、貸款、貸款」 之類的關鍵字堆砌,所以當時搜尋引擎的垃圾資訊氾濫成災,造成許多使用者的不信任感。
那時候一些重要的搜尋引擎包括:EINet銀河、WebCrawler、萊科斯、Infoseek、Inktomi、Ask、AllTheWeb等。
每一個搜尋引擎都有三個主要部分組成:
1、蜘蛛
蜘蛛的工作職責是發現新的網頁並收集這些網頁的快照,然後分析該網頁。
蜘蛛以抓取頁面為主,比如掃描網頁,所有的搜尋引擎都能夠實現深層檢索和快速檢索。 在深層檢索中,蜘蛛可以查找和掃描網頁內的所有內容;在快速檢索中,蜘蛛不遵循深層檢索的規則,只搜索重要的關鍵字部分,而不檢查和掃描網頁裡的所有內容。
大家都知道網站最重要的是快照時間,也就是說蜘蛛爬行和收錄的網頁速度越快,就說明這個網站在搜尋引擎心中越重要,比如新華網和人民網,蜘蛛每小時爬4次以上,有的網站一個月也不見得能被蜘蛛爬一次。 快照的抓取程度取決於網站內容的流行度、更新速度與網站功能變數名稱的新舊。
在蜘蛛的爬行規則中,如果有許多外部連結指向這個網站,那就說明這個網站比較重要,所以抓取這個網站的頻率很高。 當然,搜尋引擎這樣做也是為了省錢,如果都以同樣的頻率爬行所有網站,這樣需要更多的時間和成本,才能得到更全面的搜尋結果。
2、指數
蜘蛛在爬行的過程中,可能會重複檢查網頁的內容,然後查看網站內容是否是複製其他網站的,以保證網站原創內容的指數,該指數的結果一般都是基本保持複製內容的排序搜尋結果。 當你進行搜索時,搜尋引擎不會從網路上搜索,它會從指數中選擇搜尋結果,所以搜索得到的網頁數量並不能代表整個網站,但蜘蛛會在後臺掃描和保存網站的網頁數量。
在搜尋結果數量中,谷歌1-10個搜尋結果約為16.05萬,還有每個區域的搜尋結果排名,這些都可以用搜尋引擎的演算法指數來控制,或者說是控制一部分。
每個搜尋引擎在全國或全世界各地都建立資料中心,當你輸入需要搜索的關鍵字的時候,會由於資料更新的時間不同而致搜尋結果同步,所以在不同的地區就會出現不同的搜尋結果。
3、Web介面
當你使用搜尋引擎所看到的介面(比如google.com、baidu.com),搜尋結果取決於複雜的演算法,演算法都是從指數內調用結果,通過查詢並分析才能在前臺顯示,所以演算法的製作時間比較長,谷歌在這個技術領域上領先。
還有一些搜尋引擎的「一站式」特性,這類特性在英文搜索上比較常見,一般來說,搜尋引擎忽略「一站式」的話,這樣的搜尋結果將更加正確,比如搜索「貓,狗」的時候,搜尋引擎會排除「貓和狗」,只搜索「貓」「狗」。
關鍵字密度是衡量一個關鍵字出現在網頁上的頻率,一般搜尋引擎看到某網頁上的關鍵字超過密度範圍,那它就會分析該網頁是否作弊,現在搜尋引擎可以做到任何地域的字詞相關度處理。 所以在一般情況下,關鍵字應該在整個網頁中分散,但一定要有某個標題或段落長期不變。
搜尋引擎還有個核心分析技術就是連結的相關性分析,除了網頁排名和一般的連結,谷歌還看重錨文本連結,錨文本連結主要在於連結的年齡和位置,還有該連結的網頁是否屬於權威網站等。
連結是最大的網站品質指標,搜尋引擎都很關注著,因為現在友情連結比較難找,而你又很需要友情連結,所以連結中很少有垃圾資訊。 比如大學的網站在谷歌的權重很高,那是由於大學有很多高品質的外部連結。 隨著大家都瞭解到外部連結的重要性後,很多網站開始買賣連結,這也是現在搜尋引擎比較頭疼的問題,不過ask現在判定網站排名更多在於網站的品質。
所有的搜尋引擎都希望得到使用者回饋的資訊,他們期待在查詢之前、搜索查詢、時間間隔、和語義關係等方面,能更加瞭解到使用者的意圖,他們還會跟蹤使用者的點擊,如果使用者點擊一個物品,然後又馬上回到搜尋網頁面, 那搜尋引擎就會認為這個購買不成功,會刪除跟蹤清單,其實這種做法已經在向電子商務靠近了。
由此可以看出,搜尋引擎已經開始注重使用者體驗,為了做讓使用者肯定自己的勞動成果,並成為搜尋引擎行業的一個標準,或許未來的發展就在個人化搜索。
本文由HTTP://fenghuangren.5d6d.com/站長供稿!