仲介交易 SEO診斷 淘寶客 雲主機 技術大廳
閑來無事,整理一下搜尋引擎,多瞭解一些跟搜尋引擎相關的東西,增加一下知識面。 為什麼認為下面的搜尋引擎是主要的呢?因為它們要麼非常有名,要麼被非常廣泛的使用。 對於網站管理者來說,在這些著名的搜尋引擎上排上名次是至關重要的,因為這樣就有可能給自己的網站帶來潛在的無盡流量。
而對於資訊搜索者,這些著名而且具有商業背景的搜尋引擎能查詢到更多可靠的結果。 它們維護的比較好,而且更新頻繁,能夠跟上整個網路發展的快速步伐。
下面列出的並不都是我們所說「真正意義上」的crawl整個網路的搜尋引擎。 例如,雅虎和Open Directory都是通過人工編輯內容的「分類目錄」。 事實上,下面的這18個主要服務都提供搜索和分類兩類資訊,雖然都有各自的著重點。
1. AOL Search
HTTP://search.aol.com/
通過AOL Search,美國線上AOL的使用者可以從一個地方搜索整個網路和AOL自己的資訊內容。 上面列出的「對外」版本不包括AOL本身的內容。 他們的分類目錄和其中的網站資訊來自Open Directory(見下),Inktomi (見下)提供機器搜索的結果(crawler-based results),作為分類目錄的補 充。 在1999年10月AOL Search發佈之前,AOL使用的是由Excite支援的AOL NetFind。
2. AltaVista
HTTP://www.altavista.com/
根據檢索的頁面數,AltaVista一直都是互聯網上最大的搜尋引擎之一。 它全面的覆蓋度和提供的各種 高級搜索命令使它成為網上搜索者的最愛之一。 它也開發了許多針對初級使用者的功能,例如「Ask AltaVista」——來自Ask Jeeves(見下)。 AltaVista使用的分類目錄主要來自Open Directory。 AltaVista于1995年12月開始運行,最初由Digital擁有,然後1998年Digital被Compaq購買後,AltaVista由Compaq負責,接著它成為一家獨立的公司,現在由CMGI集團控制。
3. Ask Jeeves
HTTP://www.askjeeves.com/
Ask Jeeves是一種人工的搜索服務,目標在於指向到回答你所提問題的具體頁面。 如果它在自己的資料庫中沒有找到相關答案,它會提供從其他各個搜尋引擎中找到的頁面。 該服務于1997年四月中旬開始其 Beta測試,于1997年6月1日完全開始運作。 Ask Jeeves的結果也出現在AltaVista中(見上)。
4. Direct Hit
HTTP://www.directhit.com/
Direct Hit主要與其他搜尋引擎合作,提煉他們的搜尋結果來提供服務。 它的提煉是通過監測使用者對他們自己的搜尋結果的點擊情況來實現,那些獲得更多使用者點擊的網站會在Direct Hit的排名中升到較高的位置。 因此,這種服務又稱為「流行度引擎」。 Direct Hit的技術目前在HotBot獲得很好的應用,它同時也提煉Lycos的搜尋結果,在LookSmart和MSN Search中也是一個選項。 另外Direct Hit公司本身也檢索(crawls)網路以優化它自己的資料庫,這些通過上面的連結可以查看到。
5. Excite
HTTP://www.excite.com/
Excite是互聯網上最流行的搜索服務之一,它有一個中等規模的檢索頁面,而且在合適的情況下,在其搜尋結果中會整合一些非網路的資料,比如公司資訊和體育比賽結果等。 Excite于1995年下半年開始提供服務,成長的非常迅速併吞並了兩個競爭者,1996年7月吞併Magellan,1996年11月收購 WebCrawler,這兩家公司目前仍作為獨立的服務在運作。
6. FAST Search
HTTP://www.alltheweb.com/
以前稱為「All The Web」,FAST Search的目標是檢索整個網路。 它是第一個檢索頁面突破2億的搜尋引擎,FAST Search背後的這家挪威公司也支援著Lycos的MP3搜尋引擎。 FAST Search于1999年5月推出。
7. Go/Infoseek
HTTP://www.go.com/
Go是一個由Infoseek和Disney共同推出的門戶網站,它提供了門戶網站的特色如個人化定制、免費郵件等,同時它也將以前的InfoSeek搜索服務整合在其中。 資訊搜索者會發現GO搜尋引擎對於很多一般的查詢都能給出高品質的結果,這要歸功於它獨特的ESP搜索演算法。 它同時也有一個非常棒的人工編輯分類目錄。 Go是1999年元月正式推出,它和下面介紹的GoTo沒有關系。 先前的Infoseek服務是1995年初開始的。
8. GoTo
HTTP://www.goto.com/
和其他主要搜尋引擎不同,GoTo出售它的主要目錄上的排名。 一家公司可以通過付費提高自己在搜尋結果中的排名,GoTo認為這樣可以增強搜尋結果的相關性。 GoTo引擎的免費搜尋結果來自Inktomi。 GoTo于1997發佈,整合了先前Colorado大學開發的World Wide Web Worm。 它于1998年2月轉移到現在的這種付費排名模式,緊接著用Inktomi代替了WWW Worm提供免費搜索。 GoTo和前面提到的Go(Infoseek)無關。
9. Google
HTTP://www.google.com/
Google是一家非常強調連結廣泛度(link popularity)的搜尋引擎,連結廣泛度在其搜尋結果的排名演算法中份量很重。 這對於在查詢一些很一般的詞時(比如「汽車」「旅遊」等)非常好,可以得到比較有價值的結果,因為一般好的網站,人們連結的就多。
10. HotBot
HTTP://www.hotbot.com/
和AltaVista一樣,HotBot也是因為它龐大的檢索頁面和許多的高級搜索特色成為搜索者喜愛的引擎。 在多數情況下,HotBot 搜尋結果的第一頁來自Direct Hit服務(見上),後面的結果則來自Inktomi——它被許多搜索服務採用。 HotBot的目錄資訊來自Open Directory(見下)。 HotBot是Wired公司為進入搜尋引擎市場于1996年5月發佈的,Lycos在1998年10月買下了Wired Digital公司,但HotBot仍作為一個獨立的搜索服務在運作。
11. Iwon
HTTP://www.iwon.com
該公司的背景是全美電視網路CBS,iWon的分類目錄由Inktomi自動生成,Inktomi也提供傳統的機器搜尋結果。 在整個運作上,iWon與其他主要服務商都不同,它採用一種每天、每週和每月發佈獎金的商業模式。 1999年秋季開始正式運作。
12. Inktomi
HTTP://www.inktomi.com/
最初,在加州大學伯克利分校有一個Inktomi搜尋引擎。 然後,開發人員使用相同的名字創立了自己的公司,並建立了一個新資料庫,開始僅僅用來支援HotBot,現在Inktomi的檢索資料庫也同時支援著其他一些搜索服務。 這些引擎服務都使用Inktomi同樣的資料來源,只是查詢結果有所不同。 對於一般使用者無法直接查詢Inktomi的資料庫,它只對其合作夥伴開放,同時各家引擎在調用Inktomi的資料時採用了各自的演算法和命令。
13. LookSmart
HTTP://www.looksmart.com/
LookSmart是一個人工編輯的網站目錄。 除了本身是一個獨立的服務外,LookSmart也為MSN Search、Excite和其他一些合作夥伴提供分類目錄的內容。 當LookSmart本身的資料庫沒有找到結果時,它使用AltaVista提供的搜尋結果。 LookSmart于1996年10月獨立發佈,接著由讀者文摘(Reader''s Digest)管理了一年,然後公司管理層又買回公司的控制權。
14. Lycos
HTTP://www.lycos.com/
Lycos最初是一家搜尋引擎,自己檢索(Spider)網路。 然後1999四月,它轉向類似于雅虎的分類目錄模式,它的主要分類資訊來自于Open Directory,其次的結果來自Direct Hit或Lycos自身的資料。 1998年10月,Lycos收購了其競爭對手HotBot,不過HotBot繼續獨立運作。
15. MSN Search
HTTP://search.msn.com/
微軟的MSN Search搜索服務是由LookSmart支援的一個分類目錄,其他的搜尋結果來自AltaVista,同時還整合了RealNames和Direct Hit的資料。 MSN Search為Internet Explorer 5的使用者提供了一種保存以前查詢結果的獨特方法。
16. Netscape Search
HTTP://search.netscape.com/
Netscape Search的結果主要來自Open Directory和Netscape自己的「Smart Browsing」資料庫,它在查詢「正式」網站方面做得很好。 其次的搜尋結果來自于Google。 在Netscape的Netcenter 門戶網站上,也整合了其他許多的搜尋引擎。
17. Northern Light
HTTP://www.northernlight.com/
Northern Light是另一家網上研究人員喜愛的搜尋引擎,它擁有互聯網上最大之一的檢索資料庫,同時有按照主題歸類文檔的能力。 Northern Light還擁有大量「特別的」檔資料,這些資料一般的搜索機器人(search engine spiders)很難檢索到,這些特殊的檔來自很多資料來源,包括新聞專線,雜誌和內部資料庫,查詢這些檔是免費的, 但是想閱讀它們需要付費,最高收費$4,當然對於一般的公用資訊不需付費。 Northern Light于1997年8月開始對外服務。
18. Open Directory
HTTP://dmoz.org/
The Open Directory使用義務編輯來分類網站,最初叫著NewHoo,1998年6月開始,1998年12月被Netscape收購,該公司保證任何人只要遵守一個開放授權合約,就能使用該目錄的資訊內容。 Netscape本身是第一個授權合約,Lycos和AOL Search充分的使用了Open Directory的資料,同時AltaVista和HotBot也在他們的搜尋結果中整合了Open Directory的結果。