從google產品來看搜尋引擎需求

來源:互聯網
上載者:User

1)搜尋需求

人human  <---> 關鍵字key <---> 資訊infomation

 

2)網頁搜尋

搜尋中最成熟的技術,從關鍵字找到資訊,使用倒排索引這種極有效果的索引格式;

其它MP3搜尋,新聞搜尋等都是其一個子項,要麼是限制網站的站內搜尋,要麼就是對時間特別敏感,有時效性;

 

3)網頁目錄導航

這是從資訊中抽取關鍵字,自動網頁分類技術; 用到的是資料採礦技術,這個也比較成熟了.首先建起語料庫,包括分類目錄和各種目錄下取一定數量的樣本;其次是訓練過程,使用

語料庫,得到特徵值,進行特徵抽取,得到一個模型; 最後對搜尋到的每個網頁與模型進行匹配,劃分到具體某個分類中.

 

4)個人化搜尋

這是根據人的狀況來推資訊. 通過分析人的查詢日誌,使用者資料,建起使用者資料模型,然後向人推這個模型所對應的資料. (這是主動推的)

有一種個人化首頁是通過RSS技術來實現內容的自動推取.(也就是這個模型是由人自己來確定的,是簡化了的個人化搜尋)

樣本: 各種推薦子系統

 

5)map搜尋

google終於整合了公交搜尋到地圖中,原先只是行車路線,現在準備到大眾運輸路線,實用性大大增強.

map搜尋是google的特色之一,也是專屬的核心技術之一,很強大的功能,有全球衛星的寵大照片資料庫,配合google earth使用,將是google的利器.

6)垂直搜尋

房屋,車票等是屬於垂直搜尋的範疇了,以google強大的技術後備力量,如果要進入垂直搜尋行業,別的人還真的很難與其競爭,只能把服務做的更細緻,酷訊要努力了....

其它如程式碼搜尋都只是其的一種應用而已...

 

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.