在互聯網上,資料就是金錢。 對於這一點,商品HTTP://www.aliyun.com/zixun/aggregation/34926.html">交易網站應該最有體會。 做為全球最大的拍賣網站,Ebay 擁有的資料量是驚人的。 那麼,公司是如何利用這些資料來促進線上交易的呢? 最近,Ebay 的搜索及平臺副總裁 Hugh Williams 在悉尼的大資料大會(Big Data Summit)上分享了公司的做法。
Ebay 網站有 1.8 億個活躍使用者。 在任何一個給定的時刻,都會有 3.5 億左右的商品被銷售。 Ebay 的拍賣搜尋引擎上,每天會產生 2.5 億次搜索。 Hugh Williams 說,公司在 Hadoop 集群和 Teradata 伺服器上擁有的原始資料是 10 PB。 通過對這些資料的利用,公司可以提高線上的交易量,引導使用者購買更多商品。
Hugh Williams 主要談到了搜尋引擎的優化。 通過對資料的分析,公司可以把握使用者的行為模式,從而優化搜尋結果。 「如果將時間倒退幾年,你使用 Ebay 的搜尋引擎時,會發現它只理解字面意思」,Williams 說,「你可以在搜尋引擎輸入文字,它將按照字面含義尋找,但是並不能真正理解你想法的深層含義」。
現在,Ebay 要使搜尋引擎更加「直覺化」。 例入,Ebay 發現,那些想要購買 Pilzlampe 的使用者,如果他們輸入了「Pilz lampe「的話,更有可能購買商品,因為搜尋引擎會給出更多結果,因此,搜尋引擎通過在單詞中增加一個空格,就可以增加線上交易量。
Ebay 會根據自己掌握的資訊,改變或重寫使用者的搜索請求,增加同義字或者替換語句,從而給出更具相關性的結果。 另外,Ebay 還通過大資料來預測商品是否銷售出去,銷量會是多少,然後調整商品在搜尋引擎上的排名。
Williams 說,增加因素來改變搜尋結果是有風險的。 公司通常需要幾個月來增加一項因素,而且他們不知道是否真的對使用者有用。 為此,Ebay 會在一小部分使用者那裡進行測試,然後觀察他們的反應。
改善搜尋引擎的過程中,對使用者搜索請求的情景判斷是一個挑戰。 比如使用者在搜索「吉朗貓球隊(Geelong Cats)」的時候,搜尋引擎可能會把「貓」做為關鍵字,然後搜索寵物這一類別,這對於使用者來說是無用資訊。 「在我們這樣的大規模下,會發生很多微小的問題,因此需要資料專家之類的人員來調查這些事情。 」Williams 說。
(責任編輯:施柏鵬)