標籤:style com 資料 工作 問題 表
概要:看這篇文章的初衷,是這篇文章回答了問題“在一個query的結果當中,給出多少個廣告位合適?”。文章不長,不過一路看下來,發現貌似不是native-english-speaker寫的,細節說的不清楚,完全無法還原作者的工作思路。不過還是有那麼一點兒收穫的。
具體內容:
搜尋主要的賺錢方式是在搜尋結果當中嵌入廣告,一般來講是按照廣告的點擊次數來付費的。這樣,就有一個趨勢,如果想要賺錢多,就在搜尋結果中越來越多的植入廣告,使得廣告的點擊次數越來越多,則賺的錢就越來越多;不過,也有研究表明,如果植入的廣告越多,則搜尋結果的品質下降,使用者對搜尋結果的整體點擊率也會下降,則使用者對廣告的點擊也會下降。本文的目標就是找到一種“平衡點”,在不影響搜尋品質的前提下,廣告的點擊率最大。本文的最佳化目標就是廣告的點擊率。
作者看資料,發現如果搜尋結果的top結果點擊率比較低,則放幾個廣告上去是比較適合的。從實際情景上來看,使用者的搜尋目的並不十分明確,則比較容易點擊廣告。進一步的(個人想法),如何判斷這種情況?對於每個query,使用者的點擊分布,計算熵,如果熵值比較大,則點擊比較‘均勻’,則適合廣告投放。
query,根據廣告主是否買了這個query中的term,和query返回的結果當中是否有廣告資料,分為commercial query和non-commercial query。
在實驗資料上,作者證實了搜尋結果點擊和廣告點選的相關性。證實的方法,貌似是對搜尋結果進列區域劃分,每個地區作為一個bin,計算bin上面的熵。搜尋結果上面的計算結果和廣告上的計算結果的大小增長趨勢是一致的,就認為是相關的了。
如何確定搜尋結果裡面投放的廣告個數?作者對這個問題做了簡化,兩種選擇:或者投放一個廣告,或者投放三個廣告。總體要最佳化的是使用者總點擊次數。對這兩種情況進行加權。用LR等模型進行學習。——說實話,沒看懂作者的加權後的目標函數。作者似乎也不是針對每個query,來確定到底實現是一個廣告還是三個廣告,貌似統一的做一個權重,如:對所有query,顯示1.5個廣告?文章寫的很不清晰。