【點擊模型學習筆記】Inferring clickthrough rates on ads from click behavior on search results_wsdm2011
文章不長。只是一路看下來,發現貌似不是native-english-speaker寫的,細節說的不清晰。全然無法還原作者的工作思路。
只是還是有那麽一點兒收獲的。
詳細內容:
搜索基本的賺錢方式是在搜索結果其中嵌入廣告,一般來講是依照廣告的點擊次數來付費的。這樣。就有一個趨勢。假設想要賺錢多,就在搜索結果中越來越多的植入廣告,使得廣告的點擊次數越來越多。則賺的錢就越來越多。只是,也有研究表明,假設植入的廣告越多,則搜索結果的質量下降,用戶對搜索結果的總體點擊率也會下降,則用戶對廣告的點擊也會下降。
本文的目標就是找到一種“平衡點”。在不影響搜索質量的前提下,廣告的點擊率最大。
本文的優化目標就是廣告的點擊率。
作者看數據,發現假設搜索結果的top結果點擊率比較低,則放幾個廣告上去是比較適合的。從實際情景上來看,用戶的搜索目的並不十分明白,則比較easy點擊廣告。進一步的(個人想法),怎樣推斷這樣的情況?對於每一個query。用戶的點擊分布。計算熵,假設熵值比較大。則點擊比較‘均勻’,則適合廣告投放。
query,依據廣告主是否買了這個query中的term,和query返回的結果其中是否有廣告數據,分為commercial query和non-commercial query。
在實驗數據上,作者證實了搜索結果點擊和廣告點擊的相關性。
證實的方法,貌似是對搜索結果進行區域劃分,每一個區域作為一個bin,計算bin上面的熵。搜索結果上面的計算結果和廣告上的計算結果的大小增長趨勢是一致的,就覺得是相關的了。
怎樣確定搜索結果裏面投放的廣告個數?
作者對這個問題做了簡化。兩種選擇:或者投放一個廣告,或者投放三個廣告。
總體要優化的是用戶總點擊次數。對這兩種情況進行加權。
用LR等模型進行學習。
——說實話。沒看懂作者的加權後的目標函數。
作者似乎也不是針對每一個query,來確定究竟實現是一個廣告還是三個廣告。貌似統一的做一個權重。如:對全部query,顯示1.5個廣告?
文章寫的非常不清晰。
【點擊模型學習筆記】Inferring clickthrough rates on ads from click behavior on search results_wsdm2011