1. 程式人生 > >DSP模型中FM FFM模型

DSP模型中FM FFM模型

機器學習方法應用在DSP廣告投放中,預估CTR/CVR,業界常用的方法是人工特徵工程+LR,GBDT,近期FM,FFM模型在其中使用效果非常顯著。

先解釋一波DSP相關專業術語:
DSP:Demand-Side platform,需求方平臺,在網際網路廣告產業中,DSP是一個系統,也是一種線上廣告平臺,服務於廣告主,幫助廣告主在網際網路上進行廣告投放。兩個核心特徵:強大的RTB(Real-Time Bidding)的基礎設施和能力,強大的使用者定位(Audience Targeting)技術。
CPC:Cost Per Click按點選計費
CPA:Cost per Action按成果數計費
CTR

: Click Through Rate 點選率
CVR: Click Value Rate 轉化率,衡量CPA廣告效果的指標。
瞭解DSP中的基礎演算法和模型,可以參考M6D公司的文章,以及一份中文解釋:http://www.techinads.com/archives/41

FM:Factorization Machine 因子分解機,又稱分解機器,旨在解決大規模稀疏資料下的特徵組合問題。
FFM:Field-aware Factorization Machine,場感知分解機器,把相同性質的特徵歸於同一個field

稀疏問題引出:
在機器學習中,尤其是計算廣告領域,特徵並不總是數值型,很多時候是分類值,對於categorical feature,通常會採用one-hot encoding轉換成數值型特徵,轉化過程會產生大量稀疏資料。

one-hot encoding:獨熱編碼或者叫一位有效編碼,使用N位狀態暫存器來對N個狀態進行編碼,每個狀態都有它獨立的暫存器,並且在任意時刻,只有一位有效。可以這麼理解:對於每一個特徵,如果它有m個可能取值,那麼經過one-hot encoding之後,就變成了m個二元特徵,並且,這些特徵互斥,每次只有一個啟用,因此,資料會變得稀疏。