1. 程式人生 > 其它 >分散式Tensorflow模型系列:CVR預估之ESMM

分散式Tensorflow模型系列:CVR預估之ESMM

今天學習這篇文章:

https://zhuanlan.zhihu.com/p/42214716

昨天的文章也沒有看完,有機會再看:

https://zhuanlan.zhihu.com/p/41663141

 

先來這張經典的圖:

 

 

文字要實現的深度學習模型是阿里巴巴的演算法工程師18年剛發表的論文《Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate》中提出的ESMM模型,關於該模型的詳細介紹可以參考我之前的一篇文章:《CVR預估的新思路:完整空間多工模型》。

 

ESMM模型是一個多工學習(Multi-Task Learning)模型,它同時學習學習點選率和轉化率兩個目標,即模型直接預測展現轉換率(pCTCVR):單位流量獲得成交的概率。模型的結構如圖1所示。

 

先看這篇文章:

https://zhuanlan.zhihu.com/p/37562283

ESMM模型創新地利用使用者行為序列資料,在完整的樣本資料空間同時學習點選率和轉化率(post-view clickthrough&conversion rate,CTCVR),解決了傳統CVR預估模型難以克服的樣本選擇偏差(sample selection bias)和訓練資料過於稀疏(data sparsity )的問題。 

 

換句話說,使用者行為遵循一定的順序決策模式:impression → click → conversion。CVR模型旨在預估使用者在觀察到曝光商品進而點選到商品詳情頁之後購買此商品的概率,即pCVR = p(conversion|click,impression)。

 

傳統的CVR預估任務通常採用類似於CTR預估的技術,比如最近很流行的深度學習模型。然而,有別於CTR預估任務,CVR預估任務面臨一些特有的挑戰:1) 樣本選擇偏差;2) 訓練資料稀疏;3) 延遲反饋等。

 

按這種方法構建的訓練樣本集相當於是從一個與真實分佈不完全一致的分佈中取樣得到的,這一定程度上違背了機器學習演算法之所以有效的前提:訓練樣本與測試樣本必須獨立地取樣自同一個分佈,即獨立同分布的假設。總結一下,訓練樣本從整體樣本空間的一個較小子集中提取,而訓練得到的模型卻需要對整個樣本空間中的樣本做推斷預測的現象稱之為樣本選擇偏差。樣本選擇偏差會傷害學到的模型的泛化效能。