分散式Tensorflow模型系列:CVR預估之ESMM

阿新 • • 發佈：2022-03-16

今天學習這篇文章：

https://zhuanlan.zhihu.com/p/42214716

昨天的文章也沒有看完，有機會再看：

https://zhuanlan.zhihu.com/p/41663141

先來這張經典的圖：

文字要實現的深度學習模型是阿里巴巴的演算法工程師18年剛發表的論文《Entire Space Multi-Task Model: An Eﬀective Approach for Estimating Post-Click Conversion Rate》中提出的ESMM模型，關於該模型的詳細介紹可以參考我之前的一篇文章：《CVR預估的新思路：完整空間多工模型》。

ESMM模型是一個多工學習（Multi-Task Learning）模型，它同時學習學習點選率和轉化率兩個目標，即模型直接預測展現轉換率（pCTCVR）：單位流量獲得成交的概率。模型的結構如圖1所示。

先看這篇文章：

https://zhuanlan.zhihu.com/p/37562283

ESMM模型創新地利用使用者行為序列資料，在完整的樣本資料空間同時學習點選率和轉化率（post-view clickthrough&conversion rate，CTCVR），解決了傳統CVR預估模型難以克服的樣本選擇偏差（sample selection bias）和訓練資料過於稀疏（data sparsity ）的問題。

換句話說，使用者行為遵循一定的順序決策模式：impression → click → conversion。CVR模型旨在預估使用者在觀察到曝光商品進而點選到商品詳情頁之後購買此商品的概率，即pCVR = p(conversion|click,impression)。

傳統的CVR預估任務通常採用類似於CTR預估的技術，比如最近很流行的深度學習模型。然而，有別於CTR預估任務，CVR預估任務面臨一些特有的挑戰：1) 樣本選擇偏差；2) 訓練資料稀疏；3) 延遲反饋等。

按這種方法構建的訓練樣本集相當於是從一個與真實分佈不完全一致的分佈中取樣得到的，這一定程度上違背了機器學習演算法之所以有效的前提：訓練樣本與測試樣本必須獨立地取樣自同一個分佈，即獨立同分布的假設。總結一下，訓練樣本從整體樣本空間的一個較小子集中提取，而訓練得到的模型卻需要對整個樣本空間中的樣本做推斷預測的現象稱之為樣本選擇偏差。樣本選擇偏差會傷害學到的模型的泛化效能。

分散式Tensorflow模型系列:CVR預估之ESMM

分散式Tensorflow模型系列:CVR預估之ESMM

DIN: 阿里點選率預估之深度興趣網路

tensorflow模型儲存、載入之變數重新命名例項

記錄之 tensorflow常見的資料預處理操作

9.億級流量電商系統JVM模型引數預估方案

BERT預訓練tensorflow模型轉換為pytorch模型

阿里媽媽牟娜：定向廣告新一代點選率預估主模型——深度興趣演化網路

技術解讀 | 智慧開放搜尋CTR預估模型

《跬步千里系列》高效能MySql之索引到底是個啥

SpringBoot系列教程Web篇之開啟GZIP資料壓縮

SpringBoot系列教程web篇之全域性異常處理

Go語言系列教程(十二)之函式完結篇

SpringBoot系列教程web篇之404、500異常頁面配置

SpringBoot系列教程web篇之重定向

SpringBoot系列教程web篇之自定義異常處理HandlerExceptionResolver

SpringBoot系列教程web篇之過濾器Filter使用指南擴充套件篇

SpringBoot系列教程web篇之過濾器Filter使用指南

SpringBoot系列教程web篇之Beetl環境搭建

SpringBoot系列教程web篇之Freemaker環境搭建

SpringBoot系列教程web篇之Thymeleaf環境搭建

分散式Tensorflow模型系列:CVR預估之ESMM

相關推薦