深度學習在CTR預估的應用

阿新 • • 發佈：2018-11-12

深度學習在各個領域的成功

深度學習在影象和音訊等方向比傳統方向有大的提升，導致很多產品能快速落地

第一行三張圖片代表圖片和音訊方向相比傳統提升30%-50%，第二行第一張代表深度學習在自然語言處理方面方向的應用(相比傳統學習方法有提升，但是提升效果有限)，後兩張代表生成式模型(生成圖片比較火的是GAN)

例如：寫好故事框架有時間地點等，GAN自動生成視訊(未來)

ctr:點選率

給定使用者商品看使用者點選的概率是多少

User、Movie採用one-hot編碼，黃色部分代表歷史看過電影向量

傳統預測CTR方法：

LR和線性模型關係：LR是sigmoid函式，將數值壓縮到0-1之間

LR模型

優點：簡單、可解釋(權值大)、易擴充套件、效率高、易並行

缺點：難以捕獲特徵組合(公式沒有特徵相關聯部分)

針對缺點改進：

特徵兩兩組合，一共有n方種可能，缺點：泛化能力弱(訓練資料沒看見特徵組合權值為0，將來預測時候權值還是0)

改進泛化能力強一些：

改動地方是標紅的地方，原來是某個數值，現在是低維向量內積

GBDT很容易找到有效組合特徵，GBDT先找到有效的組合特徵加到LR模型當中

目前最好的效果之一

FM：有n個特徵有n*n種特徵組合，GBDT找到有效的組合，降低不必要的組合，增加效率

深度學習基礎模型

MLP

隱層神經元：加權求和、非線性變換

現在用的比較多的啟用函式：RELU

層數比較多，用上述傳統的啟用函式，前面淺層權重學不到東西，所以用的比較多的是RELU，導數是常數

CNN(主要用於圖片)

解釋：輸出一張圖片，卷積層、下采樣、卷積層、下采樣、全連線、輸出層

對整體模型引數量有效的降低，引數數量少不容易過擬合

每個卷積核捕獲什麼特徵那

最底層學到線段、高層圖片紋理、再高一層模式、部件、實際物體輪廓

RNN(一維序列型資料，適合解決序列問題)

輸入層、隱層、輸出層，不同之處隱層之間有個傳遞過程(第t步不僅包括當前步的輸入還包括上一層的輸出)

RNN改進：

LSTM:

深度學習ctr預估模型

離散特徵輸入問題解決啦

Wide&Deep是目前比較低階的結構，由於上述幾個原因

低階特徵晒到模型當中

加個attention對特徵組合賦予一定的權重，表示哪些重要，哪些特徵組合不重要，對特徵組合做個甄別(AFM思想)

經驗：

某些模型需要預訓練

平行結構或菱形結構效果比較好(可能跟資料集有關)

深度網路深度(一般ctr兩層或三層，不需要層數太多)

值得研究的地方是FM_Function這個部分到底怎麼做？

深度學習做ctr模型比較單一

CTR預估案例：

目的：視訊推薦使用者能看，高點選率

問題：在幾億中找到使用者喜歡的東西，進行推送，時間要求比較高

解決該問題分兩步：

第一步：初篩，篩選可能感興趣的內容，為後面篩選一個小集合

第二步：排序，排序，特徵比較多，要求精度比較高

初篩

輸入：使用者歷史行為(看過某個視訊列表的輸入向量轉化dense)，搜尋詞、群體性統計特徵(性別、中老年等)

歸為兩大類：行為特徵、統計特徵

average把輸入向量搞成定長的

給使用者推薦資訊，目前只有使用者歷史資訊

給定使用者興趣向量對視訊1000萬視訊進行投票，轉化為一個分類問題

學使用者的興趣怎麼用向量來表達

初篩：向量表達使用者興趣(篩選出50個)

訓練過程：某個使用者的embedding 、某個視訊的embedding，之後算餘弦，排序

預測使用者觀看時長架構如下：(時間越長越排到前面推薦給使用者)

一個人多種興趣，多種興趣某一時刻只體現某一興趣(區域性啟用)

流程：線上收集很多使用者歷史資料，點過哪些、看過哪些、買過哪些、建模，之後對使用者興趣進行了解，有很多廣告，把最可能點的廣告進行推送

收集的使用者特徵：

基礎模型：

推送廣告和歷史進行算一下距離

出發點：剛才出發點怎麼改進模型讓ctr效果更好，jd 圖片資訊能否柔到模型當中

兩階段：初篩：精度不要求那麼高，但是要求快；排序：精排，選取k個

網路結構

右面一部分：深度網路，可以認為是wide & deep 網路

左側一部分：圖片資訊，怎麼柔到模型當中，1-N表示過去點過N個商品圖片，CNN提取圖片特徵

A｜B test對比7天對比結果，引入圖片對效果增大比較大

相同商品通過聚類，都可以聚到一類

基於TensorFlow Serving的深度學習線上預估

一、前言隨著深度學習在影象、語言、廣告點選率預估等各個領域不斷髮展，很多團隊開始探索深度學習技術在業務層面的實踐與應用。而在廣告CTR預估方面，新模型也是層出不窮： Wide and Deep[1]、DeepCross Network[2]、DeepFM[3

深度學習在CTR預估中的應用

搜索前言 deep 帶來 python 2017年進入訓練信息歡迎大家前往騰訊雲+社區，獲取更多騰訊海量技術實踐幹貨哦~ 本文由鵝廠優文發表於雲+社區專欄一、前言二、深度學習模型 1. Factorization-machine（FM） FM = LR

深度學習在CTR預估的應用

深度學習在各個領域的成功深度學習在影象和音訊等方向比傳統方向有大的提升，導致很多產品能快速落地第一行三張圖片代表圖片和音訊方向相比傳統提升30%-50%，第二行第一張代表深度學習在自然語言處理方面方向的應用(相比傳統學習方法有提升，但是提升效果有限)，後兩張代表生成式模型(生成圖片

基於深度學習的廣告CTR預估演算法

數十款阿里雲產品限時折扣中，趕緊點選這裡，領劵開始雲上實踐吧！演講嘉賓簡介：朱小強，花名懷人，阿里媽媽高階演算法專家，領導了核心的排序演算法與機器學習平臺團隊，負責阿里精準展示廣告的CTR/CVR預估系統/演算法

facebook:gbdt+lr在ctr預估中的應用

span ctr .com 關聯 auc left under mar 結構背景 facebook上的廣告並不是與query關聯的，而是與用戶的興趣及其人口信息相關，所以相比於搜索其候選廣告的體量要大的多；級聯模型：解決上述大量候選集合的問題，逐級增大計算復雜度；

用機器學習對CTR預估建模（一）

資料集介紹： train - Training set. 10 days of click-through data, ordered chronologically. Non-clicks and clicks are subsampled acco

深度長文 | 從FM推演各深度CTR預估模型（附開原始碼）

作者丨龍心塵 & 寒小陽研究方向丨機器學習，資料探勘題記：多年以後，當資深演算法專家們看

從FM推演各深度CTR預估模型(附程式碼)

PaddlePaddle分散式訓練及CTR預估模型應用

　　前言：我在github上建立了一個新的repo：PaddleAI, 準備用Paddle做的一系列有趣又實用的案例，所有的案例都會上傳資料程式碼和預訓練模型，下載後可以在30s內上手，跑demo出結果，讓大家儘快看到訓練結果，用小批量資料除錯，再用全量資料跑模型，當然，也可以基於我上傳的預訓練模型進行遷移學

CTR預估模型演變及學習筆記

【說在前面】本人部落格新手一枚，象牙塔的老白，職業場的小白。以下內容僅為個人見解，歡迎批評指正，不喜勿噴！[握手][握手] 【再囉嗦一下】如果你對智慧推薦感興趣，歡迎先瀏覽我的另一篇隨筆：智慧推薦演算法演變及學習筆記【最後再說一下】本文只對智慧推薦演算法中的CTR預估模型演變進行具體介紹！一、傳統CTR預

深度學習深刻理解和應用--必看知識

3.1 講解 target 社區 github flow deep 卷積 work 1.深層學習為何要“Deep” 1.1 神經網絡：從數學和物理兩視角解釋，見：https://zhuanlan.zhihu.com/p/22888385 1.2 網絡加深

02-NLP-06-深度學習與NLP簡單應用

計算統一算法可能測試信息殘差過擬合們的希望在毫不知情（很少的人類介入）的情況下實現。即端對端的實現。一、Intro 工具推薦：二、Auto-Encoder 使用自編碼器的情況：1）拿到的原始數據缺少標簽（數據降噪） 2）數據太大了，

《深度學習：原理與應用實踐》中文版PDF

應用 href 書籍 nag tex 原理圖片 water images 下載：https://pan.baidu.com/s/1YljEeog_D0_RUHjV6hxGQg 《深度學習：原理與應用實踐》中文版PDF，帶目錄和書簽；經典書籍，講解詳細；如圖：《深度學

【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）

bat 神經網絡深度學習深度學習框架 0基礎 http 提取框架以及【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）網盤地址：https://pan.baidu.com/s/1G0_WS-uHeSyVvvl_4bQnlA

006-深度學習與NLP簡單應用

Auto-Encoder 如果原始圖片輸入後經過神經網路壓縮成中間狀態（編碼過程Encoder），再由中間狀態解碼出的圖片與原始輸入差別很小（D解碼過程ecoder），那麼這個中間狀態的東西，就可以用來表示原始的輸入。原先打算用AE來做神經網路中的W，但是發現效果不好，然後神經網路使

第一篇關於深度學習在NER上應用的綜述文章

《A Survey on Recent Advances in Named Entity Recognition from Deep Learning models》這是第一篇關於深度學習在NER上應用的綜述文章這篇文章比較注重多語言和多領域的基於深度學習NER的綜述

分享《深度學習：原理與應用實踐》+PDF+張重生

ofo 51cto 經典 mar src mage 詳細深度學習目錄下載：https://pan.baidu.com/s/1LmlYGbleDhkDAuqoZ2XjAQ更多資料分享：http://blog.51cto.com/14087171 《深度學習：原理與應用實

李沐等人開源中文書《動手學深度學習》預覽版上線

機器之心報道，參與：李澤南、張倩。獲得這本實體書最好的方法就是成為貢獻者。近日，由 Aston Zhang、李沐等人所著圖書《動手學深度學習》放出了線上預覽版，以供讀者自由閱讀。這是一本面向在校學生、工程師和研究人員的互動式深度學習書籍。線上書地址：zh.diveintodeeplear

CTR預估中GBDT與LR融合方案

1、背景 CTR預估（Click-Through Rate Prediction）是網際網路計算廣告中的關鍵環節，預估準確性直接影響公司廣告收入。CTR預估中用的最多的模型是LR（Logistic Regression）[1]，LR是廣義線性模型，與傳統線性模

深度學習：預訓練

遷移學習：可以使我們在他人訓練過的模型基礎上進行小改動便可投入使用。 1. 什麼是遷移學習？神經網路需要用資料來訓練，它從資料中獲得資訊，進而把它們轉換成相應的權重。這些權重能夠被提取出來，遷移到其他的神經網路中，我們“遷移”了這些學來的特徵，就不需要從零開始訓練一

深度學習在CTR預估的應用

深度學習在各個領域的成功

傳統預測CTR方法：

深度學習基礎模型

深度學習ctr預估模型

CTR預估案例：

初篩

初篩：向量表達使用者興趣(篩選出50個)

相關推薦