1. 程式人生 > 其它 >左右互搏:GAN在愛奇藝短視訊推薦冷啟動中的實踐 https://mp.weixin.qq.com/s/Thdf6hAwktCfd7LJc_9Tmw

左右互搏:GAN在愛奇藝短視訊推薦冷啟動中的實踐 https://mp.weixin.qq.com/s/Thdf6hAwktCfd7LJc_9Tmw

左右互搏:GAN在愛奇藝短視訊推薦冷啟動中的實踐 https://mp.weixin.qq.com/s/Thdf6hAwktCfd7LJc_9Tmw

左右互搏:GAN在愛奇藝短視訊推薦冷啟動中的實踐

收錄於話題

導語:由於推薦系統冷啟動問題的存在,在視訊推薦中為使用者推薦新視訊是一個極具挑戰的問題,新視訊推薦的效果直接影響推薦系統“新陳代謝”的穩定性和內容生態的健康發展。為了解決該問題,本文主要介紹了愛奇藝隨刻推薦團隊在短視訊推薦業務上基於對抗神經網路(GAN)的新視訊冷啟動的落地實踐方案。

01

背景

推薦系統的冷啟動問題是指當新物品或新使用者進入推薦系統後,由於沒有該使用者或該物品的歷史資訊,推薦很難取得較好的效果的問題,這一問題很容易影響新使用者的使用體驗和使用者留存,是短視訊個性化推薦領域一個重要的問題。

要解決這個問題,我們首先要了解下,推薦系統的冷啟動由哪些部分組成。

推薦系統的冷啟動主要可以分為使用者冷啟動、物品冷啟動和系統冷啟動三類。

以使用者-物品評分矩陣為例,如下圖所示,在使用者-物品評分二維矩陣中,使用者和物品分別有冷熱之分,進而形成四象限,第一象限即為物品冷啟動問題。

新視訊推薦在視訊推薦系統中是一種典型的物品冷啟動問題,對於愛奇藝線上視訊服務平臺,每時每刻會有大量新視訊生產和上線,尤其是以UGC、PUGC為代表的短視訊,同時短視訊又具有快速消費和一次性消費的特徵,使得新視訊如何快速地準確地高效地分發給感興趣的使用者成為一個持續的研究問題。

從新視訊的內容屬性看,新視訊相較於老視訊,視訊歷史資訊缺失,沒有使用者視訊互動行為資料,同時視訊meta屬性可能有缺失或者不準確,如何準確地描述和表達新視訊是第一性問題。

從新視訊分發路徑和週期看,新視訊分發會經歷少量試探性或驗證性分發,通過系統驗證後進入大量的自由分發階段,如何優化新視訊分發路徑、如何使新視訊高效觸達目標靶使用者是視訊和使用者如何建立連線的問題。

從視訊推薦系統整體看,新視訊推薦是推薦系統物料正常的“新陳代謝”,由於短視訊具有快速消費的特徵,視訊推薦系統整體的物料更新速度較快,如何穩定地進行“推陳出新”是推薦系統的“開源問題”;同時新視訊meta屬性缺失或者不準確、推薦分發試探和驗證會給推薦系統整體帶來一定的開銷和引入一些噪聲,如何準確高效進行新視訊推薦是推薦系統的效率問題。

從新視訊生產供給側看,新視訊推薦分發的效果,會對視訊生產創作進行前期直接的反饋,對視訊生產創作者的研判決策有一定的影響,對於內容生態的健康發展具有引導和指標性作用。

因此,新視訊推薦對推薦系統至關重要,如何有效地構建新視訊推薦,根據第一性原則分析,需要解決兩個基本問題,第一是如何表示新視訊,第二是如何對新視訊和使用者建立連線。

首先,如何表達新視訊成為解決問題的出發點。傳統的解決方案,多數是基於新視訊屬性的內容表達,如新視訊的類別、標籤、創作者等;內容表達直觀,但是表達的特徵離散和稀疏,同時受噪聲影響波動較大。第二,如何使新視訊直接與使用者建立連線成為解決問題的關鍵。傳統的基於屬性內容的表達,通過視訊屬性與使用者畫像屬性,進一步利用相似性或相關性計算建立新視訊和使用者之間的聯絡。以上基於分離的兩部框架,結構簡單表達能力不足,且分離框架資訊傳遞會有熵減,存在資訊損失和誤差疊加的問題。

因此,我們設計了基於對抗神經網路的新視訊推薦的解決方案,基於對抗神經網路生成器產生的embedding向量化的表達所蘊含的資訊更加豐富,同時神經網路擬合真實使用者特徵,完成新視訊和使用者間複雜的對映關係;對抗神經網路生成的新視訊特徵不僅與給定的新視訊相關,而且和真實的使用者特徵相似,從而完成了新視訊表達、新視訊和使用者建立對映關係二者的聯合統一。

02

模型框架結構設計

在視訊推薦中為使用者推薦新視訊是一個極具挑戰的問題,為了解決該問題,本文提出了基於對抗神經網路(GAN)的新視訊冷啟動方案,它通過獲取使用者和物品之間隱含的屬性級的互動資訊,利用了視訊屬性的多個角度產生可能對該新視訊感興趣的使用者特徵,並基於屬性級的相似度將新視訊推薦給目標使用者。

GAN模型的整體框架結構如下圖所示:

GAN模型的網路結構由生成器和判別器兩部分組成,生成器可以根據輸入的視訊的屬性生成一個可能喜歡該物品的使用者特徵向量;判別器可以根據輸入的使用者特徵-視訊特徵樣本對,判斷輸入的使用者特徵是真實的還是生成的,篩選出與真實使用者相似且與視訊相關的生成的使用者特徵。最後從使用者集中選出若干個與生成的使用者特徵向量最相似的使用者,並將該視訊推薦給這些使用者,完成新視訊冷啟動召回。

GAN模型總的目標函式為min-max優化表示式,其期望生成器最小化目標函式,同時判別器最大化相同的目標函式,具體計算公式為:

其中D*表示判別器D, ϕ表示判別器的引數,Pture(u|In)表示判別器D的函式;G*表示生成器G,θ表示生成器的引數,Pθ(uc|In)表示生成器G的函式,N 是訓練集中視訊的個數。

2.1生成器

生成器採用了多個子生成器的結構,即生成器可以分為兩個部分:

第一部分:對於視訊Item候選集I={I1,I2,I3,…,In},其中每個視訊Ii有k維屬性A={ai1,ai2,…,aik},視訊的k維屬性中每個屬性分別被送到特定的生成器中,然後生成潛在使用者的特徵;

第二部分:

神經網路G合併所有的生成的使用者特徵向量,通過多層全連線神經網路,輸出一個最終的使用者特徵向量,該過程可以表示為:

生成器通過最小化目標函式訓練得到最優的生成器,當在訓練生成器的時候判別器的引數是固定的,只需要優化跟生成器相關的項,通過以下公式計算:

一般來說,生成器比判別器要完成的任務更難,因為生成器要進行概率密度的擬合,導致的影響GAN效能的一個問題就是模式坍塌,即生成高度相似的樣本。採用多個生成器單個判別器可以有效地緩解這個問題。

2.2 判別器

判別器採用單判別器的結構,對於判別器有兩種訓練樣本對:

一種是(uc,Ic),即給定的視訊和生成的使用者特徵形成的樣本,其中uc是生成器G生成的使用者特徵,Ic是視訊屬性的特徵;另一種是(u,Ic),即給定的視訊和真實使用者特徵形成的樣本,其中u+是在真實行為資料中對給定視訊感興趣的使用者,對於真實使用者的特徵由真實使用者畫像生成。

判別器的目的就是將(uc,Ic)(u,Ic)這兩種樣本區分開來,其中(u,Ic)是正例,其標籤是1;(uc,Ic)是負例,標籤是0,通過以下公式計算:

判別器輸出的是使用者和視訊相關的概率,通過以下公式計算:

其中 ϕ是判別器的引數。

在判別器網路訓練時通過最大化目標函式來得到最優的判別器,通過以下公式計算:

通過以上兩種樣本的進行訓練,可以使判別器篩選出生成器生成的使用者特徵不僅與真實的使用者特徵相似,而且和給定的視訊相關。

2.3推薦生成


生成器生成了可能喜歡當前物品的使用者特徵之後,就可以把當前的新視訊推薦給與生成的使用者最相似的真實使用者了。本文用餘弦相似度計算的生成的使用者和使用者集中使用者之間的相似度,採用ANN優化了相似解求解效能。

03

線上效果

該方案已於愛奇藝主APP短視訊推薦系統中上線,在新視訊的分發和消費方面都有顯著正向的結果,對高熱產生效率以及系統曝光新鮮度等方面都有極大提升:

1.新視訊分發效果方面,曝光佔比明顯提升,視訊新鮮度相對提升12.4%。

2.新視訊消費效果方面,CTR相對提升11.9%,人均播放時長相對提升56.5%。

04

總結展望

以上是我們近期在愛奇藝短視訊推薦業務中新視訊推薦冷啟動召回的方案落地,實踐證明基於對抗神經網路實現的新視訊冷啟動解決方案,對線上新視訊推薦的效果是有很大收益的。後續我們會從以下幾個方面持續優化:

1. 優化多個生成器生成的屬性特徵融合,引入attention機制等方法,使得特徵表達更加合理。

2. 採用多個判別器結構,進行不同粒度的boosting判別篩選,使得生成特徵更加多樣性,避免模型病態和蛻化。

參考文獻

[1]Sun,Changfeng, et al. "LARA: Attribute-to-feature-adversarial learningfornew-item recommendation." Proceedings of the 13th International Conferenceon Web Search and Data Mining. 2020.[2] Goodfellow,Ian, et al. "Generative adversarial networks." Communications of theACM 63.11 (2020): 139-144.[3] Arjovsky,Martin, Soumith Chintala, and Léon Bottou. "Wasserstein generativeadversarial networks." International conference on machine learning. PMLR,2017.[4] Ebesu, Travis,and Yi Fang. "Neural semantic personalized ranking for item cold-startrecommendation." Information Retrieval Journal 20.2 (2017): 109-131.[5] Gantner,Zeno, et al. "Learning attribute-to-feature mappings for cold-startrecommendations." 2010 IEEE International Conference on Data Mining. IEEE,2010.