1. 程式人生 > >Temporal Context-Aware Model

Temporal Context-Aware Model

在前面,這篇論文提到文章“TimeUserLDA”model,並指出模型assumes that user posting behaviors are influenced by both user interest and global topic trends,即講使用者的post行為也分為兩個因素,但是模型將兩類話題對映到同一個潛在話題空間,導致話題區分度不高。

對比實驗中,使用到了User-Topic model,類似於Author model,假設使用者的內容釋出基於個人興趣,忽略了外在的因素,其概率模型為:

其中B為背景話題,可以用來作為平滑處理。

使用者的物品推薦,TCAM模型同時建模了使用者內在的興趣需求和時序內容的影響,並將二者影響結合。基於TCAM構造查詢系統。下面詳細解釋:

作者將使用者的rate行為的原因歸於兩種,分別是使用者本身的興趣,和外在時序內容(比如特定時間段內的general public)。所以提出了TCAM,認為話題的產生分為兩大類,所以建模了使用者個人興趣分佈和時序內容分佈,從而得到面向使用者的話題,和麵向時間的話題。

這裡,lamda表示話題由使用者興趣生成的概率(混合權重)。

並分別定義了兩種生成過程,分別是(注意,這裡的item類似話題模型中的單詞):

①,以Item為基礎的I

tem-based TCAM

這裡,可以看到Temproal沒有對應的話題分佈,或者簡單的說,只有一個時間分佈。

②,Topic-based TCAM

可以看到,這時候左右對稱,即時間和使用者相關的話題的生成過程相同——先取出話題,然後話題生成item。

為了增強話題的學習能力,考慮到流行的item會被rank的更高,包括使用者的個人興趣可能被多數使用者的喜好掩蓋,時間bursty的話題也可能被公眾興趣(long-standing popular items)覆蓋掉。所以提出item-weighting模式,利用資訊熵理論,其中概率為頻率的倒數(frequency/popularity N(v))。進一步,提出inverse user frequency和bursty degree,結合兩者構成item 權重。並帶入C

推薦生成TopK

對查詢q=(u,t),生成多項式分佈,將興趣空間和時間空間聯立,結合lamda,得到話題值。

找到候選集,然後排序得出。