1. 程式人生 > 實用技巧 >阿里拍賣全鏈路導購策略首次揭祕

阿里拍賣全鏈路導購策略首次揭祕

拍賣,是一個大家熟悉的詞彙,但對線上拍賣以及線上拍賣的個性化推薦,大家可能不那麼熟悉。本文將對阿里拍賣業務背景先做介紹,進而描述業務中的淺庫存約束及拍品冷啟動問題,並分別提出經線上AB實驗驗證的解法,最後是對解法適用範圍的討論。

前言


業務背景介紹:

  • 拍賣中的約束條件:淺庫存、時效性

  • 交易鏈路及頻道頁的佈局

  • 拍賣導購與傳統頻道頁的區別

  • 研究物件:在淺庫存和時效性約束下的拍下率優化問題

技術點:

  • 運用拉格朗日乘子法求解在淺庫存約束下的流量調控問題,並分析了上述調控模型適用的必要條件

  • Knowledge Graph Embedding和概率圖模型兩個角度來描述拍品的關鍵屬性,以優化拍品的冷啟動問題

值得一提,今年諾貝爾經濟學獎頒發給了保羅·米爾格羅姆(Paul R.Milgrom)和羅伯特·威爾遜(Robert B.Wilson),他們因“對拍賣理論的改進和拍賣新形式的發明”獲獎。本文中的拍賣業務,均採用英式升價拍賣,更多從流量分配和效率優化角度探討,尚未從拍賣機制設計上做嘗試。


阿里拍賣簡介


說到拍賣,腦海中就很容易湧現出這樣的畫面:拍賣師站在臺上拿著錘子裝作要一錘定音,臺下一堆人1w,5w的往上加價。所賣的標的物,往往是翡翠、字畫、瓷器這樣的珍品。那麼線上拍賣又是什麼呢?


每年雙十一的零點,優衣庫這樣的店鋪都會選出一部分商品,讓前100名購買者以極低的價格拿到。這種飢餓營銷可以成功帶來流量,背後則是通過撿漏+淺庫存+時間視窗

的形式讓消費者之間形成競爭。有一個頻道頁,時時刻刻都在進行這樣的消費者PK,在特定的時間段對稀有的商品多輪出價,這就是線上的阿里拍賣。

比雙十一更嚴苛的是,阿里拍賣的庫存一般只有一件;與線下拍賣行也不同,線上拍賣可以同時進行幾千上萬場拍賣,且一件拍品可以多達4w人圍觀,1000多人訂閱,最終31人出價,經歷了253輪競拍。啥拍品??今年6月,一套離西湖邊僅100多米的北山街棲霞嶺小區,有一套法拍房起拍價僅為260萬元。你~ 有沒有一些心動呢?

補充拍賣交易鏈路的小知識:

圍觀:就是點選進商品詳情頁,熱門的標的物往往有過萬的圍觀群眾。

訂閱:除了即刻拍線上拍賣一般有排期的進行。拍品一般分為預熱,開拍和結束拍賣三個時間點,珍品往往當天結束,而房產等大資產會有多天甚至30天的拍賣時間。訂閱好比是鬧鐘,用於提醒使用者該關注了。

交保:繳納保證金,交保意味著正式入場。

出價:各方競價,截止時間內價格最高者勝出。

支付:支付尾款,違約且當前價高於保留價需支付違約金(保證金)

拍品主要分以下三塊;

  • 大資產:如法拍房、二手車、股權、破產公司的廠房、商鋪,不一而足;

  • 高消品:名牌手錶、名家字畫、古董玉器、名酒錢幣等等;

  • 大眾商品:少量淘系商家供給,也包括部分閒魚商品。如下圖:

上文提到了起拍價260w西湖邊法拍房就是大資產。和其他頻道頁不同,來線上拍賣的人有剛需偏好,也有情懷,但更多是投資。當一個價格窪地出現,且是網紅資產,短時間內會迅速產生聚集效應。可這是我們想看到的嗎?試想我們把上面的西湖邊房產推送給每個使用者,作為業務核心指標點選、訂閱、交保那是蹭蹭蹭的往上漲,但抱歉只有一套。所以成交量只有可憐的1套。在淺庫存和時間視窗的約束下,使用者效率最大化並沒有帶來頻道整體收益最大化。不妨引申,拍賣業務中的導購,和傳統頻道頁導購究竟有哪些不同?

帶著問題,我們先看下阿里拍賣頻道頁的佈局。其中,主入口是手機淘寶輕應用第8個坑位的icon,此外還通過簡訊push,首猜雲主題和商品投放,主搜等渠道。拍賣首頁是承接流量的主陣地,模組包括:搜尋框、子頻道icon、四個子業務模組和猜你喜歡。



阿里拍賣導購 VS 傳統商品導購


單從頻道頁看,拍賣的feeds流和傳統猜你喜歡沒有太大區別。也許是表象使然,剛接手業務後,我們用近一個月時間嘗試把阿里拍賣推薦按照傳統頻道頁推薦來做,結果使用者側的效率有明顯提升,但和業務對焦發現,核心指標拍品拍下率不升反降,甚至是降的厲害。被打臉後我們不禁反思,我們錯在哪裡?

先看業務指標:

拍下率 = = 1 - 流拍率

解讀:

(1) 業務最終目標是GMV,可是拍賣中的價格差從幾百到幾億,直接量化存在困難。因而,業務和技術一致認同將目標先拆解為拍下率;

(2) 在淺庫存約束下,要考慮到長尾商品,並對頭部商品流量去中心化;

(3) 從業務側,相比於酒類玉器等珍品,房產等大資產的拍下率優化更為重要,業務要求珍品和大資產的指標分開統計;

(4) 拍下是一個延遲過程,特別是大資產的開拍時間可能長達10多天,這個演算法天級別的優化帶來困難;業務建議,可以將訂閱率和交保率作為大資產演算法優化目標.

(5) 影響GMV的因素,除了拍下率外還有溢價率(可簡單理解成高於市場價的百分比),這也是傳統拍賣關心的指標,這一塊暫未做嘗試

(6) 對新使用者儘量避免因調控而導致流失

回到問題,在傳統猜你喜歡對商品、內容導購時,我們知道要把好的品給對的人。好的品往往是經過群體行為檢驗的,模型判斷出的高點選、轉化或關注的品。

如果真有一個品大家都喜歡,那麼大概率是運營強控置頂,比如1499元的茅臺。匹配的過程往往是從使用者視角,讓商品經過選品->召回->排序->重排序這樣的漏斗,並最終展示每頁10~20個商品。但在淺庫存的約束下,如果一樣東西搶手,給過多的人看就造成了流量浪費;而如果一樣東西有潛在價值但受關注過少、最終流拍,就更加可惜。在拍賣的導購中,更關心一個商品是否會賣,而不是某個使用者是否去買。兩者的區別,小結如圖:


整體框架


按照從底池->曝光->點選->訂閱->交保->拍下的漏斗,我們在各個環節做了嘗試,標紅部分是有較大效果提升。其中,從交保->拍下在傳統拍賣中更加關注,特別是提升溢價率,這部分目前還沒有嘗試。

在求解過程中,會遇到如下一些問題:

(1)淺庫存約束下,如何均衡流量分配與效率?在此約束下,是不是更適合做Exploration and Exploitation?

(2)怎麼判斷一個拍品好是不好?對好的拍品,我們如何做冷啟動?

(3)如果拍下率是優化目標,那麼拍賣的流量怎麼量化,與拍下率的關係是什麼?

(4)拍品分為預熱、開拍和結束拍賣三個關鍵時間節點,該如何考慮拍賣時間節奏?

帶著這些問題,我們將從模型調控和新品冷啟動兩個角度來分析。


流量調控



整體思路


布洛和柯倫伯(1996)證明了,在非常一般的私人價值環境中,以及更一般的共同價值環境中,一個簡單的無保留價格,有N+1個買方的升價拍賣比任何一個只有N個買方的最優拍賣都具有更好的盈利表現。在線上拍賣,買方可定義為繳納保證金的人。這個定理也啟示了我們,交保證金的人數與最終商品是否拍下,可能有強相關性。那麼究竟如何量化交保人數與拍下率,以及如何定義我們的目標函式,並構建調控模型。我們進行了如下工作:

  1. 擬合了交保-拍下率效用函式,並給出相應假設

  2. 定義了優化目標函式,並用拉格朗日乘子法求解

  3. 在模型中引入時序和流量權重

  4. 討論了上述拉格朗日模型的適用範圍


資料分析


通過拉取歷史成交資料,可發現交保人數與拍下率呈如下關係,其中不同曲線代表了不同品類,如手錶、字畫、二手車等:

通過對交保人數與拍下率的關係做了定性,可以發現:

  • 交保人數越多,拍下率越高

  • 直觀的看,該曲線的二階導<0,意味著隨著人數增加,拍下率的邊際收益下降

  • 當交保達到一定的人數時,邊際收益已經非常微弱,此時流量的邊際成本不變,則可認為是流量浪費,這裡的臨界點稱為最優交保人數

  • 不同品類的曲線和最優交保人數有較大區別

問題假設


如何定量?我們不妨從假設開始。

假設1:交保次數與拍下率滿足如下關係

其中是商品j交保次數,是j的拍下概率,a是引數並按品類區分。本函式的假設是根據交保-拍下率曲線擬合得到,對不同業務需要先假設函式關係,再驗證是否滿足次模性。

假設2:最優交保人數是指,當交保次數達到某個值後,邊際收益明顯下降,即拍下率斜率。

超過了則認為會造成流量浪費。物理含義是商品j交保次數從後對成交概率的邊際收益。可以說,拍賣流量調控的切入點,就是最大化邊際收益。

假設3:在某個時間視窗內,每個使用者存在穩定的投資預期。

來拍賣頻道頁的使用者大多是投資和撿漏心智,雖然使用者的投資預期的具體數值難以估計,但我們不妨假設使用者期望交保的商品次數,在短時間內是一個常數。具體的取值並不影響最終排序,在後面的部分會闡述。

▐拉格朗日模型1.0


考慮目標函式:

其中,是使用者i對商品j的交保概率,是最大熵正則項,用於控制流量均衡;是交保次數與拍下率的函式;是商品j的交保上限。考慮假設3,當交保次數k足夠大時,邊際收益接近於0,則認為此時的k為交保上限;是引入的一個與使用者i相關的變數,表示使用者i的投資預期,由假設4可知恆定。該問題的拉格朗日形式如下:

(1)

KKT:

推導:

(2)

(3)

即:

令:

則:

把Z帶入由(2)式得:

又由原式式(1)可知,的梯度為:

其中,是拍品j是當前交保人數,越大,說明離調控目標還有距離,則會變小,從而使分配概率增大。考慮,在個性化排序中是在同一使用者下比較商品得分,因而最終的計算可以忽略變數

拉格朗日模型2.0


帶有時序的調控目標

在上述1.0模型中,最優交保人數是調控目標。然而,我們忽略了拍品起拍和結束時間的影響。試想,有兩個同類目的拍品,效用函式一致、最優交保人數一致、結束時間點也一致、當前拍下的人數也相同。但一個離結束拍賣還有2小時,一個還有1天。那顯然,我們應該優先考慮快結束的拍品。如何在模型中體現這件事呢?根據日誌,我們把拍賣的結束時間點和離結束時間的小時數做如下二維表:

其中,橫軸是拍賣結束的時間點,縱軸是距離結束時間的小時數。取值為該時間段的交保人數佔比=商品交保人數 / 商品最終總交保人數,如在下午14點結束的拍品集合中,離結束還差2小時交保人數佔比是14.58%。基於統計資料,我們可以得到隨時間變化的曲線,如下:

從而可以得到

上述的例子中的兩個拍品,假設都是14點結束,則裡結束還差2小時的拍品當前調控的目標值為距離結束還差1天的拍品調控目標值為

流量評估中引入使用者權重

在拍賣業務中,除去黑產有五類使用者:超級VIP使用者,VIP使用者,至少購買一次的使用者,至少交保一次的使用者,小白使用者。在背景篇中,有介紹說不同使用者群體在拍賣頻道中的行為差異極大,如超級VIP使用者和小白使用者的交保率相差12倍,而拍下率則相差26.4倍!

考慮有兩種情況,拍品1和2起拍和結束時間一致,品類一致,效用函式一致、最優交保人數一致。且當前交保人數都是8人,但拍品1是由8個超級VIP使用者交保,而拍品2是由8個小白使用者交保。那麼從直觀上,就可以認為拍品1的拍下率高於拍品2。同樣,如何在模型中體現?

考慮效用函式擬合的是交保次數與拍下率的函式關係。通過引入使用者權重可將改寫為:

其中,仍基於統計資料,上述5類人群的取值權重為5:4:3:2.5:1。使用改寫後的重新擬合曲線,得到新的效用函式

引入時序和使用者權重後,模型調整為:

淺庫存約束下的流量調控問題


回到假設,我們通過建立拉格朗日模型來求解淺庫存的拍賣流量分配問題。這裡一定有人問,我的業務適合這種調控模型嗎?上述模型適用的必要條件是什麼?

不妨小結下,我們假設了拍品交保人數和拍下率滿足函式關係,並設定了目標函式,其中L是演算法調控目標。如果從問題出發,考慮使用者總數是N,可得向量空間,其中表示是否交保。在已知部分使用者已交保的前提下,商品j拍下率可表示為,則整體拍下率期望可表示為,如圖:

注:user對Item的交保行為可想象為在圖示中的格子裡畫圈,會發現在某一個商品(如)上的邊際收益越來越少,且全域性的邊際收益也在逐步減少,這就是次模性的含義。此外,要儘量找某一列還沒畫過圈的商品,但此類商品缺少歷史行為不確定要哪個更好,這就是下一章要提到的冷啟動的問題。

圍繞著函式關係,不妨記為。F的表現是,拍下率隨著交保人數的增加而增加,但斜率逐漸下降,這是邊際收益遞減性質的一個樸素體現。在數學上,以次模性(Submodularity)描述函式的邊際收益遞減性質,具有次模性的函式被稱為次模函式(Submodular Function)。其標準定義為:對給定的離散集合S,滿足

其中,集合函式是從向量空間到實數的對映。隨著次模函式的自變數集合內元素擴充,向該集合內加入一個新元素所能帶來的增益會越來越小。例如,假設商品屬於同一類目,因而效用函式相同都是,當前狀態下已經有交保,而只有交保,此時如果新增對兩個拍品都交保,則邊際收益滿足:。上述次模現象在其他淘寶淺庫存的業務中也有體現,如閒魚。那麼次模性與問題是否可解的關係是什麼呢?

性質1:函式滿足次模性。

證明:考慮在maximum的目標下,次模性submodularity與concavity等價[Polyhedral aspects of Submodularity, Convexity and Concavity],不難推導滿足下述表示式,即滿足了次模性的充分必要條件。

性質2:拍下率的期望函式E滿足次模性。

由性質1,函式具有次模性,又因為不同商品共用同一個向量空間,由次模性的conditioning性質,即:

Conditioning: FS submodular on V, W subset of V

Then is sumodular

因而期望也滿足次模性。即為拍下率期望E的最大化問題存在多項式解法。

綜上,在拍賣問題中,對交保次數與拍下率兩個變數圍繞邊際收益遞減的性質展開,在假設效用函式時,需要考慮函式具有次模性(Submodularity),從而問題可轉化為maximum下的concavity或minimum下的convexity,並進一步設定目標函式和約束條件,再利用拉格朗日對偶性求解。

所以,上述模型適用條件是:

  • 淺庫存約束

  • 效用函式滿足次模性

更多tips:

  • 考慮效用函式,當庫存量為1時為拍下率,當庫存量>1時可以理解為商品j拍下數的期望值。在拍賣中大多數拍品的庫存為1,但上述模型對庫存量>1的淺庫存問題同樣適用,這裡淺庫存定義是商品存量 < 使用者需求量,購買者之間存在博弈;

  • 同品類下效用函式引數a取值相同,此時流量均分是最優策略;在不同品類之間,引數a取值不同,當a越大時曲線越陡峭,說明邊際收益越大,則可以傾向給更多流量;

  • λ如何除錯?我們分析了λ與以下變數有關:由命題一,品類數越少則越趨近於流量均分策略,從而λ越小;庫存越小,同理,流量趨於均分,從而λ越小。

  • 如果是求解maximum問題,一個直觀的次模性函式如圖:

新品冷啟動


整體思路


對拍品價值的分析,不論是從點選率還是轉化率出發,都離不開日誌,但第一步在這裡就卡殼。因為拍賣的商品時時刻刻在更迭,大多數Item只有一次生命期,不論是流拍還是拍下,都不再出現。除非是迴圈拍的珍品和法拍房,考慮佔比小這裡不討論。商品更迭快,特別體現在字畫古玩等高消拍品,大約每天更新40%。推薦系統始終面對冷啟動問題。而且,需要及時更新商品庫,延遲超過兩天,各種指標就會腰斬。關於如何求解拍賣冷啟動問題,我們進行了如下工作:

  • 多臂老虎機模型做流量調控

  • Knowledge Graph Embedding,基於關鍵屬性對商品表徵

  • PGM概率圖模型,基於不同品類下關鍵屬性構建Bayer Network,並進行inference learning

  • 對關鍵屬性有效性的評估

一個例子

拍賣商品的生命期往往是:預熱-開拍-結束拍賣,這意味著每天都有大量新品湧入頻道頁,這也必然給推薦帶來冷啟動困難。我們先看個例子:

上圖選出的是4款較受歡迎的爆款拍品,考慮到庫存只有一件,實際上這些拍品流量都過載了。從這四個爆款也可以看出,拍品有明確的生命期,考慮更多拍品生命期很短,比較形象的圖示如下:

有點像多個疊放在一起的石拱橋。這樣的品類更新方式帶來了挑戰是:

  • 模型訓練。比如在離線CTR預估模型中,3天,7天,15天的item統計特徵往往佔特徵權重的大頭,而在拍賣問題中,高消品每天約有40%的商品更迭。

  • 新品孵化。很多高消品線上時間很短,甚至直到下線依然只有很少流量光顧而最終流拍。目前,拍賣整體流拍率達到70%,如何及時發現好的拍品,演算法急需嘗試Explore & Exploit。

  • 工程上保證鏈路穩定,一旦超過2天未更新商品遲會驟減,整體指標甚至腰斬。

Explore & Exploit


回憶一下,拍品的交易鏈路是曝光->圍觀->訂閱->交保->出價->成交,其中圍觀->訂閱是拍賣冷啟動最關注的階段,訂閱->交保則是流量調控關注的階段。E&E演算法思路比較簡單,只需走通實時鏈路並定義清楚調控目標,就可以實驗。

拍品的關鍵屬性


拍賣的結果取決於三個因素,拍賣的規則、拍賣物件的估值、競標者所有的資訊。在阿里拍賣中,拍賣規則始終為公開的英式升價拍賣;競標者所有資訊,可以理解為使用者畫像,包括使用者實時行為,以及使用者年齡、性別和購買力等屬性。上述資訊往往與個性化鏈路集合,比如使用者行為分為淘系的和拍賣站內的,都作為個性化召回鏈路的trigger;年齡等屬性則作為rank model的特徵。這與傳統個性化鏈路做法基本一致。

然而,阿里拍賣頻道頁與傳統頻道頁不同,如上文所分析,使用者往往帶有撿漏的心智而來,因而首先需要對拍賣物件的估值作為平臺,則需要提供儘可能多的資訊便於他準確估值。這些資訊在本章中稱為關鍵屬性。譬如,錢幣的品相、面值、年代,酒類的產地、年份和度數;屬性值一般可列舉,例如玉石的種地型別包含{冰種,糯種,冰糯種}。商品詳情頁如圖:

對冷啟動缺少日誌的商品,關鍵屬性可以部分彌補。但難點是關鍵屬性只適用於部分品類,如酒類的度數只用於酒。從模型訓練的角度,更希望採用通用屬性做特徵;而如果每個類目單獨訓練一個模型,不僅繁瑣且日誌也不充分。針對上述問題,我們做了屬性評估,並嘗試了兩種模型來表達,以下分別介紹。

關鍵屬性的評估

同一個品類的關鍵屬性可能看似很多而實際可用很少。這裡就需要:

  • 屬性有作用域,這裡選擇後臺二級類目,只有同二級類目的商品才有可比性;

  • 屬性是有限集,每個屬性的取值也是有限集,例如, 手錶{機芯型別, 錶帶材質, 適用物件, 價格範圍},而機芯型別{自動機械錶, 石英錶, 手動機械錶, 機械錶}

  • 屬性及屬性值的選擇,需要從以下幾個維度判斷:

    • 覆蓋度 屬性及所選屬性值包含的商品量級。例如法國產區與酒類強相關,但覆蓋不足;

    • 均勻性 有的屬性看似商品多但其實不能用,商品分佈絕大部分都集中在一個屬性值

    • 區格性 有的屬性取值與投資價值沒啥關聯,使得這些屬性值之間沒有區格,譬如書法/繪畫品類的字畫性質:會發現這裡的ratio非常接近,說明字畫性質的原稿和原創沒有區格

    • 保序性 比如鑽石切工,從完美到一般是有序的集合,所期望對應的熱度也是有序的

Knowledge Graph Embedding

我們通常利用三元組(triple)來表示一條知識,格式為(頭實體,關係,尾實體),例如三元祖(阿里巴巴,創始人,馬老師)來表述”馬老師是阿里巴巴創始人之一“這條知識。隨著三元組的不斷積累,實體之間的關係愈發豐富,實體、關係型別愈發豐富,所構成的知識圖譜(Knowledge Graph)便更加強大。在這個“萬物皆可embedding”的時代,圖譜也能夠對圖上的每個節點、關係都產生一個向量表徵,用於下游任務。

知識表示便是一種產出向量表徵的方法,該方法主要是將是實體和關係通過某種方式對映到某個向量空間中,進而利用連結預測(link predict)任務的方式結合損失函式進行訓練。連結預測任務是給定(頭實體,關係)來預測尾實體,或者給定(關係,尾實體)來預測頭實體,例如給定(阿里巴巴,創始人),期望能夠預測到馬老師等創始人而非xxx,預測正確的loss會更小,錯誤loss會更大,進而通過反向傳播進行訓練。

知識表示發展至今,也有眾多方法,其中最經典,最簡單的也正是TransE方法,該方法將實體和關係都對映到同一個向量空間,通過計算歐幾里得範數得到距離,距離越小表示向量運算更為正確,最終損失函式通過hinge loss計算得到損失後反向傳播至實體與關係,不斷的調整實體與關係的向量表徵,儘可能使得:

其中距離函式為該距離越小表示該三元組的向量表徵越正確。由於該演算法是一個無監督的演算法,故訓練過程採用手動構建負樣本並期望正負樣本差距較大,且大於某個margin即可,如下公式所示:

其中為正樣本距離,為負樣本距離,其中負樣本為。一般來說,頭尾實體不同時替換,可能會替換成一個正樣本;且負樣本的構造是整個模型訓練的關鍵,負樣本過於簡單則起不到訓練效果,負樣本過於難學習可能難以收斂,故負樣本構建上本文選擇了同葉子類目下進行構建負樣本,相比於全域性下的負樣本構建,在珍品三元組替換到了大資產的房產其實是沒有學習價值的。

模型訓練後評估過程是針對訓練集中的三元組,將待替換實體替換為訓練集中的每一個實體,然後計算距離,最後將所有三元組距離進行排序,計算正確的三元組的排名計算得到Mean Rank和[email protected]進行衡量。其中Mean Rank表示排名的平均值,該值越小越好;[email protected]一般看[email protected][email protected]等,其表示排名在前N個的佔比,該值越大越好。

三元組示意圖

根據embedding聚合後的視覺化結果

左圖:向量低維視覺化成簇

右圖:i2i召回視覺化

如何使用?

通過關鍵屬性這樣的靜態特徵,使用transE演算法可得到Item的embedding特徵,可以作為:

  1. 模型特徵,如離線CTR預估的GBDT模型,之前在天貓新品業務中嘗試,可以提升點選率和新品冷啟動效率

  2. 得到embedding I2I,swing i2i或是slim演算法更加依賴行為日誌,在日誌充分、新品較少的業務並不work。但在拍賣這樣商品更迭頻繁,新品佔比高的業務,基於knowledge graph embedding可以作為補充,提高覆蓋率。具體的AB效果見後文。


PGM概率圖模型

PGM一般適用於當特徵之間不滿足條件獨立性假設時,通過特徵之間的依存關係構建graph,並將第一層節點視為先驗概率,上游節點視為下游的條件概率分佈,並最終計算得到聯合概率分佈的過程。如圖:

整體流程是:

  • 從覆蓋率、區格、均勻和保序四個維度做特徵評估和選擇

  • 根據訂閱日誌,構建先驗概率分佈和條件概率分佈,譬如P(題材='山水畫'),P(訂閱='yes'|題材='山水畫' & 品相='十品')

  • 基於pgmpy包,構建Bayesian Networks

  • 做inference learning,演算法採用Belief propagation,其中引數優化使用BDeu評分函式

  • 各類目關鍵屬性統一對映到一個score,可以直接使用,或將其作為GBDT模型特徵。

流量調控與個性化分數融合


Tips:

  • 流量調控部分的score,僅限同品類內的比較,比如在比較字畫與房產這種跨類目品類,只考慮個性化分

  • 對新使用者不做調控,特別是沒有一次交保的小白使用者


整體效果


  • GMV和IPVUV

經過半年的優化,拍賣首頁猜你喜歡核心指標變化如下,考慮到6.10號有改版(猜你喜歡從第三屏到第二屏),這裡可以著重看下近三個月的指標變化。對比六月,八月份日均GMV+98%,日均引導IPVUV+28%,拍下UV+69%,30天拍品拍下率從+381%,均明顯高於大盤增幅。

  • 主要驅動是大資產,可以看下大資產6.10~9.10的IPVUVGMV:

  • AB實驗結果明細



下一步工作


從演算法角度,一直有兩個問題沒探討,其一是使用者冷啟動其二是價格。如何讓新使用者破冰?即第一次交保。除了技術層面,這裡還包括信任層面。畢竟拍賣不論是B端還是C端,都是很專業的事情。不過,猜你喜歡更有義務來承接。其次就是價格,高客單是拍賣的特點,而價格本身也是決定某拍品是否有人出價、最終拍下重要因素;此外,拍賣的品往往用於投資,具有很高的價格彈性。如何在推薦鏈路中融入價格,既需要,也很困難。

最後是站在業務角度,英式升價拍賣也不一定是線上拍的最優機制,譬如今年諾獎獲得者提出的同步多輪拍賣(SMRA),也是針對“贏家詛咒”問題做了很好的解法。此外,他們還有一個證明是“當競標者在投標過程中對彼此的估價瞭解得更多時,這種拍賣形式會給賣家帶來更高的預期收入”這一點也值得關注。因為,競標者對於拍賣品的估價可能與其他競標者估價相互關聯。也就是說,如果某個競標者對拍賣品的估價發出強烈的訊號,其他競拍者看到這一點,自己的估值訊號也會變得強烈。當越來越多的相關私人資訊被揭示,傳統的升序英式拍賣就會比降序的荷式拍賣產生更高的收益。或許,我們也不能總是獨立的看待每個競拍者,對吧?

特別感謝:淘系商家自運營及智慧場景組、淘系商業機器智慧團隊及阿里拍賣事業部,也希望更多的小夥伴瞭解和走進阿里拍賣業務。

淘系技術部-商業機器智慧團隊

商業機器智慧部是一支資料和演算法一體的團隊,服務於淘寶、天貓、聚划算、閒魚和躺平等業務線的二十餘個業務場景,提供線上零售、內容社群、3D智慧設計和端上智慧等資料和演算法服務。我們通過機器學習、強化學習、資料探勘、機器視覺、NLP、運籌學、3D演算法、搜尋和推薦演算法,為千萬商家尋找商機,為平臺運營提供智慧化方案,為使用者提高使用體驗,為設計師提供自動搭配和佈局,從而促進平臺和生態的供給繁榮和使用者增長,不斷拓展商業邊界。

這是一支快速成長中的學習型團隊。在創造業務價值的同時,我們不斷輸出學術成果,在KDD、ICCV、Management Science等國際會議和雜誌上發表數篇學術論文。團隊學習氛圍濃厚,每年組織上百場技術分享交流,互相學習和啟發。真誠邀請海內外相關方向的優秀人才加入我們,在這裡成長並貢獻才智。

如果您有興趣可將簡歷發至[email protected],期待您的加入!

拓展閱讀

作者王海平(感知)

編輯|橙子君

出品|阿里巴巴新零售淘系技術