大資料識別“愛”的羊毛黨,拒絕那些它“恨”的羊毛黨
卒於“羊毛黨”,P2P公司的一大死因
2014年6月,廣州新成立一家網際網路金融公司。為了吸引消費者購買自己的理財產品,這家公司發行了價值2個億的各類優惠券。但僅僅不到半年的時間,公司便宣告倒閉。原來這些優惠券,全部都被一個“人”搶走了,確切的說,是一個5000人的“羊毛黨”團隊。
他們搶了優惠券後,全部用於購買期限在半年內兌換的理財產品,而金融公司在短期內沒有足夠的資金應對,最終導致破產。
在網際網路金融行業中,類似這樣被“羊毛黨”傷害的例子還有很多。
羊毛黨,起源於網際網路金融的P2P平臺,是指那些專門選擇網際網路渠道的優惠促銷活動,以低成本甚至零成本換取物質上的實惠的人。拼搶這些促銷活動的行為被稱為“薅羊毛”。具體到網際網路金融公司的業務,就是很多在手機App中搶紅包、代金券的羊毛黨對網際網路金融有什麼影響?有什麼辦法可以識別出他們麼?
進階的羊毛黨,已開始規模化專業化
我們TalkingData團隊根據羊毛黨的不同特點將他們劃分成了四個型別。
初級羊毛黨多是一些“愛佔小便宜”的散客,他們常常是零散進行薅羊毛活動。中級羊毛黨常通過一些羊毛群獲得相關資訊 ,積極參加薅羊毛活動,開始呈現出一種鬆散的組織形態。初級和中級羊毛黨都屬於第一代羊毛黨,是“業餘玩家”。
第三類是“專職羊毛黨”,他們是工具化的“職業玩家”,屬於第二代羊毛黨。 一方面,他們會使用代理IP讓反欺詐系統無法判斷它的位置;另一方面,他們還使用大量的虛擬號自動註冊。甚至有專門的收碼平臺幫你輸入驗證碼,費用從每次1毛到2.5毛不等。
最高階的第四類是“團長羊毛黨”,屬於第三代羊毛黨。他們是羊毛黨中的“正規軍”,有組織、有紀律,利用手中的羊毛聯盟等資源進行刷單刷量,獲取經濟效益。 有一家團長羊毛黨公司,憑藉幾千萬個蘋果賬號刷單規模,他們可以決定每日App store中游戲的下載排名。一個月僅App刷量業務就可以達到兩三個億的流水,收入非常可觀。
“大資料”羊毛黨,靠大資料識別
越過層層反欺詐手段、利用大量的id和帳號進行刷單……仔細一看,這些羊毛黨也可以算是“大資料公司” 了。那麼對付“大資料公司”,當然也要用大資料的手段。針對不同客戶的需求,我們在實踐中總結出了一套完整的“羊毛黨反欺詐評分模型”。
我們從裝置實體地址、App內部行為資訊、交易資訊、App競品安裝情況等四個維度大資料資訊,構建了評分模型。這套模型主要用了圖資料庫(graph database)技術,它可以通過點和邊把所有資料連在一起,便於發現數據中的關係。Neo4j是目前較優秀的一款圖資料庫開源軟體,在處理關係型資料時效率很高。
如果想看一個裝置上有多少個使用者數。原始的資料庫是很難看出規律的,但如果用關係型資料庫做一些圖譜計算和視覺化處理,模型就好看多了。
上圖中紅點代表了一個手機裝置,其他顏色的則代表了不同的元素。從圖中可以清晰地看出,這一個手機裝置通過多次刷機形成了19臺虛擬裝置,這19臺設備註冊了19個賬號完成了19次薅羊毛行動的資料軌跡。這是通過裝置實體地址來判斷羊毛黨的案例之一。
其次,App內的點選行為也可以是判斷依據。由於羊毛黨都是機器操作,它們在App中瀏覽優惠券並點選的時間間隔要遠小於普通使用者,而且往往一旦搶到紅包就再也不登入了。通過這些特點我們可以找出一些疑似羊毛黨。
此外,註冊和交易時間間隔,單個使用者參與活動頻率,交易頻次,提現頻率、營銷返現、刷訂單等行為,都是羊毛黨反欺詐評分模型的判斷依據。通過這個模型,公司就可以將所有使用者打分,找出不同型別的羊毛黨。
讓人“又愛又恨”的羊毛黨
羊毛黨雖然讓很多網際網路金融公司遭受了巨大損失,但是這些公司也並不想將羊毛黨們“趕盡殺絕”。因為一定數量的羊毛黨能夠有效幫助那些處在成長期的網際網路金融公司,為它們快速積累使用者規模和交易規模,推動平臺快速發展。這些資料的提升可以作為企業下一步找風投的融資籌碼。
但這也是一枚硬幣的正反面: 羊毛黨如果太多,就會大大加大網際網路金融公司的獲客成本,使他們無法接觸到自己的目標客戶,甚至發生惡性擠兌,導致公司破產。
所以網際網路金融公司對於羊毛黨的感情是愛恨交織的:一方面要遮蔽掉那些“專職羊毛黨”和“團長羊毛黨”,另一方面又要吸引第一代羊毛黨幫助提升流量和使用者數。基於圖資料庫的“羊毛黨反欺詐評分模型”能夠幫助企業識別出它“愛”的羊毛黨,拒絕那些它“恨”的羊毛黨。