1. 程式人生 > >用SparkSQL構建使用者畫像

用SparkSQL構建使用者畫像

一、 前言

大資料時代已經到來,企業迫切希望從已經積累的資料中分析出有價值的東西,而使用者行為的分析尤為重要。利用大資料來分析使用者的行為與消費習慣,可以預測商品的發展的趨勢,提高產品質量,同時提高使用者滿意度。

二、 初識使用者畫像

右邊是一個人的基本屬性,通過一個人的基本屬性我們可以瞭解到這個人的基本資訊,左邊上圖是通過消費購物資訊來描述一個人特徵,左邊下圖是通過交際圈資訊來描述一個人特徵,通過不同的維度,去描述一個人,認識一個人,瞭解一個人。這就是我們今天所要講到的使用者畫像。

使用者畫像:也叫使用者資訊標籤化、客戶標籤;根據使用者社會屬性、生活習慣和消費行為等資訊而抽象出的一個標籤化的使用者模型。從電商的角度看,根據你在電商網站上所填的資訊和你的行為,可以用一些標籤把你描繪出來,描述你的標籤就是使用者畫像。構建使用者畫像的核心工作即是給使用者貼

“標籤”,而標籤是通過對使用者資訊分析而來的高度精煉的特徵標識。

 

三.構建電商使用者畫像的重大意義

        羅振宇在《時間的朋友》跨年演講舉了這樣一個例子:當一個壞商家掌握了你的購買資料,他就可以根據你平時購買商品的偏好來決定是給你發正品還是假貨以此來提高利潤,且不說是否存在這種情況,但這也說明了利用使用者畫像可以做到“精準營銷”,當然這是極其錯誤的用法。

其作用大體不離以下幾個方面:

u  1、精準營銷,分析產品潛在使用者,針對特定群體利用簡訊郵件等方式進行營銷;

u  2、使用者統計,比如中國大學購買書籍人數

TOP10

u  3、資料探勘,構建智慧推薦系統,利用關聯規則計算,喜歡紅酒的人通常喜歡什麼運動品牌,利用聚類演算法分析,喜歡紅酒的人年齡段分佈情況;

u  4、進行效果評估,完善產品運營,提升服務質量,其實這也就相當於市場調研、使用者調研,迅速下定位服務群體,提供高水平的服務;

u  5、對服務或產品進行私人定製,即個性化的服務某類群體甚至每一位使用者(個人認為這是目前的發展趨勢,未來的消費主流)。比如,某公司想推出一款面向510歲兒童的玩具,通過使用者畫像進行分析,發現形象=“喜羊羊”、價格區間=“中等”的偏好比重最大,那麼就給新產品提供了非常客觀有效的決策依據。

u  6、業務經營分析以及競爭分析,影響企業發展戰略

 

四、 如何構建電商使用者畫像  

 

4.1 構建電商使用者畫像技術和流程

 

構建一個使用者畫像,包括資料來源端資料收集、資料預處理、行為建模、構建使用者畫像

有些標籤是可以直接獲取到的,有些標籤需要通過資料探勘分析到!

 

4.2 源資料分析

使用者資料分為2類:動態資訊資料、靜態資訊資料

靜態資訊資料來源:

  • 使用者填寫的個人資料,或者由此通過一定的演算法,計算出來的資料
  • 如果有不確定的,可以建立模型來判斷,比如使用者的性別註冊沒有填寫,可以建立模型,根據使用者的行為來判斷使用者性別是什麼,或者它的概率

動態資訊資料來源:

  • 使用者行為產生的資料:註冊、遊覽、點選、購買、簽收、評價、收藏等等。
  • 使用者比較重要的行為資料:遊覽商品,收藏商品、加入購物車、關注商品

根據這些行為特性可以計算出:使用者註冊時間、首單時間、潮媽族、糾結商品、最大消費、訂單數量、退貨數量、敗家指數、品牌偏好等等。

 

4.3 目標分析

使用者畫像的目標是通過分析使用者行為,最終為每個使用者打上標籤,以及該標籤的權重。

如,紅酒 0.8、李寧 0.6

標籤:表現了內容,使用者對該內容有興趣、偏好、需求等等。

權重:表現了指數,使用者的興趣、偏好指數,也可能表現使用者的需求度,可以簡單的理解為可信度,概率。