1. 程式人生 > 實用技巧 >spark之淘寶app一個月資料流量運營分析

spark之淘寶app一個月資料流量運營分析

一.針對淘寶app一個月的資料進行流量運營分析,主要包括:
1.app流量分析
(1).pv頁面瀏覽量
(2).uv獨立訪客
(3).訪問深度
(4).每天訪客數和成交量
(5).不同時段的訪客數及成交量
(6).流失率
2.使用者行為分析
(1).使用者瀏覽活躍時段
(2).使用者購買活躍時段
(3).使用者瀏覽最多的類目
(4).使用者收藏最多的類目
(5).使用者加購最多的類目
(6).使用者購買最多的類目
(7).最近 30 天購買次數
(8).最近 7 天的活躍天數
(9).復購率
3.商品分析
(1).瀏覽量最多和最少的 TOP5 類目
(2).收藏量最多和最少的 TOP5 類目
(3).加購量最多和最少的 TOP5 類目
(4).購買量最多和最少的 TOP5 類目

資料集【taobao_persona.csv】來自和鯨社群 https://www.kesci.com/home/dataset/5ef7024363975d002c9235d3,
記錄了 2014 年 11 月 18 日至 2014 年 12 月 18 日的電商 APP 部分使用者行為記錄,原始資料共 23291027 條,共有 6 個屬性。

屬性名 屬性值
user_id 使用者 ID,一個 ID 允許觸發多個行為
item_id 商品 ID
behavior_type 使用者行為型別,包括瀏覽=1,收藏=2,加入購物車=3,購買=4
user_geohash 使用者地理位置
item_category 商品所屬類目的 ID
time 使用者行為發生的日期和時刻,值域為 2014/11/18-2014/12/18

二.利用spark3.0,java1.8對以上資料進行分析與統計,
程式碼:TrafficOperationAnalysis淘寶APP一個月資料的流量運營分析(
https://github.com/jiangnanboy/spark_tutorial
)