推薦系統之必備要素:資料
阿新 • • 發佈:2021-08-20
資料可分為以下幾個維度:
- 使用者維度:分為顯式、隱式
- 物料&表現資料維度
- 其他資料
-------------------------------------------------
資料經過以下過程逐步湊體現出業務利用價值:
S1-採集
採集的資料包括結構化和非結構化兩種,是正確的業務建模、高效工程的基礎。其中最重要的一部分是埋點資料,埋點的資料要經歷ETL清洗、資料整合、報表呈現等過程才能進入下一步資料探勘的步驟。
埋點資料指標的規劃涉及到三個主要方面:指標定義、指標維度、更新週期。
埋點資料按照型別又會分為:
-
- 點選、收藏、加購、購買、瀏覽時長等等業務方面的行為資料。使用者行為=商品/內容等資訊載體(類目、年代、明星、etc)+顯性操作(購買、關注、下載、etc)+隱形操作(時長、跳過、etc)
- Query
- icon
- 推薦/展示邏輯資訊
採集的資料通過以下六個維度考察是否符合要求:
-
- 完整性
- 及時性:根據業務需求及特性來決定採集頻率
- 規範性
- 一致性:相同名稱的資料在不同場景下依然代表同樣的含義。
- 準確性:定義準確,無歧義
- 關聯性
S2-資料探勘
在資料中發現業務的隱藏資訊和規律
S3-決策
S4-資料驅動
方向1 確定分析目標,根據資料分佈發現業務問題。
方向2 找到合適的指標,制定相應資料閥值,監控資料異常
方向3 評估資料渠道,通過對資料的二次加工和分析,比較渠道優劣,從而確定迭代方向
通過資料,亦可實現行為路徑分析、單體使用者行為跟蹤、精細化使用者分群等常見的運營需求。