1. 程式人生 > 其它 >推薦系統之必備要素:資料

推薦系統之必備要素:資料

資料可分為以下幾個維度:

  • 使用者維度:分為顯式、隱式
  • 物料&表現資料維度
  • 其他資料

-------------------------------------------------

資料經過以下過程逐步湊體現出業務利用價值:

S1-採集

  採集的資料包括結構化和非結構化兩種,是正確的業務建模、高效工程的基礎。其中最重要的一部分是埋點資料,埋點的資料要經歷ETL清洗、資料整合、報表呈現等過程才能進入下一步資料探勘的步驟。

  埋點資料指標的規劃涉及到三個主要方面:指標定義、指標維度、更新週期。

  埋點資料按照型別又會分為:

    • 點選、收藏、加購、購買、瀏覽時長等等業務方面的行為資料。使用者行為=商品/內容等資訊載體(類目、年代、明星、etc)+顯性操作(購買、關注、下載、etc)+隱形操作(時長、跳過、etc)
    • Query
    • icon
    • 推薦/展示邏輯資訊

  採集的資料通過以下六個維度考察是否符合要求:

    • 完整性
    • 及時性:根據業務需求及特性來決定採集頻率
    • 規範性
    • 一致性:相同名稱的資料在不同場景下依然代表同樣的含義。
    • 準確性:定義準確,無歧義
    • 關聯性

S2-資料探勘

  在資料中發現業務的隱藏資訊和規律

S3-決策

S4-資料驅動

  方向1 確定分析目標,根據資料分佈發現業務問題。

  方向2 找到合適的指標,制定相應資料閥值,監控資料異常

  方向3 評估資料渠道,通過對資料的二次加工和分析,比較渠道優劣,從而確定迭代方向

  通過資料,亦可實現行為路徑分析、單體使用者行為跟蹤、精細化使用者分群等常見的運營需求。