1. 程式人生 > >推薦系統架構及流程說明

推薦系統架構及流程說明

這裡寫圖片描述

  個性化推薦系統,實現了新聞、二手資訊等多種型別的資訊的個性化推薦,每一個使用者都會擁有屬於自己的個性化推薦列表。下面簡單介紹推薦架構及推薦流程。
  本推薦架構參照Lambda架構,分為三層:批處理層、實時處理層和服務層。
  (1)批處理層:主要元件是HDFS、Hbase和Spark MLlib。持久化的歷史資料、靜態資料保存於Hbase或HDFS;應用程式使用Spark MLlib機器學習演算法庫,批處理歷史資料,建立聚類或分類模型;新資料經過流處理後輸入模型,從而獲得分類標籤。
  以新聞推薦為例:在騰訊、搜狐、新浪網等網站按類別(如體育、娛樂、教育等)爬取新聞,分詞過濾,建立每篇新聞的詞特徵向量,並打上相應類別標籤。將處理過的資料儲存到Hbase中作為訓練資料。編寫Spark程式讀取訓練資料,呼叫MLlib的貝葉斯分類演算法,訓練新聞分類模型。
  根據使用者歷史瀏覽情況對使用者進行協同過濾,對待推薦的新聞進行聚類,都在本層實現。
  (2)實時處理層:主要元件是Kafka和SparkStreaming。爬蟲作為Kafka的producer,將資料推送到Kafka中暫存。持久化程式作為一個Kafka的consumer,將原始資料儲存到HDFS或Hbase。需要實時流處理的程式作為另外的Kafka consumer,對資料進行實時處理,結果輸出到持久化儲存或模型中進行進一步處理。
  以新聞推薦為例:爬蟲定時爬取各個新聞網站的新文章,持久化程式從kafka中取出資料儲存到Hbase;Spark Streaming實現的流處理程式對新聞進行實時分詞、過濾、建立特徵向量,然後輸入新聞分類模型進行新聞分類,同時將特徵資料儲存到Hbase中持久化。打上標籤的新聞儲存到Redis中供服務層使用。
該層還實現使用者關聯訪問圖的維護。關聯訪問即在一個時間段內,一個使用者看了新聞A也看了新聞B。關聯訪問圖以每個待推薦新聞作為頂點,關聯訪問了兩個頂點的使用者數作為兩個頂點的邊。圖根據使用者的瀏覽情況實時更新,儲存在redis裡。
  (3)服務層:主要元件是redis,web服務程式。redis儲存各個策略得出的推薦列表,當用戶從web服務介面登入時,根據redis中儲存的使用者偏好情況、使用者聚類結果、新聞聚類結果、隨機抽取結果、協同過濾結果以及關聯訪問結果按照組合策略給出該使用者的推薦列表。

下一篇將對本文中提到的各種工具做簡要介紹:

推薦系統相關工具簡介

相關推薦

推薦系統架構流程說明

  個性化推薦系統,實現了新聞、二手資訊等多種型別的資訊的個性化推薦,每一個使用者都會擁有屬於自己的個性化推薦列表。下面簡單介紹推薦架構及推薦流程。   本推薦架構參照Lambda架構,分為三層:批處理層、實時處理層和服務層。   (1)批處理層:主要元

struts2系統架構處理流程

struts2 處理流程 一、struts2系統架構· 1.FilterDispatcher是整個Struts2的調度中心,也就是MVC中的C(控制中心),根據ActionMapper的結果來決定是否處理請求,如果ActionMapper指出該URL應該被Struts2處理,那麽它將會執行Action

一文簡單理解“推薦系統”原理架構

本文主要介紹什麼是推薦系統,為什麼需要推薦系統,如何實現推薦系統的方案,包括實現推薦系統的一些常見模型,希望給讀者提供學習實踐參考。 為什麼需要推薦系統                      

推薦系統架構-(附ppt&代碼)

用戶標簽 als kubernets nbsp ted 軟文 embed 歷程 快速叠代 Part1.樂視網視頻推薦系統 推薦系統:和傳統的推薦系統架構無異(基礎建模+規則) 數據模塊特點:用戶反饋服務數據-》kv 緩存-》log存儲

聚合四方支付系統架構所需配置

三方 一個 完全 支付 位或 windows 定時 活性 擁有 聚合四方支付系統架構及所需配置 聚合支付介於第三方支付和商戶之間,不進行資金清算,但能夠根據商戶的需求進行個性化定制,形成支付通道資源優勢互補,具有中立性、靈活性、便捷性等特點。 聚合支付系統,可以將市面上主流

ROS系統架構概念 學習筆記(二)

理解ROS檔案系統級 指令學習: 標準cmake流程,一次僅能編譯一個包: $ camke packageToBuild/ $ make 編譯工作空間所有包: $ cd workspace $ catkin_make 為了建立  修改  或者使用功能包

大資料推薦系統架構

推薦系統介紹 當下,個性化推薦成了網際網路產品的標配。但是,人們對推薦該如何來做,也就是推薦技術本身,還不甚瞭解。為此,好學的你肯定在收藏著朋友圈裡流傳的相關文章,轉發著微博上的相關討論話題,甚至還會不斷奔走在各種大小行業會議之間,聽著大廠職工們講那些乾貨。我知道,這樣碎片化的吸收,增加了知識的

Java架構-蘇寧 11.11:蘇寧易購訂單搜尋系統架構實現

背景 隨著蘇寧易購平臺規模的飛速發展,平臺的訂單量呈現指數級的增長,儲存容量已達 TB 級,訂單量更是到了萬億級別,尤其在雙 11 大促流量洪峰的場景下,面臨兩個挑戰: 1、如何儲存如此巨大的資料量 2、如何提供高併發、低延遲、多維度的檢索服務 傳統關係型資料庫無法支撐多維度的

Kubernetes系統架構元件功能 筆記

Kubernetes系統架構及元件功能 Kubernetes叢集包含有節點代理kubelet和Master元件(APIs, scheduler, etc),一切都基於分散式的儲存系統。 Kubernetes節點有執行應用容器必備的服務,而這些都是受Master的控制。

京東推薦系統架構揭祕:大資料時代下的智慧化改造

在電商領域,推薦的價值在於挖掘使用者潛在購買需求,縮短使用者到商品的距離,提升使用者的購物體驗。 京東推薦的演進史是絢麗多彩的。京東的推薦起步於2012年,當時的推薦產品甚至是基於規則匹配做的。整個推薦產品線組合就像一個個鬆散的原始部落一樣,部落與部落之前沒有任何工程、演算法的交集。201

Netflix公佈個性化和推薦系統架構

Netflix的推薦和個性化功能向來精準,前不久,他們公佈了自己在這方面的系統架構。 3月27日,Netflix的工程師Xavier Amatrain和Justin Basilico在官方部落格釋出文章,介紹了自己的個性化和推薦系統架構。文章開頭,他們指出

Hadoop分散式檔案系統架構設計要點

Datanode    HDFS採用master/slave架構。一個HDFS叢集是有一個Namenode和一定數目的Datanode組成。Namenode是一箇中心伺服器,負責管理檔案系統的namespace和客戶端對檔案的訪問。Datanode在叢集中一般是一個節點一個,負責管理節點上它們附帶的儲存。在內

蜂鳥運單系統架構實現

作者簡介 大錘,物流運單與服務負責人,同時也是運單系統最早的主力研發,運單系統這些年經歷了數次優化和重構,支撐起如今巨大的體量,大錘功不可沒 背景 運單系統是蜂鳥配送系統核心,支撐著所有配送業務。運單系統需要有很好的擴充套件性和穩定性,以應對網際網路產品千變化萬的更新迭代和大流量下的系統穩定

實戰智慧推薦系統(14)-- 推薦系統架構

外圍架構一般來說,每個網站都有一個 UI 系統,UI 系統負責給使用者展示網頁並和使用者互動。網站會通過日誌系統將使用者在 UI 上的各種各樣的行為記錄到使用者行為日誌中。從上面的結構可以看到,除了推薦系統本身,主要還依賴兩個條件--介面展示和使用者行為資料。推薦系統架構推薦

攜程推薦系統架構學習

下圖是攜程推薦系統的架構圖,參考攜程大資料實踐:高併發應用架構及推薦系統案例 這個圖,畫的較攜程應用系統整體架構學習清晰。 對我的技術選型和架構設計有很多借鑑參考的地方 1 資料採集 採集的

深度學習利器: TensorFlow系統架構高效能程式設計

2015年11月9日谷歌開源了人工智慧平臺TensorFlow,同時成為2015年最受關注的開源專案之一。經歷了從v0.1到v0.12的12個版本迭代後,谷歌於2017年2月15日釋出了TensorFlow 1.0 版本,並同時在美國加州山景城舉辦了首屆TensorFlo

網際網路DSP廣告系統架構關鍵技術解析 | 廣告行業資深架構師親述

http://www.360doc.com/content/15/0806/07/2909773_489803369.shtml 此文是根據付海軍在【QCON高可用架構群】中的分享內容整理而成,轉發請註明出處。 付海軍,現就職於時趣互動,任技術總監,負責移動原生廣告平臺引擎開發和資料探勘工作,06年畢業

相關推薦系統架構

重復判斷 以及 使用 png 根據 語義 width family nbsp 推薦系統對於資訊媒體網站來說至關重要,推薦系統可以根據用戶的使用行為推薦相關內容,提高用戶的粘性和停留時間。 相關推薦是推薦系統的形勢之一,如下圖是推薦展示的效果。         

stm32基礎知識學習——系統架構時鐘

1.stm32系統架構 stm32主要由兩個主模組和四個從模組構成 1>二個主模組 : Cortex-M0 核心及先進高效能匯流排(AHB bus) 通用DMA ( GP-DMA – general-purpose DMA)

閑談思科交換機與路由器的架構流程

並運行 oot 思科交換機 cpu 路由器 conf rap 路由 tst 本文將主要為大家介紹思科交換機與路由器的硬件架構以及啟動流程方面的知識。 一、路由器的硬件架構 計算系統-----CPU 電源系統 接口系統 存儲系統 Flash:硬盤,存放iOS RAM:內存 R