高併發文章瀏覽量計數系統設計

阿新 • • 發佈：2019-01-13

最近因為個人網站的文章瀏覽量計數在Chrome瀏覽器下有BUG，所以打算重新實現這個功能。

原本的實現很簡單，每次點選文章詳情頁的時候，前端會發送一個GET請求articles/id獲取一篇文章詳情。這個時候，會把這篇文章的瀏覽量+1，再存進資料庫裡。

這個實現原本可以實現這個功能，但是後來我才發現，我犯了一個很致命的錯誤：在GET請求的業務邏輯裡進行了資料的寫操作！

原則來講，GET請求應該具有冪等性，即短時間內同時兩個一模一樣的GET請求，返回的結果也應該是一樣的。而我原本的實現就破壞了GET請求的冪等性。

恰好，在Chrome瀏覽器裡，我的文章詳情頁會發送兩次GET請求。這疑似Chrome瀏覽器和nuxt服務端渲染之間的一個BUG，目前還沒有定位到具體原因。

但無論如何，後端應該是可以避免這樣的BUG，即使某使用者短時間內請求兩次或者多次，也應該只增加一次瀏覽量計數。

由於最近在學習高併發方面的知識，所以這裡也考慮一下，如果一個高併發的文章瀏覽量計數系統，應該如何設計？

先來理一下需求。

需求

使用者可以是匿名的，不需要登入
每當一個使用者點選了一個文章的詳情頁面，這個文章的瀏覽量應該+1
使用者應該能立即看到自己點選文章後瀏覽量+1的反饋
瀏覽量這個資料存在Mysql和ElasticSearch裡面，要最終一致(不要求強一致)
作者可能在後臺編輯文章，然後儲存文章。如果在這期間有瀏覽量的增加，儲存文章的時候不應該覆蓋掉這段時間的瀏覽量增量。

應該在服務端對使用者的請求去重，防止使用者不斷重新整理或者使用爬蟲不斷請求某個API（建議通過IP）
要過濾掉百度和谷歌的爬蟲請求（根據User-Agent頭判斷，可以先不做）
要高效能地實現“檢視瀏覽最多文章列表”的功能。
儘可能優化效能，滿足多個使用者的高併發需求。

設計思路

如果要滿足高併發，那首先考慮用非同步和快取。所以考慮使用多執行緒加Redis的解決方案。

請求流程：

使用者點選某篇文章詳情頁
前端傳送一個PUT請求/articles/{id:\\d+}/view。
後端使用執行緒池執行一個非同步任務，立即返回給前端200響應。
前端得到200響應後，立即把當前文章的瀏覽量+1，滿足需求3。

後端主要邏輯：

後端的主要思路是暫時把增加的瀏覽量（假設某篇文章為n）放進Redis裡，然後每隔一段時間重新整理到Mysql資料庫和ElasticSearch儲存裡，讓這篇文章的瀏覽量在現有的基礎上加n，然後把Redis這篇文章的瀏覽量清零。

後端首先判斷redis裡時候有沒有當前ip對這篇文章的瀏覽記錄，這個key為：isViewd:articleId:ip。如果有，就說明之前瀏覽過，就什麼也不做，直接返回。如果沒有，就加上這個key。時間可以設定為1小時過期，防止佔用過多記憶體。這裡使用Redis的string型別。
如果第5步的結果是沒有，那就在Redis裡給這篇文章的瀏覽量+1。Redis的這個支援原子操作，所以不用擔心併發問題。key為viewCount:articleId，value為快取的瀏覽量。完成後當前執行緒任務就結束了。這裡使用Redis的string型別。這些key應該沒有過期時間。
弄一個定時任務，比如每5分鐘，去Redis裡拿快取的瀏覽量，拿到後就更新到資料庫和ElasticSearch裡，並把Redis的資料清零。為了防止併發帶來的問題，這裡應該是拿到m，就在Redis裡減去m，而不是直接設定為0。
為了節約記憶體，應該刪除不必要的key，按照業務邏輯來看，如果一篇文章長時間沒有人瀏覽，可能這篇文章比較“舊”了，我們可以考慮刪除它在Redis裡面的key。所以我們可以在第6步，每次在Redis裡進行瀏覽量+1操作時，記錄下一個時間戳。所以Redis可以使用hash型別，一個欄位存最後操作時間，一個欄位存瀏覽量。而在第7步裡，我們可以順便刪除掉最後操作時間小於十天前的key。
儲存更新文章的時候，應該只更新其它欄位，而不更新瀏覽量這個欄位。或者執行一遍第7步的邏輯。由於Redis加減操作的原子性，這裡不用擔心併發問題。如果當前執行緒把一篇文章的瀏覽量在Redis裡減了m，那定時任務執行緒應該得到的是減了m之後的結果，所以資料會是一致的。
關於需求8，在併發量不算特別大的時候，我們還是去取資料庫裡面的資料，根據資料庫裡面的瀏覽量來排序，只是可以在應用裡面給它加一個快取，快取時間應該與第7步定時任務一致，這裡設定為5分鐘。

如果併發量特別大，可以考慮不把瀏覽量存在資料庫裡，而僅存在Redis裡，這樣可以得到近乎實時的瀏覽量儲存，而且需求8排序也是實時的（使用zset)，但這樣可能會耗費大量的記憶體資源。

後記

雖然最後權衡了併發量和複雜性，我的個人網站的文章瀏覽邏輯並沒有完全按照上述設計思路來做，但上述思路是我對一個高併發文章瀏覽量計數系統設計的思考，以後如果有機會可以寫一個開源的版本。

可能實現起來會更復雜，根據併發量的不同，程式碼也會有一些差別，以上思路僅供參考。

高併發文章瀏覽量計數系統設計

最近因為個人網站的文章瀏覽量計數在Chrome瀏覽器下有BUG，所以打算重新實現這個功能。原本的實現很簡單，每次點選文章詳情頁的時候，前端會發送一個GET請求articles/id獲取一篇文章詳情。這個時候，會把這篇文章的瀏覽量+1，再存進資料庫裡。這個實現原本可以實現這個功能，但是後來我才發現，我犯

從SpringBoot構建十萬博文聊聊高併發文章瀏覽量設計

前言在經歷了，快取、限流、布隆穿透等等一系列加強功能，十萬部落格基本算是成型，網站上線以後也加入了百度統計來見證十萬+ 的整個過程。但是百度統計並不能對每篇博文進行詳細的瀏覽量統計，如果做一些熱點博文排行、48小時排行之類統計，還需要引入瀏覽量統計功能。設計通常情況下，我們只需要每次請求瀏覽量+1

SpringBoot：高併發下瀏覽量入庫設計

一、背景文章瀏覽量統計，low的做法是：使用者每次瀏覽，前端會發送一個GET請求獲取一篇文章詳情時，會把這篇文章的瀏覽量+1，存進資料庫裡。 1.1 這麼做，有幾個問題：在GET請求的業務邏輯裡進行了資料的寫操作！併發高的話，資料庫壓力太大；同時，如果文章做了快取和搜尋引擎如ElasticSea

實戰講解高併發和秒殺搶購系統設計

網際網路特別是電商平臺，阿里雙11秒殺、還有12306春運搶票、以及平時各種節假日搶購活動等，都是典型的高併發場景。這類場景最大的特徵就是活動週期短，瞬間流量大（高併發），大量的人短期湧入伺服器搶購，但是數量有限，最終只有少數人能成功下單。這裡，就來講一講對應該場

C#使用代理Ip刷新csdn文章瀏覽量

獲取 center ebr display void ons os x finall set 昨天寫了一篇關於“c#批量抓取免費代理並驗證有效性”的文章，接著昨天的目標繼續完成吧，最終實現的目的就是刷新csdn文章的瀏覽量（實際上很簡單，之前博

MySQL 在高併發下的訂單撮合系統使用共享鎖與排他鎖保證資料一致性

作者：林冠巨集 / 指尖下的幽靈掘金：juejin.im/user/587f0d… 部落格：www.cnblogs.com/linguanh/ GitHub ： github.com/af913337456… 騰訊雲專欄： cloud.tencent.c

如何打造一個高效能、高併發的訊息推送系統

前言女友常常勉勵我：“要有共享、開放、開源的現代網際網路思維，自己的經驗要多總結，發到部落格論壇上什麼的。”之前也有腦洞開啟，想分享一些個人在工作之中、工作之外的所思所得，可始終不能持久。這次想把本次參與開發的專案記錄、分享出來，希望能持之以恆。 part 1 即時通訊與訊息推送

【多執行緒高併發】多執行緒的設計模式

多執行緒的設計模式程式碼在Multi_004當中並行設計模式屬於設計優化的一部分，他是對一些常用的多執行緒結構的總結和抽象，與序列程式相比，並行程式的結構通常更為複雜，因此合理的使用並行模式在多執行緒開發中更具有意義，在這裡主要介紹Futur

大流量、高併發的網站的底層系統架構

動態應用，是相對於網站靜態內容而言，是指以c/c++、php、Java、perl、.net等伺服器端語言開發的網路應用軟體，比如論壇、網路相簿、交友、BLOG等常見應用。動態應用系統通常與資料庫系統、快取系統、分散式儲存系統等密不可分。大型動態應用系統平臺主要是針對於大流量、高併發網站建立的

億級資料的高併發通用搜索引擎架構設計

[文章作者：張宴本文版本：v1.0 最後修改：2008.12.09 轉載請註明原文連結：http://blog.s135.com/post/385/]　　曾經在七月，寫過一篇文章──《基於Sphinx+MySQL的千萬級資料全文檢索（搜尋引擎）架構設計》，前公司的分類資訊搜

不懂這些高併發分散式架構、分散式系統的資料一致性解決方案，你如何能找到高新網際網路工作呢？強勢解析eBay BASE模式、去哪兒及蘑菇街分散式架構

網際網路行業是大勢所趨，從招聘工資水平即可看出，那麼如何提升自我技能，滿足網際網路行業技能要求？需要以目標為導向，進行技能提升，本文主要針對高併發分散式系統設計、架構(資料一致性)做了分析，祝各位早日走上屬於自己的"成金之路"。目錄：問題分析概念解讀Most Simple原理解讀eBey、去哪兒、蘑菇街分

重新整理頁面，js實現文章瀏覽量自動更新

瀏覽次數：<script src="{:U('Show/news_read_count',array('id'=>$Rs['id']))}" type="text/javascript"&

iOS控制高併發-dispatch_semaphore(訊號量)的用法

1.前言: 在單執行緒的程式中,程式的執行有先後順序，但是在多執行緒的程式中，線上程之間的程式執行中沒有先後順序，因此會出現併發的情況，導致程式的不確定性，因此需要dispatch_semaphore做程式的高併發管理。2.介紹: dispatch_sema

Java高併發程式設計——為IO密集型應用設計執行緒數與劃分任務

文章轉自：http://www.tuicool.com/articles/fA7rMn 實際工作中的三類程式適用於以併發的形式來提速： 1. 服務程式：同時響應多個使用者請求 2. 計算密集型程式：併發計算，將問題拆分為子任務、併發執行各子任務並最終將子任務的結果彙

高併發訂單系統架構設計

高併發下單主要包括以下幾個方面：分庫分表多應用例項全域性唯一訂單號資料庫連線買家查詢訂單賣家查詢訂單擴容問題業務拆分一、分庫分表隨著訂單量的增長，資料庫的發展主要經歷以下幾個步驟： - 1主-1從架構 - 雙主-多從架構，讀寫分離 - 表

億級流量系統架構之如何設計每秒十萬查詢的高併發架構【石杉的架構筆記】

歡迎關注個人公眾號：石杉的架構筆記（ID:shishan100）週一至週五早8點半！精品技術文章準時送上！億級流量架構專欄：億級流量系統架構之如何支撐百億級資料的儲存與計算億級流量系統架構之如何設計高容錯分散式計算系統億級流量系統

分散式秒殺系統-REDIS（高併發、高效能、庫存資料一致、不限語言-設計思路一致）

一、秒殺系統準備 1、首先需要能夠抗住基本請求流量的伺服器環境 2、高可用的redis環境(叢集、主從、資料持久化) ps：如果你的每秒請求只有幾百幾千一個REDIS完全夠用不需要額外操心，另外秒殺功能產品往往會加一個小梗，那就是開始秒殺時使用者需要填寫兌換的賬號才能發起秒殺，這裡根據使用者

架構學習之路——高可用高併發系統設計原則 (轉)

作者 Geekwolf 本文作者為網易高階運維工程師本文主要是學習開濤《億級流量網站架構核心技術》一書學習筆記及自己的感悟：架構設計三大定律墨菲定律 - 任何事沒有表面看起來那麼簡單 - 所有的事都會比預計的時間長 - 可能出錯的事情總會出錯 - 擔心

高併發系統設計與時間和空間的平衡

高併發系統設計與時間和空間的平衡高可用上文我們已經講過了，可當前網際網路時代，怎麼少的了高併發呢？高併發和高可用一樣，已經變成各個系統的標配了，如果你的系統QPS沒有個大幾千上萬，都不好意思跟人打招呼，雖然可能每天的呼叫量不超過100。

如何設計一個高併發系統

　　系統拆分，將一個系統拆分為多個子系統，用dubbo來搞。然後每個系統連一個數據庫，這樣本來就一個庫，現在多個數據庫，不也可以抗高併發麼。　　快取，必須得用快取。大部分的高併發場景，都是讀多寫少，那你完全可以在資料庫和快取裡都寫一份，然後讀的時候大量走快取不就得了。畢竟人家redis

高併發文章瀏覽量計數系統設計

需求

設計思路

後記

相關推薦