MongoDB億級檔案儲存方案測試

阿新 • • 發佈：2019-01-04

測試目標：mongodb gridfs

1 海量小檔案（1K－50K）的插入速度測試

2 億級檔案儲存的讀取速度測試

3 瞭解mongodb擴充套件對儲存容量、讀寫速度的影響

4 mongodb的穩定性和缺陷

測試一：單節點測試（4核＊ 32G記憶體）官方Client

每秒插入速度：8000條（4000個1K檔案）

單節點儲存1億個檔案後，硬碟寫滿了

測試二：shard叢集測試一，每個Replica Set中member數量為3，總共2個叢集自己重寫Client

shard1: dxud3c006 + dxud3c007 + dxud3c008

shard2: dxud3c009 + dxud3c010 + dxud3c011

config server: dxud3c006 + dxud3c009 + dxud3c005

mongos: dxud3c005(4個）

每秒插入速度：3500條（1750個1K檔案）

平均每個shard插入速度：1500－2000條（750－1000個1K檔案）

測試三：shard叢集測試二，每個Replica Set中member數量為2，總共3個叢集自己重寫Client

shard1: dxud3c006 + dxud3c007

shard2: dxud3c008 + dxud3c009

shard3: dxud3c010 + dxud3c011

config server: dxud3c006 + dxud3c008 + dxud3c010

mongos: dxud3c005(4個）

每秒插入速度：6000條（2000個1K檔案）

平均每個shard插入速度：1800－2300條（900－1150個1K檔案）

說明：

1 官方的java－client中沒有對shard叢集模式做任何優化

2 針對本專案的場景（按ID存取檔案）對java－client進行優化：

a 建立collection（files，chunks）時，指定使用_id作為files的shard key，使用files_id作為chunks的shard key

b 建立files的collection時，使用自己生成的uuid作為_id，以避免插入時，壓力集中在一個shard

c 建立collection（files，chunks）後，手動建立15個chunks，min～1,1～2,2～3......f～max，並且手動將chunks移動到不同的shard上面去

d 由於專案的性質問題，對資料的完整性和一致性要求很高，導致insert時指定使用REPLICAS_SAFE模式

測試過程中發現的問題：

1 mongodb的叢集模式感覺不是很穩定，常出現RS102的問題：指primary節點與secondary節點同步差距過大，而導致secondary節點變為不可用狀態。需要手動將primary的資料檔案到secondary上（當資料檔案很大時，非常慢非常慢）

2 mongodb在插入時的速度不是很穩定，經常會出現3－5秒沒有插入一條資料的情況

讀取速度的測試稍後放出

轉載：http://my.oschina.net/timtech/blog/38521

MongoDB億級檔案儲存方案測試

測試目標：mongodb gridfs 1 海量小檔案（1K－50K）的插入速度測試 2 億級檔案儲存的讀取速度測試 3 瞭解mongodb擴充套件對儲存容量、讀寫速度的影響 4 mongodb的穩定性和缺陷測試一：單節點測試（4核＊ 32G記憶體）官方Cl

Redis 百億級 Key 儲存方案

1 需求背景該應用場景為DMP快取儲存需求，DMP需要管理非常多的第三方id資料，其中包括各媒體cookie與自身cookie（以下統稱supperid）的mapping關係，還包括了supperid的人口標籤、移動端id（主要是idfa和imei）的人口標籤，以及一

[轉]Mongodb億級資料量的效能測試

進行了一下Mongodb億級資料量的效能測試，分別測試如下幾個專案：（所有插入都是單執行緒進行，所有讀取都是多執行緒進行） 1）普通插入效能（插入的資料每條大約在1KB左右） 2）批量插入效能（使用的是官方C#客戶端的InsertBatch），這個測的是批量插入效能能有多少提高 3）安全插入功能

Python 操作mongodb億級資料量使用 Bloomfilter 去重例子

工作需要使用 python 處理 mongodb 資料庫兩億資料量去重複，需要在大資料量下快速判斷資料是否存在網上了解到 Bloom Filter ，Bloom filter 是由 Howard Bloom 在 1970 年提出的二進位制向量資料結構，它具有很好的空間

MongoDB ----基於分散式檔案儲存的資料庫

參考： http://www.cnblogs.com/huangxincheng/category/355399.html http://www.cnblogs.com/daizhj/category/260889.html MongDB是一個高效能，開源，無模式的文件型NosQL資料庫。主要功能特性

Nginx｜構建簡單的檔案伺服器（mac）續-FastDFS安裝（mac）｜檔案儲存方案

[TOC] # Nginx｜構建簡單的檔案伺服器（mac）續上文[FastDFS安裝（mac）｜檔案儲存方案](https://www.cnblogs.com/Bert-Sun/p/12889919.html)，與上文的FastDFS一起構建簡單的檔案伺服器。筆者主要採用Nginx與FastDFS來

MySQL如何實現萬億級資料儲存？

## 前言業界對系統的高可用有著基本的要求，簡單的說，這些要求可以總結為如下所示。 * 系統架構中不存在單點問題。 * 可以最大限度的保障服務的可用性。一般情況下系統的高可用可以用幾個9來評估。所謂的幾個9就是系統可以保證對外提供的服務的時間達到總時間的百分比。例如如果需要達到99.99的高可用，則

揭祕淘寶286億海量圖片儲存與處理架構，海量小檔案儲存的解決方案

8月27日下午，在IT168系統架構師大會儲存與系統架構分論壇上，淘寶網技術委員會主席，淘寶網核心工程師章文嵩向我們詳細介紹了淘寶網圖片處理與儲存系統的架構。章文嵩博士的演講日程包括了淘寶的整個系統架構、淘寶圖片儲存系統架構，淘寶網獨立開發的TFS叢集檔案系統，前端CDN

Redis大資料量（百億級）Key儲存需求及解決方案

問題導讀： 1. 需求背景是什麼？ 2. 儲存何種資料？ 3. 資料特點是什麼？ 4. 存在哪些技術挑戰？ 5. 解決方案有哪些？ 6. md5雜湊桶的方法需要注意哪些問題？ 7. 測試結果是什麼？解決方案： 1 需求背景該應用場景為 DM

Zabbix(五)：高級應用-web方案、被動監控、基於snmp協議被動監控、proxy配置測試實例

zabbix proxy1.web方案web scenario：web監控方案，web場景；web scenarios指的是監控指定的web站點的資源下載及頁面響應時間等數據指標；(1)創建web監控需要先定義一個web scenario(方案)：一個web方案包括一個或多個HTTP請求或步驟(steps)

基於TableStore的億級訂單管理解決方案

互聯全量 hub 增量 termquery last cfb 數據表創建表摘要：一、方案背景訂單系統存在於各行各業，如電商訂單、銀行流水、運營商話費賬單等，是一個非常廣泛、通用的系統。對於這類系統，在過去十幾年發展中已經形成了經典的做法。但是隨著互聯網的發展，以及

大資料量的方案收集--AdMaster 如何駕馭百億級Key實時Redis 叢集

注：本文轉載自公眾號AdMaster 作為技術驅動的營銷資料公司，AdMaster每天處理超過100億的資料請求，每天對1000億資料進行上千種維度計算，每天增加超過5T資料量，為來自各行業的客戶提供7*24小時資料應用服務。在這樣領先的技術佈局下，無論是資料實時性還是資料安全，都能得到

七牛雲端儲存 qiniu 測試域名被回收檔案備份批量下載

Markdown版本筆記我的GitHub首頁我的部落格我的微信我的郵箱 MyAndroidBlogs baiqiantao bai

【HBase調優】Hbase萬億級儲存效能優化總結

背景：HBase主叢集在生產環境已穩定執行有1年半時間，最大的單表region數已達7200多個，每天新增入庫量就有百億條，對HBase的認識經歷了懵懂到熟的過程。為了應對業務資料的壓力，HBase入庫也由最初的單機多執行緒升級為有容災機制的分散式入庫，為及早發現叢集中的問題，還開發了一套對HBas

億級流量系統架構之如何支撐百億級資料的儲存與計算

“本文聊一下筆者幾年前所帶的團隊負責的多個專案中的其中一個，用這個專案來聊聊一個億級流量系統架構演進的過程。一、背景引入首先簡單介紹一下專案背景，公司對合作商家提供一個付費級產品，這個商業產品背後涉及到數百人的研發團隊協作開發，包括各種業務系統來提供很多強大的業務功能，同時在整個平臺

Java架構-億級流量系統架構之如何支撐百億級資料的儲存與計算

“本文聊一下筆者幾年前所帶的團隊負責的多個專案中的其中一個，用這個專案來聊聊一個億級流量系統架構演進的過程。一、背景引入首先簡單介紹一下專案背景，公司對合作商家提供一個付費級產品，這個商業產品背後涉及到數百人的研發團隊協作開發，包括各種業務系統來提供很多強大的業

億級資料多條件組合查詢——秒級響應解決方案

1 概述組合查詢為多條件組合查詢，在很多場景下都有使用。購物網站中通過勾選類別、價格、銷售量範圍等屬性來對所有的商品進行篩選，篩選出滿足客戶需要的商品，這是一種典型的組合查詢。在小資料量的情況下，後臺通過簡單的sql語句便能夠快速過濾出需要的資料，但隨著資料量

資料儲存方案--檔案儲存

mainActivity package com.example.filepersistencetest; import android.content.Context; import android.net.Uri; import android.support.v7.

百億級微信紅包的高併發資金交易系統設計方案

轉載自：http://www.infoq.com/cn/articles/2017hongbao-weixin 2017年1月28日，正月初一，微信公佈了使用者在除夕當天收發微信紅包的數量——142億個，而其收發峰值也已達到76萬每秒。百億級別的紅包，如何保障併發效能

微信支付興起，萬億級使用者交易記錄儲存的挑戰

背景：2013年8月，微信紅包上線。2014年春節微信紅包引爆社交支付。2015年春晚紅包搖一搖，推動微信紅包在全國迅速普及。此後，每逢節假日或特殊日子，人們都會自主的興起發紅包，使微信紅包成為熱點。微信紅包的火熱帶動微信支付的迅猛發展，按當時的發展速度預估，到2015年底，每天的微信支付交易記錄會達到

MongoDB億級檔案儲存方案測試

相關推薦