深入剖析 MongoDB 架構

阿新 • • 發佈：2020-10-20

近日，軟體工程師Ricky Ho的在他的部落格裡發表了一篇關於MongoDB架構（ MongoDB Architecture）的博文，雖然這是一個聽起來感覺很寬泛的話題，但是作者在文章中確實對MongoDB由內至外的架構進行了剖析。本文截取了其文章中的幾張重點架構示意圖進行簡要描述。

1、MongoDB資料檔案內部結構

MongoDB在資料儲存上按名稱空間來劃分，一個Collection是一個名稱空間，一個索引也是一個名稱空間。
同一個名稱空間的資料被分成很多個Extent，Extent之間使用雙向連結串列連線。
在每一個Extent中，儲存了具體每一行的資料，這些資料也是通過雙向連結來連線的。
每一行資料儲存空間不僅包括資料佔用空間，還可能包含一部分附加空間，這使得在資料Update變大後可以不移動位置。
索引以BTree結構實現。

2、在MongoDB中實現事務

眾所周知， MongoDB只支援對單行記錄的原子性修改，並不支援對多行資料的原子操作。但是通過上圖中的不可思議的操作步驟，實際上你也可以自己實現該事務。 其步驟如下：

第1步：先記錄一條事務記錄，將要修改的多行記錄的修改值寫到裡面，並設定其狀態為init（如果這時候操作中斷，那麼在重新啟動時，會判斷到它處於init狀態，從而將其儲存的多行修改操作應用到具體的行上）。
第2步：然後更新具體要修改的行，將剛才寫的事務記錄的標識寫到它的tran欄位中。
第3步：將事務記錄的狀態從init變成pending（如果在這時候操作中斷，那麼在重新啟動時，會判斷到它的狀態是pending，這時查看其所有對應的多條要修改的記錄，如果其tran值不為空，那麼就進行第4步；如果值為空，說明第4步已經執行過了，直接將其狀態從pending變成 commited就行）。
第4步：將需要修改的多條記錄的相應值加以修改，並且unset掉之前的tran欄位。
第5步：將事務記錄那一條的狀態從pending變成commited，事務至此完成。

其實上面的步驟並不罕見，在支援事務的DBMS中，其事務原子性提交的保證大多都與上面類似。而事務記錄的tran那條記錄，就類似於這些DBMS中的redolog。

3、MongoDB資料同步

MongoDB採用Replica Sets模式的同步流程

本流程可簡要描述如下：

紅色箭頭表示寫操作可以寫到Primary上，然後非同步同步到多個Secondary上。
藍色箭頭表示讀操作可以從Primary或Secondary任意一箇中讀取。
各個Primary與Secondary之間一直保持心跳同步檢測，用於判斷Replica Sets的狀態。

4、分片機制

MongoDB的分片是指定一個分片key來進行，資料按範圍分成不同的chunk，每個chunk的大小有限制。
有多個分片節點儲存這些chunk，每個節點儲存一部分的chunk。
每一個分片節點都是一個Replica Sets，這樣保證資料的安全性。
當一個chunk超過其限制的最大體積時，會分裂成兩個小的chunk。
當chunk在分片節點中分佈不均衡時，會引發chunk遷移操作。

5、伺服器角色

前面講了分片的機制，下面是具體在分片時幾種節點的角色：

客戶端訪問路由節點mongos來進行資料讀寫。
config伺服器儲存了兩個對映關係，一個是key值的區間對應哪一個chunk的對映關係，另一個是chunk存在哪一個分片節點的對映關係。
路由節點通過config伺服器獲取資料資訊，通過這些資訊，找到真正存放資料的分片節點進行對應操作。
路由節點還會在寫操作時判斷當前chunk是否超出限定大小。如果超出，就分列成兩個chunk。
對於按分片key進行的查詢和update操作來說，路由節點會查到具體的chunk然後再進行相關的工作。
對於不按分片key進行的查詢和update操作來說，mongos會對所有下屬節點發送請求然後再對返回結果進行合併。

轉載於:https://my.oschina.net/piorcn/blog/388807

深入剖析 MongoDB 架構

>>> 近日，軟體工程師Ricky Ho的在他的部落格裡發表了一篇關於MongoDB架構（ MongoDB Architecture）的博文，雖然這是一個聽起來感覺很寬泛的話題，但是作者在文章中確實對MongoDB由內至外的

深入剖析ReentrantLock公平鎖與非公平鎖原始碼實現

原文地址： blog.csdn.net/lsgqjh/arti… ReentrantLock是JUC包中重要的併發工具之一，支援中斷和超時、還支援嘗試機制獲取鎖，並且是一種通過程式設計控制的可重入鎖，儘可能減少死鎖問題。本文以公平與非公平鎖的

深入剖析Linux IO原理和幾種零拷貝機制的實現

前言零拷貝（Zero-copy）技術指在計算機執行操作時，CPU 不需要先將資料從一個記憶體區域複製到另一個記憶體區域，從而可以減少上下文切換以及 CPU 的拷貝時間。它的作用是在資料報從網路裝置到使用者程式空間傳遞的

深入理解Tomcat架構

Tomcat對於web開發人員來說再熟悉不過了，它是由Apache開發的一個免費開源的Web應用伺服器。在Web開發時，經常用它構建輕量級的Java Web服務。想要簡單的使用Tomcat是非常容易的，但是想要深入瞭解Tomcat體系必

深入理解MongoDB的複合索引

為什麼需要索引？當你抱怨MongoDB集合查詢效率低的時候，可能你就需要考慮使用索引了，為了方便後續介紹，先科普下MongoDB裡的索引機制（同樣適用於其他的資料庫比如mysql）。

從EFCore上下文的使用到深入剖析DI的生命週期最後實現自動屬性注入

故事背景最近在把自己的一個老專案從Framework遷移到.Net Core 3.0，資料訪問這塊選擇的是EFCore+Mysql。使用EF的話不可避免要和DbContext打交道，在Core中的常規用法一般是：建立一個XXXContext類繼承自DbContext，

深入瞭解MongoDB 分散式叢集

在分散式應用系統中，mongodb 已經成為 NoSQL 經典資料庫。要想很好的使用 mongodb，僅僅知道如何使用它是不夠的。只有對其架構原理等有了充分認識，才能在實際運用中使其更好地服務於應用，遇到問題知道怎麼處理，而

深入剖析java反射原理

Java高階之反射 Class類從java世界理解Class 問題一：類和物件的關係？答曰：類是抽象的概念，它是具有相同屬性和方法的一組物件集合，它代表著事物的模板；而物件是能夠真正“感覺的到、看得見，摸得著的”具

深入剖析Java中的裝箱和拆箱

請尊重作者勞動成果，轉載請標明原文連結： https://www.cnblogs.com/dolphin0520/p/3780005.html

.NET深入學習筆記(1)：DataSet和SqlDataReader效能差異深入剖析與測試(1)

宣告：這篇文章可能存在錯誤，我對於DataSet和SqlDataReader概念的理解有誤，當時主要是針對網路上一個面試的題目做出的，測試。我在核實資料後與驗證程式碼後會做出更新。

Java 併發程式設計系列（Ⅱ）：深入剖析volatile關鍵字

語義 volatile關鍵字是Java虛擬機器提供的最輕量級的同步機制，volatile修飾的變數具備兩個特性：

How tomcat works（深入剖析tomcat）閱讀筆記1-4章

How tomcat works chapter 1 簡單的web伺服器這一張的主要內容就是實現一個簡單的靜態資源伺服器，socket程式設計，利用java提供的socket和serverSocket程式設計

How tomcat works（深入剖析tomcat）生命週期Lifecycle

How Tomcat Works （6）生命週期Lifecycle 總體概述這一章講的是tomcat的元件之一，LifeCycle元件，通過這個元件可以統一管理其他元件，可以達到統一啟動/關閉元件的目的，那麼LifeCycle是如何實現看似如此神奇的功

How tomcat works（深入剖析tomcat）servlet容器

How tomcat works （5）servlet容器閱讀筆記第四章閱讀了tomcat預設聯結器的實現，當時connector中的使用的容器是自定義的容器，也是非常之簡單奧，一個人就幹完了所有的活，完成了初始化類載入器，載入servlet，呼

How tomcat works（深入剖析tomcat）（7） Logger

How tomcat works （7）日誌記錄器總體概述顧名思義，這一章將的是tomcat的日誌記錄器元件，比較簡單，tomcat提供了幾種型別不同的日誌記錄器，但是所有的日誌記錄器都需要實現Logger介面，Logger的定義如下

mybatis中的一級快取深入剖析

mybatis中提供有一級快取和二級快取，這裡記錄一下一級快取一級快取（mybatis中預設開啟）

深入剖析HashMap

前言很高興遇見你~ HashMap是一個非常重要的集合，日常使用也非常的頻繁，同時也是面試重點。本文並不打算講解基礎的使用api，而是深入HashMap的底層，講解關於HashMap的重點知識。需要讀者對散列表和HashMap有一定

深入剖析 Spring 框架的 BeanFactory

深入剖析 Spring 框架的 BeanFactory 說到Spring框架，人們往往大談特談一些似乎高逼格的東西，比如依賴注入，控制反轉，面向切面等等。但是卻忘記了最基本的一點，Spring的本質是一個bean工廠(beanFactory)或者說

ServletContainerInitializer深入剖析

ServletContainerInitializer深入剖析思考： ServletContainerInitizalizer是用來註冊那些動態生成的servlet、listener、filter或沒配置在web.xml裡或jar包下的servlet等嗎？

深入剖析MySQL innodb事務與MVCC實現原理

前言其實資料庫章節基本上的知識點我都寫過一遍了，包括這篇事務和MVCC的，但是國慶期間我翻閱資料的時候我發現之前寫的還差點意思，例子舉得也差點意思，那我就根據我自己最新的理解，加上之前的總結相

深入剖析 MongoDB 架構

相關推薦