memcached的一些研究（關於memcached的記憶體分配機制）

阿新 • • 發佈：2019-02-01

memcached作為快取已被應用的非常多，memcached的資料結構非常簡單，就是key-value的儲存，瞭解下memcached的記憶體分配機制有助於更好的使用memcache

memcached相關的記憶體術語

chunk：資料是儲存在稱為chunk的記憶體空間裡的
page：已有快取空間滿了以後，每次會申請一個page（預設一個page為1M），page包含成多個記憶體大小相等的chunk
slab class：slab有很多相同的chunk，slab是根據具體的快取情況決定大小的；每次申請的page都在slab下；
具體的模型類似下圖：

記憶體分配機制

memcached的記憶體分配機制決定了memcached的優缺點，比如不適合儲存比較大的資料，對小資料儲存非常快

memcached記憶體採用slab allocator機制

那什麼是slab allocator？（以啟動配置為：增長因子為2，page大小為1M）

memcached能管理的記憶體通過引數 -m 100m來設定（這裡指定了100M）
memcached根據page大小，來對slab進行分配，在page大小為1M，增長因子為2的情況下，分配slab為：第一個slab的chunk大小為96B（預設以96B開始），第二個slab的chunk大小為192B（96B*2），以此類推，一直到1M大小（你會發現最後一個跟最後第二個的大小不是呈現*2的規律，這個在後文再解釋），所有slab的個數是由page大小和增長因子決定的

執行 memcached -f 2 -vv的結果：

slab class   1: chunk size        96 perslab   10922
slab class   2: chunk size       192 perslab    5461
slab class   3: chunk size       384 perslab    2730
slab class   4: chunk size       768 perslab    1365
slab class   5: chunk size      1536 perslab     682
slab class 
   6: chunk size      3072 perslab     341
slab class   7: chunk size      6144 perslab     170
slab class   8: chunk size     12288 perslab      85
slab class   9: chunk size     24576 perslab      42
slab class  10: chunk size     49152 perslab      21
slab class  11: chunk size     98304 perslab      10
slab class  12: chunk size    196608 perslab       5
slab class  13: chunk size    393216 perslab       2
slab class  14: chunk size   1048576 perslab       1
....

一共分配了14個slab class，最後一個和倒數第二個並不呈現增長因子的規律

可以看到在啟動的時候，這14個slab class都分配到最接近1M大小的記憶體，這裡並不是完整的1M，只有slab class 14是1M；
那資料如何選擇儲存在哪個slab class下的chunk中呢？答案是能儲存下需要儲存資料大小的最小的slab class的chunk中；舉個栗子：有slab class 1（96B），slab class 2（192B），slab class 3（384B），….；那麼94B的資料就儲存在slab class 1，98B的資料需要儲存在slab class 2中，換句話說就是：slab class 1儲存0~96B的資料，slab class 2儲存97B~192B的資料，slab class 3儲存193B~384B的資料，以此類推；這樣就會發現，極端情況下會有將近50%的儲存空間浪費（slab class 1都儲存小於1B的資料，slab class 2都儲存97B的資料,……）;但真實情況不會有這麼多，但肯定是會有空間浪費的，因為不會出現另一個極端（slab class 1都儲存小於96B的資料，slab class 2都儲存192B的資料,……）；所以這裡就是一個調優的點了，需要根據實際應用中需要快取的資料大小分佈來進行增長因子的調整；(合理設定增長因子能夠減少記憶體的浪費)
當slab class中的chunk分配完了，那怎麼辦？這裡分2中情況
- memcached管理的記憶體還有超過1個page的大小可以分配，那麼就分配一個page給slab class，繼續儲存資料
- 如果沒有足夠記憶體繼續分配了，預設情況下采用LRU（latest recent use）演算法進行快取失效；也可以配置成FIFO（first in first out）演算法；也可以配置成不進行快取失效，這樣就儲存不了資料了，memcached返回儲存失敗
memcached在set的時候需要設定快取失效時間，但快取時間到了，memcached並不會把資料給抹掉，只是在get的時候去檢測快取是否失效，這種失效機制成為lazy expire，這種做法去掉了系統監視快取失效的開銷，大大提高了效能

一些細節問題

為什麼memcached分配記憶體的時候，需要用多少分配多少呢？

如果這樣做，那就是實時進行記憶體分配了，那麼很多的開銷都花在了記憶體的分配及回收上了，效能就會大打折扣；預先分配可以減免這方面的開銷；其實這就是典型的以空間換取時間的做法
經常有人問，為什麼我往memcached儲存超過1M

因為memcached預設的page大小剛好為1M，而chunk是由page（即1M大小分拆成n個chunk，最大的chunk也就是1M），而資料儲存在chunk中，當然儲存不了超過1M的資料；如果非得儲存超過1M的資料，那麼只能去修改page的大小了，具體怎麼修改，網上應該有很多；memcached非常適合儲存資料比較小的快取，當資料比較大的時候，如儲存的資料都解決page的大小的情況下，會進行頻繁的記憶體分配操作，效能就會降下來
上面提到的一個問題：為什麼最後一個slab class的chunk大小為1M，而最後第二個slab不是512K呢？

memcached為了保證能儲存的最大的資料剛好為一個page（這裡是1M）的大小，在分配演算法上做了處理，就是當倒數第二個slab class的chunk大小乘以增長因子不到1M，而倒數第二個slab class的chunk大小乘以增長因子再乘以增長因子超過1M，那麼直接就分配最後一個為1M的slab；
細心的同學可能會發現，增長因子設定以後，slab class的chunk記憶體空間增長並不是按照前一個slab class的chunk乘以增長因子的

對於這個問題沒有去研究；在這裡根據實驗表現來推測：

如果設定增長因子為1.0104，總共有63個slab class，且最後一個slab class的chunk大小為1M，其他均為96B；

如果增長因子設定為1.0105，也是有63個slab class，最後一個為slab class的chunk大小為1M，其他為遞增的方式，第一個為96B，第二個未104B，第三個為112B；

如果增長因子設定為1.084，也是有63個slab class，最後一個為slab class的chunk大小為1M，其他為遞增的方式，第一個為96B，第二個未104B，第三個為112B；

如果增長因子設定為1.1，也是有63個slab class，最後一個為slab class的chunk大小為1M，其他為遞增的方式，第一個為96B，第二個未112B，第三個為112B；

發現規律過程：96B乘以1.0104=96.9984；96B乘以1.0105=97.008；96B乘以1.084=104.064；96B乘以1.1=105.6；可以看出memcached最多有63個slab class；另外推測，如果當前chunk大小乘以增長因子的整數部分跟當前chunk相等，那麼將當前slab class的chunk大小設定為下一個slab class的chunk大小，直到最後一個slab class（第63個），這種情況也就是在第一個slab class的chunk大小乘以增長因子小於97B的時候會發生；再看增長因子為1.0105的時候，第二個slab class的chunk大小為104，增長因子為1.084的時候，第二個slab class的chunk大小為104，增長因子為1.1的時候，第二個slab class的chunk大小為112，這裡可以發現另外一個規律：增長每次都是按照至少8B的跨度進行增長的；

具體為什麼這樣設計，我也不清楚；上面的結論也是靠猜的，具體的還是需要檢視memcached的原始碼，看看到底是如何分配記憶體的；

其他

關於memcached如何儲存key的，為什麼效能能如此之高，號稱set和get操作的時間複雜度都是O(1)，這個非常值得研究，後續會繼續研究memcached的set、get等操作為何會如此之快，等研究完再進行分享

memcached的一些研究（關於memcached的記憶體分配機制）

memcached作為快取已被應用的非常多，memcached的資料結構非常簡單，就是key-value的儲存，瞭解下memcached的記憶體分配機制有助於更好的使用memcache memcached相關的記憶體術語 chunk：資料是儲存

筆記二（自動記憶體管理機制）-Java記憶體區域與記憶體溢位異常

1 執行時資料區域 Java虛擬機器在執行Java程式的過程中會把它所管理的記憶體劃分為若干個不同的資料區域。這些區域都有各自的用途，以及建立和銷燬的時間，有的區域隨著虛擬機器程序的啟動而存在，有些區域則是依賴使用者執行緒的啟動和結束而建立和銷燬。1.1 程式計數器

Memcached（記憶體模型、記憶體回收機制）

memcached記憶體模型基本概念page/slab/chunk Chunk屬於slab，在一個slab裡面有多個chunk Slab裡面也有多個page。 1slab class（slab分類） = n slab 1page=1slab = n chunk(統一長度)

Java虛擬機器筆記-1（Java技術體系&自動記憶體管理機制&記憶體區域與記憶體溢位&垃圾收集器與記憶體分配策略）

世界上沒有完美的程式，但寫程式是不斷追求完美的過程。 Devices（裝置、裝置）、GlassFish（商業相容應用伺服器）目錄 1. Java技術體系包括： Java技術體系的4個平臺虛擬機器分類 HotSpot VM 模組化、混合程式設計多核並行

Handler消息機制的一些原理（直接用code講解）——Android開發

over blog 線程控件 android 開發處理發送消息關聯 package com.example.handlertest; import android.os.Bundle; import android.os.Handler; import a

記憶體探尋1之——值型別和引用型別的記憶體分配機制

String物件和值型別的記憶體分配機制：同樣由前延伸，上上篇《由String型別分析，所產生的對引數傳遞之惑的解答》中，最後提及，如果將引用型別的按值傳遞和按引用傳遞，用託管堆表

【6】C++進階系列（動態記憶體分配）

問題：之前在寫程式的時候計劃好我們需要哪些資料，都定義好，但是有些時候我們並不知道我要處理的程式規模有多大，也不知道陣列開多大合適，是儘量大？分配了太大空間可能會造成記憶體的浪費。只有在程式真正執行起來才會知道這次執行要處理的資料規模有多大——那就有人想，能不能用變數來確定陣

malloc動態記憶體分配機制原理_及_linux/proc/介紹

程序系統資源的使用原理大部分程序通過glibc申請使用記憶體，但是glibc也是一個應用程式庫，它最終也是要呼叫作業系統的記憶體管理介面來使用記憶體。大部分情況下，glibc對使用者和作業系統是透

C\C++和Java 的區別（特別是在記憶體分配方面）

前言：今天當被問到有關C與Java之間在記憶體管理方面的不同是什麼時，瞬間 T_T__，所以特意集眾人之解，存入自己的學習筆記中，加以學習和鞏固。 --------------------------------------------------------------

Memcached客戶端（memcached-Java-client）與 Spring整合（單伺服器）

Memcached客戶端與Spring整合，客戶端使用的是Memcached-Java-Client-release_2.6.3 1. 配置Maven  <dependency> <g

作業系統: 最佳適配演算法和鄰近適配演算法的模擬實現（記憶體分配演算法）

實現動態分割槽的分配演算法。 (1) 最佳適配演算法：選擇記憶體空閒塊中最適合程序大小的塊分配。 (2) 鄰近適配演算法：從上一次分配的地址開始查詢符合要求的塊，所查詢到的第一個滿足要求的空閒塊就分配給程序。模擬新增程序的時候，假定記憶體是一塊完整的空閒區，對於演算法(1

python記憶體分配機制

python中數值型別是不可變物件，當程式試圖改變資料的值時，程式會重新生成新的資料，而不是改變原來的資料。 python函式的引數都是物件的引用，如果在引用不可變物件時嘗試修改物件，程式會在函式中生

Java記憶體分配機制

Java存放物件、變數等資訊需要分配記憶體進行儲存，分配及儲存區原理如下： 1.暫存器它是唯一位域處理器內部的儲存區。所以它是最快的，數量也是極其有限的，並且和 C，C++不一樣的是，Java暫存器是根據程式需求進行分配的，你不能控制、也不能向它“建議“分配方式。在 java 中暫存器對於程式設計

Java虛擬機器記憶體分配機制與啟動引數說明

-Xms ：表示java虛擬機器堆區記憶體初始記憶體分配的大小，通常為作業系統可用記憶體的1/64大小即可，但仍需按照實際情況進行分配。-Xmx：表示java虛擬機器堆區記憶體可被分配的最大上限，通常為作業系統可用記憶體的1/4大小。但是開發過程中，通常會將 -Xms 與 -Xmx兩個引數的配置相同的值，其

STL中vector的記憶體分配機制

一些好的公司校園招聘過程中（包括筆試、面試環節），經常會涉及到STL中vector的使用（主要是筆試）及其效能（面試）的分析。今天看了下相關文章，也寫了幾個小的測試程式跑了跑。算是總結下，希望對需要的人有幫助。關於vector，簡單地講就是一個動態陣列，裡面有一個指標

Java的記憶體分配機制(初步整理)

Java程式是執行在Java虛擬機器(Java Virtual Machine，JVM)上的，可以把JVM理解為Java程式和作業系統之間的橋樑，JVM實現了Java的跨平臺，Java記憶體分配原理一切都是在JVM中進行的，JVM是記憶體分配原理的基礎與前提。

.NET下的記憶體分配機制

對於任何物件的產生，都伴隨著記憶體空間的分配，那麼本文將初步介紹一下.NET下，是如何進行記憶體分配的。 1.概述 CLR支援兩種基本型別：值型別和引用型別。因此，還是把MSDN這張經典檢視拿出來做個鋪墊。關於具體每種分類都有哪些型別，

關於可持久化線段樹的一些研究（連結串列實現）

本人蒟蒻一隻……近日終於弄懂了可持久化線段樹的一些東西……寫下來分享一下=w= 首先要談可持久化線段樹，你肯定得懂線段樹吧。這裡就不提線段樹了……可持久化線段樹是什麼東西呢？就是對線段樹的葉子節點做m次修改，同時做n次詢問，但這些詢問會問你的東西是做了第i次

Java記憶體分配機制詳解

文章轉載自：http://www.cnblogs.com/zhguang/p/3257367.html 本文僅載抄了部分內容，若想知道JVM記憶體全量資訊，請檢視原文 Java記憶體分配機制這裡所說的記憶體分配，主要指的是在堆上的分配，一般的，物件的記憶體分配都是在堆

筆記三（垃圾收集器與記憶體分配策略）

1 物件已死？堆中幾乎存放著Java世界中所有的物件例項，垃圾收集器在對堆進行回收前，第一件事情就是要確定這些物件哪些還“存活”著，哪些以及“死去”（即不可能再被任何途徑使用的物件）。1-1 引用計數演算法目的：判斷物件是否存活方法：給物件中新增一個引用計數器

memcached的一些研究（關於memcached的記憶體分配機制）

memcached相關的記憶體術語

記憶體分配機制

memcached記憶體採用slab allocator機制

一些細節問題

其他

相關推薦