記憶體管理七 SLUB分配器管理記憶體

阿新 • • 發佈：2018-11-16

一、概序

　　linux記憶體管理的基礎是：夥伴系統（buddy system），但夥伴系統是以頁為單位（4kB）管理和分配記憶體。現實

的需求是以位元組為單位，這樣基於Buddy系統分配最小的一個page會嚴重的浪費記憶體。slab分配器就是為了解決此問

題而出現，專為小記憶體分配而生。slab分配器分配記憶體以Byte為單位。但是slab分配器是基於夥伴系統分配的大記憶體

進一步細分成小記憶體分配，是在buddy系統上封裝了一層演算法實現此功能，後面會介紹slab分配的原理及方法。

　　另外當前都使用的SLUB分配器，SLUB分配器是基於SLAB分配做的優化，使得可以快速地進行物件的分配和回

收並減少記憶體碎片，發明SLUB分配器的主要目的就是減少slab緩衝區的個數，讓更多的空閒記憶體得到使用。

二、相關結構體

　　slub分配器來說，就是將這段連續記憶體平均分成若干大小相等的object（物件）進行管理。 slub把記憶體分組管理，

每個組分別包含2^3、2^4、...2^11個位元組，每個分組使用一個struct kmem_cache的結構體來描敘。

/*
 * Slab cache management.
 */
struct kmem_cache {
	struct kmem_cache_cpu __percpu *cpu_slab;

	int size;		/* The size of an object including meta data */
	int object_size;	/* The size of an object without meta data */
	int offset;		/* Free pointer offset. */

	struct list_head list;	/* List of slab caches */

	struct kmem_cache_node *node[MAX_NUMNODES];
};

cpu_slab：一個per cpu變數，對於每個cpu來說，相當於一個本地記憶體快取池；
size：分配給物件object的記憶體大小（可能大於物件的實際大小）；
object_size：實際的object size，就是建立kmem_cache時候傳遞進來的引數；
offset：存放空閒物件指標的位移；
list：系統有一個slab_caches連結串列，所有的slab都會掛入此連結串列；
node：為每個節點建立的 slab 資訊的資料結構，每個node都有一個struct kmem_cache_node資料結構。

/*
 * The slab lists for all objects.
 */
struct kmem_cache_node {
	spinlock_t list_lock;

#ifdef CONFIG_SLUB
	unsigned long nr_partial;
	struct list_head partial;
#ifdef CONFIG_SLUB_DEBUG
	atomic_long_t nr_slabs;
	atomic_long_t total_objects;
	struct list_head full;
#endif
#endif
};

list_lock：自旋鎖，保護資料；
nr_partial：slab節點中slab的數量；
partial：slab節點的slab partial連結串列，儲存部分使用的連結串列。

struct kmem_cache_cpu {
	void **freelist;	/* Pointer to next available object */
	unsigned long tid;	/* Globally unique transaction id */
	struct page *page;	/* The slab from which we are allocating */
	struct page *partial;	/* Partially allocated frozen slabs */
#ifdef CONFIG_SLUB_STATS
	unsigned stat[NR_SLUB_STAT_ITEMS];
#endif
};

freelist：指向下一個可用的object；
page：slab記憶體的page指標；
partial：本地slab partial連結串列，主要是一些部分使用object的slab。

　　struct kmem_cache *kmalloc_caches[12];

　　關於上面三個連結串列的關係通俗的理解可以參考文章slub演算法，每個陣列kmalloc_caches元素對應一種大小的記憶體，

可以把一個kmem_cache結構體看做是一個特定大小記憶體的零售商，整個slub系統中共有12個這樣的零售商，每個

“零售商”只“零售”特定大小的記憶體，例如：有的“零售商”只"零售"8Byte大小的記憶體，有的只”零售“16Byte大小的記憶體。

每個零售商(kmem_cache)有兩個“部門”，一個是“倉庫”：kmem_cache_node，一個“營業廳”：kmem_cache_cpu。

“營業廳”裡只保留一個slab，只有在營業廳(kmem_cache_cpu)中沒有空閒記憶體的情況下才會從倉庫中換出其他的slab。

三、SLUB分配及釋放介面

1、建立kmem_cache：

struct kmem_cache *kmem_cache_create(const char *name, 
                                     size_t size, size_t align,
                                     unsigned long flags, 
                                     void (*ctor)(void *))

name：kmem_cache的名稱；
size ：建立的slab管理物件的大小；
align：slab分配器分配記憶體的對齊位元組數(以align位元組對齊)；
flags：分配記憶體掩碼；
ctor ：分配物件的構造回撥函式。

2、kmem_cache_destroy和kmem_cache_create相反，銷燬建立的對應的slub的kmem_cache結構。

3、分配object的物件kmem_cache_alloc

void *kmem_cache_alloc(struct kmem_cache *s, gfp_t gfpflags)

struct kmem_cache *s：從指定的緩衝池s中分配物件；
gfpflags：分配掩碼；

4、kmem_cache_free是kmem_cache_alloc的反操作。

5、例程：

void slab_test(void)
{
    //create 16byte kmem_cache kmem_cache_16
    struct kmem_cache *kmem_cache_16 = kmem_cache_create("kmem_cache_16", 16, 8, ARCH_KMALLOC_FLAGS, NULL);

    //alloc buf points of 16 bytes of memory
    char *buf = kmeme_cache_alloc(kmem_cache_16, GFP_KERNEL);
 
    //release the memory after use
    kmem_cache_free(kmem_cache_16, buf);
 
    //release kmem_cache
    kmem_cache_destroy(kmem_cache_16);
}

四、SLUB分配原理

　　slub的分配原理可以從slub分配器的分配函式看起，kmem_cache_alloc -> slab_alloc -> slab_alloc_node ->

__slab_alloc -> ___slab_alloc ，其中整個分配的流程可以用如下圖清晰的說明。首先從cpu 本地快取池分配，如

果freelist不存在，就會轉向cpu partial分配，如果cpu partial也沒有可用物件，繼續檢視node partial，如果很不幸

也不沒有可用物件的話，就只能從夥伴系統分配一個slab：

五、Kmalloc：

　　核心中使用的kmalloc函式也是基於slub分配器做的封裝，按照記憶體塊的2^order大小來建立slab描敘符。分配

記憶體的大小可以為16B、32B、64B、128B......32Mb，其對應的分配介面為：kmalloc-16、kmalloc-32、kmalloc-64。

在系統啟動初期會呼叫create_kmalloc_caches ()建立多個管理不同大小物件的slab描敘符kmem_cache（包含16B、

32B、64B、128B......32Mb大小）。

static __always_inline void *kmalloc(size_t size, gfp_t flags)
{
	if (__builtin_constant_p(size)) {
		if (size > KMALLOC_MAX_CACHE_SIZE)
			return kmalloc_large(size, flags);
		if (!(flags & GFP_DMA)) {
			int index = kmalloc_index(size);

			if (!index)
				return ZERO_SIZE_PTR;

			return kmem_cache_alloc_trace(kmalloc_caches[index],
					flags, size);
		}
	}
	return __kmalloc(size, flags);
}

　　根據傳入的對應的size選擇對應的kmem_cahe，系統只能分配2^order大小的slab記憶體，如通過kmalloc(17,

GFP_KERNEL)申請記憶體，系統會從名稱“kmalloc-32”管理的slab快取池中分配一個物件。即使浪費了15Byte：

static __always_inline int kmalloc_index(size_t size)
{
	if (!size)
		return 0;

	if (size <= KMALLOC_MIN_SIZE)
		return KMALLOC_SHIFT_LOW;

	if (KMALLOC_MIN_SIZE <= 32 && size > 64 && size <= 96)
		return 1;
	if (KMALLOC_MIN_SIZE <= 64 && size > 128 && size <= 192)
		return 2;
	if (size <=          8) return 3;
	if (size <=         16) return 4;
	if (size <=         32) return 5;
    ......
	if (size <=  32 * 1024 * 1024) return 25;
	if (size <=  64 * 1024 * 1024) return 26;
	BUG();

	/* Will never be reached. Needed because the compiler may complain */
	return -1;
}

參考博文：

http://www.wowotech.net/memory_management/426.html

https://www.ibm.com/developerworks/cn/linux/l-cn-slub/

https://blog.csdn.net/lukuen/article/details/6935068

作者：frank_zyp
您的支援是對博主最大的鼓勵，感謝您的認真閱讀。
本文無所謂版權，歡迎轉載。

記憶體管理七 SLUB分配器管理記憶體

一、概序　　linux記憶體管理的基礎是：夥伴系統（buddy system），但夥伴系統是以頁為單位（4kB）管理和分配記憶體。現實的需求是以位元組為單位，這樣基於Buddy系統分配最小的一個page會嚴重的浪費記憶體。slab分配器就是為了解決此問題而出現，專為小記憶體分配而生

【原創】（十一）Linux記憶體管理slub分配器

背景 Read the fucking source code! --By 魯迅 A picture is worth a thousand words. --By 高爾基說明： Kernel版本：4.14 ARM64處理器，Contex-A53，雙核使用工具：Source Insight 3.5，

Linux分頁機制之分頁機制的演變--Linux記憶體管理(七)

1 頁式管理 1.1 分段機制存在的問題分段，是指將程式所需要的記憶體空間大小的虛擬空間，通過對映機制對映到某個實體地址空間(對映的操作由硬體完成)。分段對映機制解決了之前作業系統存在的兩個問題：地址空間沒有隔離程式執行的地址不確定不過分段方法存在一個嚴重的問題：記憶體的使用效率

Nginx學習之路（七）NginX中的記憶體管理之---Nginx中的記憶體池

上一篇文章說到了Nginx中的記憶體對齊機制和記憶體分頁機制，今天就來說下Nginx中的記憶體池，記憶體池是一個使用非常廣泛的技術，在web伺服器的高併發情況下可能存在平凡的malloc()和free()過程，通過記憶體池的方式可以將這一過程的開銷極大程度的減少，Nginx的

記憶體管理六夥伴系統管理記憶體

一、夥伴系統概序 1、夥伴演算法的原理　　為了便於頁面的維護，核心將多個頁面組成記憶體塊，每個記憶體塊都有 2^order個頁(page)。order相同的記憶體塊被組織到一個空閒連結串列中。夥伴系統基於2的方冪來申請釋放記憶體頁。　　當申請記憶體頁時，夥伴系統首先檢查與申請大小相同的記

自動記憶體管理機制（4）- 記憶體分配和回收策略

自動記憶體管理機制（4）- 記憶體分配和回收策略 Java所承諾的自動記憶體管理主要是針對物件記憶體的回收和物件記憶體的分配。在Java虛擬機器的五塊記憶體空間中，程式計數器、Java虛擬機器棧、本地方法棧記憶體的分配和回收都具有確定性，一般在編譯階段就能確定需要分配的記憶體大小，

自動記憶體管理機制（2）- 記憶體回收和垃圾收集演算法

自動記憶體管理機制（2）- 記憶體回收和垃圾收集演算法 1. 概述首先思考三個問題：哪些記憶體需要回收什麼時候回收如何回收程式計數器、虛擬機器棧、本地方法棧是執行緒私有的，因此這幾個區域的記憶體分配和回收都具有確定性（執行緒結束時執行垃圾回

啟動期間的記憶體管理之bootmem_init初始化記憶體管理–Linux記憶體管理(十二)

1. 啟動過程中的記憶體初始化首先我們來看看start_kernel是如何初始化系統的, start_kerne定義在init/main.c?v=4.7, line 479 其程式碼很複雜, 我們只截取出其中與記憶體管理初始化相關的部分, 如下所示 table th:nth-of-type(1){

C++之記憶體管理——在堆中申請100個char型別的記憶體，拷貝Hello world字串到分配的堆中的記憶體中,列印字串,最後釋放記憶體。

首先先看一下簡單的案例程式碼如下 #include<iostream> using namespace std; int main() { //整數1 int *x = new int; if(NULL==x) { return 0;

Nginx學習之路（六）NginX中的記憶體管理之---Nginx中的記憶體對齊和記憶體分頁

Nginx由於極高的效能受到大家的追捧，而Nginx的高效能與它優秀的記憶體管理方式是分不開的，今天就來聊一聊Nginx中的記憶體對齊和記憶體分頁。先說下Nginx中的記憶體對齊，Nginx中的記憶體對齊機制是它高效能的關鍵因素之一，先說點基礎的東西，什麼是記憶體對齊呢？記

關於websphere（was）部署war包時管理控制檯卡死，記憶體溢位的問題

1.問題描述將一個在tomcat上執行正常的專案放到websphere中，通過war包的方式進行部署，使用was的dmgr管理臺進行上傳war時，會在上傳介面卡死，找了好久也沒有找到問題的所在，最後在，發現了該問題是was的dmgr記憶體溢位。 2.解決問題 2.1判

記憶體管理第一談：段式管理和頁式管理

對於記憶體管理這個作業系統中龐大的體系，實在是容易讓人望而止步，市面上介紹這塊知識的書籍其實很多，但是由於書面語言的緣故，總感覺有些東西晦澀難懂，先後看過的書籍有《作業系統基本原理》、《linux核心完全註釋》、《深入理解linux核心》、《linux核心原始碼情景分析》

linux核心虛擬記憶體之slub分配器

上一章主要講述以頁為最小單位進行記憶體分配的夥伴管理演算法，較大程度上避免了記憶體碎片問題。而實際上對記憶體的申請卻不是每次都申請一個頁面的（比如檔案節點，任務描述符等結構體記憶體），通常是遠小於一個記憶體頁面的大小，此外更可能會頻繁地申請釋放這些記憶體。對於這種情況，每次

作業系統--記憶體管理之連續分配管理方式

連續分配方式，是指為一個使用者程式分配一個連續的記憶體空間。它主要包括單一連續分配、固定分割槽分配和動態分割槽分配。 1單一連續分配記憶體在此方式下分為系統區和使用者區，系統區僅提供給作業系統使用，通常在低地址部分；使用者區是為使用者提供的、除系統區之外的記憶體空間。這

linux記憶體管理之夥伴系統管理

【摘要】本文主要介紹linux系統中，夥伴管理系統是如何處理記憶體頁的.【正文】夥伴系統基本資訊1 夥伴系統由來：linux核心支援申請連續的記憶體頁，但由於記憶體碎片化，可能出現空閒記憶體足夠，但連續頁不足的情況,如此引入夥伴系統，在申請和釋放記憶體過程，儘量保持頁的連續

android 記憶體基本原理和機制管理

java語言相對於c/c++語言來說人性化的一點就是java有專門管理回收的垃圾回收器。而c/c++語言只能是“誰造成，誰處理”。 GC 1，GC是垃圾收集的意思（Gabage Collection） 2，Java提供的GC功能可以自動監測物件是否超過

【C++】記憶體對齊和簡單的記憶體管理

記憶體管理自己申請一個記憶體塊，用來存放構造的資料，使用placement new在記憶體上構造資料。示例： //待操作的資料 struct Data { Data(int _a

記憶體管理（三）tcmalloc1 記憶體分配及原始碼剖析

本來打算花一天時間看看tcmalloc就算結束了。但是在網上找部落格的時候發現，100個人有101鐘不同的解釋，完全沒有公論。一怒之下，剖原始碼！ tcmalloc是對ptmalloc的升級版。和ptmalloc相比，tcmalloc對於小塊記憶體

計算機原理學習（6）-- x86-32 CPU和記憶體管理之分頁管理

前言上一篇我們瞭解了x86-16 CPU計算機的記憶體訪問方式，定址方式，以及基於MS-DOS的應用程式的記憶體佈局。這一篇會主要介紹32位處理器的記憶體訪問，記憶體管理以及應用程式的記憶體佈局。雖然目前64位CPU已經非常普及了，不過相對於32位的記憶體管理方式並沒

記憶體管理之連續分配管理方式

連續分配管理方式連續分配方式是指為一個使用者程式分配一個連續的記憶體空間。通俗地說，就是給記憶體劃格子（格子中都是一個程序，和非連續分配管理方式相對）。（1）單一連續分配將記憶體分為系統區和使用者區，記憶體中永遠只有一道程式——已經成為歷史（2）固定分割

記憶體管理七 SLUB分配器管理記憶體

相關推薦