1. 程式人生 > >c++的map,set記憶體結構

c++的map,set記憶體結構

  1)Set是一種關聯容器,它用於儲存資料,並且能從一個數據集合中取出資料。它的每個元素的值必須唯一,而且系統會根據該值來自動將資料排序。每個元素的值不能直接被改變。【重點】內部結構採用紅黑樹的平衡二叉樹。multiset 跟set 類似,唯一的區別是允許鍵值重複!!!

如: 為何map和set的插入刪除效率比用其他序列容器高?

       為何每次insert之後,以前儲存的iterator不會失效?

       為何map和set不能像vector一樣有個reserve函式來預分配資料?

        當資料元素增多時(10000到20000個比較),map和set的插入和搜尋速度變化如何?

或許有得人能回答出來大概原因,但要徹底明白,還需要了解STL的底層資料結構。 C++ STL 之所以得到廣泛的讚譽,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封裝了許多複雜的資料結構演算法和大量常用資料結構操作。vector封裝陣列,list封裝了連結串列,map和 set封裝了二叉樹,在封裝這些資料結構的時候,STL按照程式設計師的使用習慣,以成員函式方式提供的常用操作,如:插入、排序、刪除、查詢等。讓使用者在 STL使用過程中,並不會感到陌生。 C++ STL中標準關聯容器set, multiset, map, multimap內部採用的就是一種非常高效的平衡檢索二叉樹:紅黑樹,也成為RB樹(Red-Black Tree)。RB樹的統計效能要好於一般的平衡二叉樹(有些書籍根據作者姓名,Adelson-Velskii和Landis,將其稱為AVL-樹),所以被STL選擇作為了關聯容器的內部結構。本文並不會介紹詳細AVL樹和RB樹的實現以及他們的優劣,關於RB樹的詳細實現參看紅黑樹: 理論與實現(理論篇)。本文針對開始提出的幾個問題的回答,來向大家簡單介紹map和set的底層資料結構。

為何map和set的插入刪除效率比用其他序列容器高? 大部分人說,很簡單,因為對於關聯容器來說,不需要做記憶體拷貝和記憶體移動。說對了,確實如此。map和set容器內所有元素都是以節點的方式來儲存,其節點結構和連結串列差不多,指向父節點和子節點。

結構圖可能如下:

     A

    /  /

  B    C

 / /   / /

D  E F  G

因此插入的時候只需要稍做變換,把節點的指標指向新的節點就可以了。刪除的時候類似,稍做變換後把指向刪除節點的指標指向其他節點就OK了。這裡的一切操作就是指標換來換去,和記憶體移動沒有關係。 為何每次insert之後,以前儲存的iterator不會失效? 看見了上面答案的解釋,你應該已經可以很容易解釋這個問題。iterator這裡就相當於指向節點的指標,記憶體沒有變,指向記憶體的指標怎麼會失效呢

(當然 被刪除的那個元素本身已經失效了)。相對於vector來說,每一次刪除和插入,指標都有可能失效,呼叫push_back在尾部插入也是如此。因為為了 保證內部資料的連續存放,iterator指向的那塊記憶體在刪除和插入過程中可能已經被其他記憶體覆蓋或者記憶體已經被釋放了。即使時push_back的時 候,容器內部空間可能不夠,需要一塊新的更大的記憶體,只有把以前的記憶體釋放,申請新的更大的記憶體,複製已有的資料元素到新的記憶體,最後把需要插入的元素放 到最後,那麼以前的記憶體指標自然就不可用了。特別時在和find等演算法在一起使用的時候,牢記這個原則:不要使用過期的iterator。 為何map和set不能像vector一樣有個reserve函式來預分配資料? 我以前也這麼問,究其原理來說時,引起它的原因在於在map和set內部儲存的已經不是元素本身了,而是包含元素的節點。也就是說map內部使用的Alloc並不是map宣告的時候從引數中傳入的Alloc。例如: map, Alloc > intmap; 這時候在intmap中使用的allocator並不是Alloc, 而是通過了轉換的Alloc,具體轉換的方法時在內部通過Alloc::rebind重新定義了新的節點分配器,詳細的實現參看徹底學習STL中的Allocator。其實你就記住一點,在map和set內面的分配器已經發生了變化,reserve方法你就不要奢望了。 當資料元素增多時(10000和20000個比較),map和set的插入和搜尋速度變化如何? 如果你知道log2的關係你應該就徹底瞭解這個答案在map和set中查詢是使用二分查詢,也就是說,如果有16個元素,最多需要比較4次就能找到結 果,有32個元素,最多比較5次。那麼有10000個呢?最多比較的次數為log10000,最多為14次,如果是20000個元素呢?最多不過15次。 看見了吧,當資料量增大一倍的時候,搜尋次數只不過多了1次,多了1/14的搜尋時間而已。你明白這個道理後,就可以安心往裡面放入元素了。 最後,對於map和set Winter還要提的就是它們和一個c語言包裝庫的效率比較。在許多unix和linux平臺下,都有一個庫叫isc,裡面就提供類似於以下宣告的函式: void tree_init(void **tree); void *tree_srch(void **tree, int (*compare)(), void *data); void tree_add(void **tree, int (*compare)(), void *data, void (*del_uar)()); int tree_delete(void **tree, int (*compare)(), void *data,void (*del_uar)()); int tree_trav(void **tree, int (*trav_uar)()); void tree_mung(void **tree, void (*del_uar)()); 許多人認為直接使用這些函式會比STL map速度快,因為STL map中使用了許多模板什麼的。其實不然,它們的區別並不在於演算法,而在於記憶體碎片。如果直接使用這些函式,你需要自己去new一些節點,當節點特別多, 而且進行頻繁的刪除和插入的時候,記憶體碎片就會存在,而STL採用自己的Allocator分配記憶體,以記憶體池的方式來管理這些記憶體,會大大減少記憶體碎 片,從而會提升系統的整體效能。Winter在自己的系統中做過測試,把以前所有直接用isc函式的程式碼替換成map,程式速度基本一致。當時間執行很長 時間後(例如後臺服務程式),map的優勢就會體現出來。從另外一個方面講,使用map會大大降低你的編碼難度,同時增加程式的可讀性。何樂而不為?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82

相關推薦

c++的mapset記憶體結構

  1)Set是一種關聯容器,它用於儲存資料,並且能從一個數據集合中取出資料。它的每個元素的值必須唯一,而且系統會根據該值來自動將資料排序。每個元素的值不能直接被改變。【重點】內部結構採用紅黑樹的平衡二叉樹。multiset 跟set 類似,唯一的區別是允許鍵值重

【轉】Java學習---Java核心數據結構(ListMapSet)使用技巧與優化

系統資源 .get 兩種 這樣的 his java學習 com 都是 索引 【原文】https://www.toutiao.com/i6594587397101453827/ Java核心數據結構(List,Map,Set)使用技巧與優化 JDK提供了一組主要的數據結構實現

c/c++ vectormapset智能指針綜合運用的小例子

++ 當前 註意 har 必須 aix iostream 文件中 == 標準庫,智能指針,綜合運用的小例子 功能說明:查詢單詞在文件中出現的次數,如果在同一行出現多次,只算一次。 比如查詢單詞:你好 輸出的結果: 你好 出現了:2次 (行號 2)xxxxxxx 你好 (行號

c++中STL 關於mapsetvector的用法

  一、vector vector相當於是一個可以存放一個任意資料型別的一個容器,通過迭代器可以對其進行相應的操作,如下:   1 vector<CString> arrTest; 2 arrTest.push_back(L"你"); 3 arr

簡述listvectormapset四中STL的資料結構的區別和各自特點

    向量 相當於一個數組     在記憶體中分配一塊連續的記憶體空間進行儲存。支援不指定vector大小的儲存。STL內部實現時,首先分配一個非常大的記憶體空間預備進行儲存,即capacituy()函式返回的大小,當超過此分配的空間時再整體重新放分配一塊記憶體儲存,這給人以vector可以不指定vect

C++ mapset中的結構

哇,好久沒來寫部落格了。 今天是發現了一個新大陸。 是這樣的,我想隨機生成一些整數對(x,y),然後需要判斷一個數對在之前有沒生成過。直觀的做法是弄一個bool型的二維陣列,但是這樣太耗費空間了,容易造成浪費。於是我想把每個整數對放在一個結構體裡,然後將結構體作為map的k

es6 MapSet 和 WeakMapWeakSet

mage span 移除 種類 安全 時有 簡單 weak 方便 這些是新加的集合類型,提供了更加方便的獲取屬性值的方法,不用像以前一樣用hasOwnProperty來檢查某個屬性是屬於原型鏈上的呢還是當前對象的。同時,在進行屬性值添加與獲取時有專門的get,set 方法。

listmapset集合的基本用法及差異

nbsp htable body 根據 pos null clas 速度 就是 List:1.可以允許重復的對象。    2.可以插入多個null元素。 3.是一個有序容器,保持了每個元素的插入順序,輸出的順序就是插入的順序。 4.常用的實

c# getset設置默認值

ret public return clas code 默認 pan turn rtu public virtual string SplitPlateType { get {

ListMapSet存取元素的特點

List與Set都是單列元素的集合,它們有一個功共同的父介面Collection。 Set裡面不允許有重複的元素, 存元素:add方法有一個boolean的返回值,當集合中沒有某個元素,此時add方法可成功加入該元素時,則返回true;當集合含有與某個元素equals相等的元素時,此

java中三大集合類MapSetList的詳細介紹

在講Map,Set,List三大介面之前,我們先來了解下Set和List的父類介面Collection介面 一:Collection介面:是java.util包下的一個介面: 其中有一些主要的方法: size(); isEmpty(); clear(); c

STL中常用的vectormapsetsort 用法

1. push_back()   在陣列的最後新增一個數據 2. pop_back()    去掉陣列的最後一個數據 3. at()               得到編號位置的資料 4. begin()           得到陣列頭的指標 5. end()             得

STL 中常用的 vectormapsetsort 用法

STL中的常用的vector,map,set,sort,pair用法 C++的標準模板庫(Standard Template Library,簡稱STL)是一個容器和演算法的類庫。容器往往包

c++ map 使用自定義結構做關鍵字

map在STL中的定義 template <class Key, class T, class Compare = less<Key>, class Alloc = alloc>  第一個引數Key是關鍵字型別 第二個引數T是值型別 第三個引數Com

在spring 中如何注入mapsetlistproperty等引數

package cn.dao;   publicinterface PersonDao {       publicabstractvoid add();   }   cn.dao.imp package cn.d

Java集合框架ListMapSet Queue介紹

Java Collections Framework是Java提供的對集合進行定義,操作,和管理的包含一組介面,類的體系結構。 Collection介面     Collection是最基本的集合介面,一個Collection代表一組Object的集合,這些Objec

C++mapset的簡單理解和使用案例

Map是STL的一個關聯容器,它提供一對一(其中第一個可以稱為關鍵字,每個關鍵字只能在map中出現一次,第二個可能稱為該關鍵字的值)的資料 處理能力,由於這個特性,它完成有可能在我們處理一對一資料的時候,在程式設計上提供快速通道。map內部自建一顆紅黑樹(一 種非嚴格意義上

spring xml 檔案的一些寫法包括map set list 等

To switch over from the DTD-style to the new XML Schema-style, you need to make the following change. <?xml version="1.0" enc

spring設定構造namerefmapsetlist賦值

、先建立一個例項類Person public class Person { private int id; private String name; private int age; private Person friend; private List&

萬萬沒想到JVM記憶體結構的面試題可以問的這麼難?

在我的部落格中,之前有很多文章介紹過JVM記憶體結構,相信很多看多我文章的朋友對這部分知識都有一定的瞭解了。 那麼,請大家嘗試著回答一下以下問題: 1、JVM管理的記憶體結構是怎樣的? 2、不同的虛擬機器在實現執行時記憶體的時候有什麼區別? 3、執行時資料區中哪些區域是執行緒共享的?哪些是獨享的? 4、除了J