1. 程式人生 > >C++ 集合set 詳解

C++ 集合set 詳解

1.關於set

C++ STL 之所以得到廣泛的讚譽,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封裝了許多複雜的資料結構演算法和大量常用資料結構操作。vector封裝陣列,list封裝了連結串列,map和set封裝了二叉樹等,在封裝這些資料結構的時候,STL按照程式設計師的使用習慣,以成員函式方式提供的常用操作,如:插入、排序、刪除、查詢等。讓使用者在STL使用過程中,並不會感到陌生。

關於set,必須說明的是set關聯式容器。set作為一個容器也是用來儲存同一資料型別的資料型別,並且能從一個數據集合中取出資料,在set中每個元素的值都唯一,而且系統能根據元素的值自動進行排序。應該注意的是set中數元素的值不能直接被改變。C++ STL中標準關聯容器set, multiset, map, multimap內部採用的就是一種非常高效的平衡檢索二叉樹:紅黑樹,也成為RB樹(Red-Black Tree)。RB樹的統計效能要好於一般平衡二叉樹,所以被STL選擇作為了關聯容器的內部結構。

 關於set有下面幾個問題:

(1)為何map和set的插入刪除效率比用其他序列容器高?

大部分人說,很簡單,因為對於關聯容器來說,不需要做記憶體拷貝和記憶體移動。說對了,確實如此。set容器內所有元素都是以節點的方式來儲存,其節點結構和連結串列差不多,指向父節點和子節點。結構圖可能如下:

  A
   / \
  B C
 / \ / \
  D E F G

因此插入的時候只需要稍做變換,把節點的指標指向新的節點就可以了。刪除的時候類似,稍做變換後把指向刪除節點的指標指向其他節點也OK了。這裡的一切操作就是指標換來換去,和記憶體移動沒有關係。

(2)為何每次insert之後,以前儲存的iterator不會失效?

iterator這裡就相當於指向節點的指標,記憶體沒有變,指向記憶體的指標怎麼會失效呢(當然被刪除的那個元素本身已經失效了)。相對於vector來說,每一次刪除和插入,指標都有可能失效,呼叫push_back在尾部插入也是如此。因為為了保證內部資料的連續存放,iterator指向的那塊記憶體在刪除和插入過程中可能已經被其他記憶體覆蓋或者記憶體已經被釋放了。即使時push_back的時候,容器內部空間可能不夠,需要一塊新的更大的記憶體,只有把以前的記憶體釋放,申請新的更大的記憶體,複製已有的資料元素到新的記憶體,最後把需要插入的元素放到最後,那麼以前的記憶體指標自然就不可用了。特別時在和find等演算法在一起使用的時候,牢記這個原則:不要使用過期的iterator。

(3)當資料元素增多時,set的插入和搜尋速度變化如何?

如果你知道log2的關係你應該就徹底瞭解這個答案。在set中查詢是使用二分查詢,也就是說,如果有16個元素,最多需要比較4次就能找到結果,有32個元素,最多比較5次。那麼有10000個呢?最多比較的次數為log10000,最多為14次,如果是20000個元素呢?最多不過15次。看見了吧,當資料量增大一倍的時候,搜尋次數只不過多了1次,多了1/14的搜尋時間而已。你明白這個道理後,就可以安心往裡面放入元素了

2.set中常用的方法

begin()        ,返回set容器的第一個元素

end()      ,返回set容器的最後一個元素

clear()          ,刪除set容器中的所有的元素

empty()    ,判斷set容器是否為空

max_size()   ,返回set容器可能包含的元素最大個數

size()      ,返回當前set容器中的元素個數

rbegin     ,返回的值和end()相同

rend()     ,返回的值和rbegin()相同

寫一個程式練一練這幾個簡單操作吧: 

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     set<int> s;
 9     s.insert(1);
10     s.insert(2);
11     s.insert(3);
12     s.insert(1);
13     cout<<"set 的 size 值為 :"<<s.size()<<endl;
14     cout<<"set 的 maxsize的值為 :"<<s.max_size()<<endl;
15     cout<<"set 中的第一個元素是 :"<<*s.begin()<<endl;
16     cout<<"set 中的最後一個元素是:"<<*s.end()<<endl;
17     s.clear();
18     if(s.empty())
19     {
20         cout<<"set 為空 !!!"<<endl;
21     }
22     cout<<"set 的 size 值為 :"<<s.size()<<endl;
23     cout<<"set 的 maxsize的值為 :"<<s.max_size()<<endl;
24     return 0;
25 }
複製程式碼

執行結果:

小結:插入3之後雖然插入了一個1,但是我們發現set中最後一個值仍然是3哈,這就是set 。還要注意begin() 和 end()函式是不檢查set是否為空的,使用前最好使用empty()檢驗一下set是否為空.

count() 用來查詢set中某個某個鍵值出現的次數。這個函式在set並不是很實用,因為一個鍵值在set只可能出現0或1次,這樣就變成了判斷某一鍵值是否在set出現過了。

示例程式碼:

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     set<int> s;
 9     s.insert(1);
10     s.insert(2);
11     s.insert(3);
12     s.insert(1);
13     cout<<"set 中 1 出現的次數是 :"<<s.count(1)<<endl;
14     cout<<"set 中 4 出現的次數是 :"<<s.count(4)<<endl;
15     return 0;
16 }
複製程式碼

執行結果:

equal_range() ,返回一對定位器,分別表示第一個大於或等於給定關鍵值的元素和 第一個大於給定關鍵值的元素,這個返回值是一個pair型別,如果這一對定位器中哪個返回失敗,就會等於end()的值。具體這個有什麼用途我還沒遇到過~~~

示例程式碼:

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     set<int> s;
 9     set<int>::iterator iter;
10     for(int i = 1 ; i <= 5; ++i)
11     {
12         s.insert(i);
13     }
14     for(iter = s.begin() ; iter != s.end() ; ++iter)
15     {
16         cout<<*iter<<" ";
17     }
18     cout<<endl;
19     pair<set<int>::const_iterator,set<int>::const_iterator> pr;
20     pr = s.equal_range(3);
21     cout<<"第一個大於等於 3 的數是 :"<<*pr.first<<endl;
22     cout<<"第一個大於 3的數是 : "<<*pr.second<<endl;
23     return 0;
24 }
複製程式碼

執行結果:

erase(iterator)  ,刪除定位器iterator指向的值

erase(first,second),刪除定位器first和second之間的值

erase(key_value),刪除鍵值key_value的值

看看程式吧:

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     set<int> s;
 9     set<int>::const_iterator iter;
10     set<int>::iterator first;
11     set<int>::iterator second;
12     for(int i = 1 ; i <= 10 ; ++i)
13     {
14         s.insert(i);
15     }
16     //第一種刪除
17     s.erase(s.begin());
18     //第二種刪除
19     first = s.begin();
20     second = s.begin();
21     second++;
22     second++;
23     s.erase(first,second);
24     //第三種刪除
25     s.erase(8);
26     cout<<"刪除後 set 中元素是 :";
27     for(iter = s.begin() ; iter != s.end() ; ++iter)
28     {
29         cout<<*iter<<" ";
30     }
31     cout<<endl;
32     return 0;
33 }
複製程式碼

執行結果:

小結:set中的刪除操作是不進行任何的錯誤檢查的,比如定位器的是否合法等等,所以用的時候自己一定要注意。

find()  ,返回給定值值得定位器,如果沒找到則返回end()。

示例程式碼:

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     int a[] = {1,2,3};
 9     set<int> s(a,a+3);
10     set<int>::iterator iter;
11     if((iter = s.find(2)) != s.end())
12     {
13         cout<<*iter<<endl;
14     }
15     return 0;
16 }
複製程式碼

insert(key_value); 將key_value插入到set中 ,返回值是pair<set<int>::iterator,bool>,bool標誌著插入是否成功,而iterator代表插入的位置,若key_value已經在set中,則iterator表示的key_value在set中的位置。

inset(first,second);將定位器first到second之間的元素插入到set中,返回值是void.

示例程式碼:

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     int a[] = {1,2,3};
 9     set<int> s;
10     set<int>::iterator iter;
11     s.insert(a,a+3);
12     for(iter = s.begin() ; iter != s.end() ; ++iter)
13     {
14         cout<<*iter<<" ";
15     }
16     cout<<endl;
17     pair<set<int>::iterator,bool> pr;
18     pr = s.insert(5);
19     if(pr.second)
20     {
21         cout<<*pr.first<<endl;
22     }
23     return 0;
24 }
複製程式碼

執行結果:

lower_bound(key_value) ,返回第一個大於等於key_value的定位器

upper_bound(key_value),返回最後一個大於等於key_value的定位器

示例程式碼:

複製程式碼
 1 #include <iostream>
 2 #include <set>
 3 
 4 using namespace std;
 5 
 6 int main()
 7 {
 8     set<int> s;
 9     s.insert(1);
10     s.insert(3);
11     s.insert(4);
12     cout<<*s.lower_bound(2)<<endl;
13     cout<<*s.lower_bound(3)<<endl;
14     cout<<*s.upper_bound(3)<<endl;
15     return 0;
16 }
複製程式碼

執行結果:


三.自定義比較函式
    (1)元素不是結構體:
        例:
        //自定義比較函式myComp,過載“()”操作符
  1. struct myComp  
  2. {  
  3.     bool operator()(const your_type &a,const your_type &b)  
  4.     [  
  5.         return a.data-b.data>0;  
  6.     }  
  7. }  
  8. set<int,myComp>s;  
  9. ......  
  10. set<int,myComp>::iterator it;  
    (2)如果元素是結構體,可以直接將比較函式寫在結構體內。
        例:
  1. struct Info  
  2. {  
  3.     string name;  
  4.     float score;  
  5.     //過載“<”操作符,自定義排序規則
  6.     bool operator < (const Info &a) const
  7.     {  
  8.         //按score從大到小排列
  9.         return a.score<score;  
  10. 相關推薦

    C++ 集合set

    1.關於set C++ STL 之所以得到廣泛的讚譽,也被很多人使用,不只是提供了像vector, string, list等方便的容器,更重要的是STL封裝了許多複雜的資料結構演算法和大量常用資料結構操作。vector封裝陣列,list封裝了連結串列,map和set封

    JavaScript --- ES6 Set 集合結構

    順序輸出 ole 指向 然而 htm FN sar syntax prop Set 對象允許你存儲任何類型的唯一值,無論是原始值或者是對象引用。 1 const set1 = new Set([1, 2, 3, 4, 5]); 2 3 console.lo

    Java Set集合

    一,Set Set:注重獨一無二的性質,該體系集合可以知道某物是否已近存在於集合中,不會儲存重複的元素 用於儲存無序(存入和取出的順序不一定相同)元素,值不能重複。 物件的相等性    引用到堆上同一個物件的兩個引用是相等的。如果對兩個引用呼叫hashCode方

    Java集合中List,Set以及Map等集合體系(史上最全)

    概述: List , Set, Map都是介面,前兩個繼承至Collection介面,Map為獨立介面 Set下有HashSet,LinkedHashSet,TreeSet List下有ArrayList,Vector,LinkedList Map下有Ha

    redis之set 集合命令

    集合 set 相關命令 集合的性質: 唯一性,無序性,確定性 注: 在string和link的命令中,可以通過range 來訪問string中的某幾個字元或某幾個元素 但,因為集合的無序性,無法通過下標或範圍來訪問部分元素.

    Java 集合Set 與原始碼分析

        Set集合與List一樣,都是繼承自Collection介面,常用的實現類有HashSet和TreeSet。值得注意的是,HashSet是通過HashMap來實現的而TreeSet是通過TreeMap來實現的,所以HashSet和TreeSet都沒有自己的資料結構,具

    C# ListView用法

    ont 結束 server 發生 匹配 鼠標 之前 小圖標 order 一、ListView類 1、常用的基本屬性: (1)FullRowSelect:設置是否行選擇模式。(默認為false) 提示:只有在Details視圖該屬性才有意義

    C# Graphics類

    一段 特定 roc sta 指定順序 rendering 嘗試 osi intersect Brush 類.NET Framework 4定義用於填充圖形形狀(如矩形、橢圓、餅形、多邊形和封閉路徑)的內部的對象。 屬於命名空間: System.Drawing這是一個抽象基

    C# ListView用法(轉)

    分組 創建 cti 排列 checkbox 定義 com 程序 erl 一、ListView類 1、常用的基本屬性: (1)FullRowSelect:設置是否行選擇模式。(默認為false) 提示:只有在Details視圖該屬性才有

    【轉】讓你不再害怕指針——C指針(經典,非常詳細)

    有一個 情況 value 第一個字符 接下來 意思 strcpy abcdefg 數值 前言:復雜類型說明 要了解指針,多多少少會出現一些比較復雜的類型,所以我先介紹一下如何完全理解一個復雜類型,要理解復雜類型其實很簡單,一個類型裏會出現很多運算符,他們也像普通的表

    C# 泛型

    安全 c++ urn 操作 類型 增加 add 應用 定義 什麽是泛型 我們在編寫程序時,經常遇到兩個模塊的功能非常相似,只是一個是處理int數據,另一個是處理string數據,或者其他自定義的數據類型,但我們沒有辦法,只能分別寫多個方法處理每個數據類型,因為

    C++ STL vector

    node bsp 結構體 單元 style 入隊 push_back line 數據 一.解釋:    vector(向量):是一種順序容器,事實上和數組差不多,但它比數組更優越。一般來說數組不能動態拓展,因此在程序運行的時候不是浪費內存,就是造成越界。而vector正好彌

    C++ STL list

    c++ back main 雙向鏈表 第一個元素 cti ans :link 獲得 一.解釋: list是一種序列式容器。list容器完成的功能實際上和數據結構中的雙向鏈表是極其相似的,list中的數據元素是通過鏈表指針串連成邏輯意義上的線性表,list不僅是一個雙向鏈表,

    C++ STL map

    索引 turn clas c++ ltr 能力 code 宋體 快速 一.解釋: p { margin-bottom: 0.25cm; direction: ltr; color: #00000a; line-height: 120%; text-align: justif

    讓你不再害怕指針——C指針(經典,非常詳細)

    [0 返回 hello spa 程序 string 和數 過程 建議 http://blog.csdn.net/soonfly/article/details/51131141 前言:復雜類型說明 要了解指針,多多少少會出現一些比較復雜的類型,所以我先介紹一下如何完

    C++宏定義

    windows 依據 include 所有 out 轉換成 數組 ons area 一、#define的基本用法 #define是C語言中提供的宏定義命令,其主要目的是為程序員在編程時提供一定的方便,並能在一定程度上提高程序的運行效率,但學生在學習時往往不能 理解該

    C# partial 關鍵字

    one sig 矛盾 att 效應 public 空間 clas 同一文件 我們新建一個Windows Form時,後臺代碼都會自動添加如下代碼: public partial class Form1 : Form { public Form1()

    Java集合框架

    dha put 同時 列表 true 是個 獲取 pac .com 一、集合框架圖 簡化圖: 說明:對於以上的框架圖有如下幾點說明 1.所有集合類都位於java.util包下。Java的集合類主要由兩個接口派生而出:Collection和Map,Collection和M

    【linux c】setsockopt

    多層 count 設置 例如 select() log struct rec 查找 轉自:http://blog.csdn.net/zhonglinzhang/article/details/9183229 功能描述: 獲取或者設置與某個套接字關聯的選

    linux c/c++ GDB教程(轉載)

    spec -h AS 不同的 argv 路徑 scheme execution ram 學習使用了GDB一段時間後,發現它真的好強大!好用! GDB是GNU開源組織發布的一個強大的UNIX下的程序調試工具。或許,各位比較喜歡那種圖形界面方式的,像VC、BCB等IDE的調試,