STL筆試面試題總結(乾貨)
STL筆試面試題總結
一.STL有哪些元件?
STL提供六大元件彼此此可以組合套用:
1、容器
容器就是各種資料結構,我就不多說,看看下面這張圖回憶一下就好了,從實現角度看,STL容器是一種class template。
2、演算法
各種常見演算法,如sort,search,copy,erase等,我覺得其中比較值得學習的就是sort,next_permutation,partition,merge sort,從實現角度看,STL演算法是一種function template。
3、迭代器
扮演容器與演算法之間的膠合劑,是所謂的“泛型指標”。共有五種型別,從實現角度看,迭代器是一種將operator*,operator->,operator++,operator--等指標相關操作予以過載的class template。所有STL容器都附帶有自己專屬的迭代器,只有容器設計者才知道如何設計迭代器。原生指標也是一種迭代器。是設計模式的一種,所以被問到了解的設計模式可以用來湊數。
4、仿函式
行為類函式,可作為演算法的某種策略,從實現角度看,仿函式是一種過載了operator()的class或class template。一般函式指標可視為狹義的仿函式。
5、容器配接器
一種用來修飾容器或者仿函式或迭代器介面的東西。比如queue和stack,看著像容器,其實就是deque包了一層皮。
6、空間配置器
負責空間配置與管理。從實現角度看,配置器是一個實現了動態空間配置、空間管理、空間釋放額class template。
二.STL常用的容器有哪些以及各自的特點是什麼?
1.vector:底層資料結構為陣列 ,支援快速隨機訪問。
2.list:底層資料結構為雙向連結串列,支援快速增刪。
3.deque:底層資料結構為一箇中央控制器和多個緩衝區,詳細見STL原始碼剖析P146,支援首尾(中間不能)快速增刪,也支援隨機訪問。
4.stack:底層一般用23實現,封閉頭部即可,不用vector的原因應該是容量大小有限制,擴容耗時
5.queue:底層一般用23實現,封閉頭部即可,不用vector的原因應該是容量大小有限制,擴容耗時(stack和queue其實是介面卡,而不叫容器,因為是對容器的再封裝)
6.priority_queue:的底層資料結構一般為vector為底層容器,堆heap為處理規則來管理底層容器實現
7.set:底層資料結構為紅黑樹,有序,不重複。
8.multiset:底層資料結構為紅黑樹,有序,可重複。
9.map:底層資料結構為紅黑樹,有序,不重複。
10.multimap:底層資料結構為紅黑樹,有序,可重複。
11.hash_set:底層資料結構為hash表,無序,不重複。
12.hash_multiset:底層資料結構為hash表,無序,可重複 。
13.hash_map :底層資料結構為hash表,無序,不重複。
14.hash_multimap:底層資料結構為hash表,無序,可重複。
三、說說std::vector的底層(儲存)機制。
vector就是一個動態陣列,裡面有一個指標指向一片連續的記憶體空間,當空間不夠裝下資料時,會自動申請另一片更大的空間(一般是增加當前容量的50%或100%),然後把原來的資料拷貝過去,接著釋放原來的那片空間;當釋放或者刪除裡面的資料時,其儲存空間不釋放,僅僅是清空了裡面的資料。
四、vector插入刪除和list有什麼區別?
vector插入和刪除資料,需要對現有資料進行復制移動,如果vector儲存的物件很大或者建構函式很複雜,則開銷較大,如果是簡單的小資料,效率優於list。
list插入和刪除資料,需要對現有資料進行遍歷,但在首部插入資料,效率很高。
五、什麼情況下用vector,什麼情況下用list。
vector可以隨機儲存元素(即可以通過公式直接計算出元素地址,而不需要挨個查詢),但在非尾部插入刪除資料時,效率很低,適合物件簡單,物件數量變化不大,隨機訪問頻繁。
list不支援隨機儲存,適用於物件大,物件數量變化頻繁,插入和刪除頻繁。
六、vector中begin和end函式返回的是什麼?
begin返回的是第一個元素的迭代器,end返回的是最後一個元素後面位置的迭代器。
七、為什麼vector的插入操作可能會導致迭代器失效?
vector動態增加大小時,並不是在原空間後增加新的空間,而是以原大小的兩倍在另外配置一片較大的新空間,然後將內容拷貝過來,並釋放原來的空間。由於操作改變了空間,所以迭代器失效。
八、說說std::list的底層(儲存)機制。
以結點為單位存放資料,結點的地址在記憶體中不一定連續,每次插入或刪除一個元素,就配置或釋放一個元素空間
九、list自帶排序函式的排序原理。
將前兩個元素合併,再將後兩個元素合併,然後合併這兩個子序列成4個元素的子序列,重複這一過程,得到8個,16個,...,子序列,最後得到的就是排序後的序列。
時間複雜度:O(nlgn)
void List::sort()
{
List carry;
List counter[64]; //陣列元素為連結串列
int fill = 0;
while (head->next != tail)
{
//head是哨兵,不存放有效值
//head->next元素被移走,所以while迴圈不需要head=head->next;
carry.transfer(carry.getHead()->next, head->next, head->next->next);
int i = 0;
while (i < fill && counter[i].getHead()->next != counter[i].getHead())
//counter[i]不是空
{
counter[i].merge(carry);
carry.swap(counter[i++]);
}
carry.swap(counter[i]);
if (i == fill) ++fill;
}
for (int i = 1; i < fill; i++)
counter[i].merge(counter[i - 1]);
//通過這個實現排序(將有序的連結串列合成一個新的有序連結串列)
swap(counter[fill - 1]);
}
十、deque與vector的區別。
1)vector是單向開口的連續線性空間,deque是雙向開口的連續線性空間。(雙向開口是指可以在頭尾兩端分別做元素的插入和刪除操作)。
2)deque沒有提供空間保留功能,而vector則要提供空間保留功能。
3)deque也提供隨機訪問迭代器,但是其迭代器比vector迭代器複雜很多。
十一、不允許有遍歷行為的容器有哪些(不提供迭代器)?
1)queue,除了頭部外,沒有其他方法存取deque的其他元素。
2)stack(底層以deque實現),除了最頂端外,沒有任何其他方法可以存取stack的其他元素。
3)heap,所有元素都必須遵循特別的排序規則,不提供遍歷功能。
十二、STL容器的引數allocate是用來做什麼的?
一般用在容器中,作為容器的一個成員,但一般是用模版引數傳入,這樣才可以讓我們換成我們自定義的allocator;分配器用於封裝STL容器在記憶體管理上的低層細節
十三、你怎樣理解迭代器?
Iterator(迭代器)用於提供一種方法順序訪問一個聚合物件中各個元素, 而又不需暴露該物件的內部表示,相當於智慧指標。包括Input Iterator, Output Iterator, Forward Iterator, Bidirectional Iterator, Random Access Iterator.
十四、 vector每次insert或erase之後,以前儲存的iterator會不會失效?
理論上會失效,理論上每次insert或者erase之後,所有的迭代器就重新計算的,所以都可以看作會失效,原則上是不能使用過期的記憶體
但是vector一般底層是用陣列實現的,我們仔細考慮陣列的特性,不難得出另一個結論,
insert時,假設insert位置在p,分兩種情況:
a) 容器還有空餘空間,不重新分配記憶體,那麼p之前的迭代器都有效,p之後的迭
代器都失效
b) 容器重新分配了記憶體,那麼p之後的迭代器都無效咯
erase時,假設erase位置在p,則p之前的迭代器都有效並且p指向下一個元素位置(如果之前p在尾巴上,則p指向無效尾end),p之後的迭代器都無效
十五、STL對於小記憶體塊請求與釋放的處理
STL考慮到小型記憶體區塊的碎片問題,設計了雙層級配置器,第一級配置直接使用malloc()和free();第二級配置器則視情況採用不同的策略,當配置區大於128bytes時,直接呼叫第一級配置器;當配置區塊小於128bytes時,便不借助第一級配置器,而使用一個memory pool來實現。究竟是使用第一級配置器還是第二級配置器,由一個巨集定義來控制。SGI STL中預設使用第二級配置器。
二級配置器會將任何小額區塊的記憶體需求量上調至8的倍數,(例如需求是30bytes,則自動調整為32bytes),並且在它內部會維護16個free-list, 各自管理大小分別為8, 16, 24,…,128bytes的小額區塊,這樣當有小額記憶體配置需求時,直接從對應的free list中拔出對應大小的記憶體(8的倍數);當客戶端歸還記憶體時,將根據歸還記憶體塊的大小,將需要歸還的記憶體插入到對應free list的最頂端。
小結:
STL中的記憶體分配器實際上是基於空閒列表(free list)的分配策略,最主要的特點是通過組織16個空閒列表,對小物件的分配做了優化。
1)小物件的快速分配和釋放。當一次性預先分配好一塊固定大小的記憶體池後,對小於128位元組的小塊記憶體分配和釋放的操作只是一些基本的指標操作,相比於直接呼叫malloc/free,開銷小。
2)避免記憶體碎片的產生。零亂的記憶體碎片不僅會浪費記憶體空間,而且會給OS的記憶體管理造成壓力。
3)儘可能最大化記憶體的利用率。當記憶體池尚有的空閒區域不足以分配所需的大小時,分配演算法會將其鏈入到對應的空閒列表中,然後會嘗試從空閒列表中尋找是否有合適大小的區域,
但是,這種記憶體分配器侷限於STL容器中使用,並不適合一個通用的記憶體分配。因為它要求在釋放一個記憶體塊時,必須提供這個記憶體塊的大小,以便確定回收到哪個free list中,而STL容器是知道它所需分配的物件大小的,比如上述:
stl::vector array;
array是知道它需要分配的物件大小為sizeof(int)。一個通用的記憶體分配器是不需要知道待釋放記憶體的大小的,類似於free(p)。
十六、vector和list的區別
vector和陣列類似,擁有連續的記憶體空間,支援隨機的存取,在中間進行元素的插入和刪除的操作時間複雜度是O(n)
list是由雙向連結串列實現的,只能通過陣列指標來進行資料訪問,遍歷中間的元素,時間的複雜度是O(n).
十七、vector中erase方法與algorithn中的remove方法區別
vector中erase方法真正刪除了元素,迭代器不能訪問了
remove只是簡單地將元素移到了容器的最後面,迭代器還是可以訪問到。因為algorithm通過迭代器進行操作,不知道容器的內部結構,所以無法進行真正的刪除。
十八、STL中的容器都有哪些,優缺點?
介紹一下STL,詳細說明STL如何實現vector。
STL(標準模板庫)可分為容器(containers)、迭代器(iterators)、空間配置器(allocator)、配接器(adapters)、演算法(algorithms)、仿函式(functors)六個部分。
STL (標準模版庫,Standard Template Library.它由容器、演算法、迭代器組成。
STL有以下的一些優點:
可以方便容易地實現搜尋資料或對資料排序等一系列的演算法;
除錯程式時更加安全和方便;
即使是人們用STL在UNIX平臺下寫的程式碼你也可以很容易地理解(因為STL是跨平臺的)。
vector實質上就是一個動態陣列,會根據資料的增加,動態的增加陣列空間。
deque從邏輯上來看是連續的記憶體,本質上是由一段段固定大小 的連續空間組成。deque採用類似索引的結構管理記憶體。vector有capacity和reserve函式,deque和list一樣,沒有capacity和reserve函式。
總結如下:
1. 在deque中間 插入或者刪除將使所有deque元素的迭代器、引用、指標失效
2. 在deque首部或者尾部插入元素會使迭代器失效,但不會引起引用和指標失效
3. 在其首部或尾部刪除元素則只會使指向被刪除元素的迭代器失效
vector模板的資料在記憶體中連續的排列,所以隨機存取元素(即通過[]運算子存取)的速度最快,這一點和陣列是一致的。同樣由於它的連續排列,所以它在除尾部以外的位置刪除或新增元素的速度很慢,在使用vector時,要避免這種操作。
list模板的資料是鏈式儲存,所以不能隨機存取元素。它的優勢在於任意位置新增 刪除元素的速度。
deque模板是通過連結若干片連續的資料實現的,所以均衡了以上兩個容器的特點
十九、說說std::deque的底層機制。
deque動態地以分段連續空間組合而成,隨時可以增加一段新的連續空間並連結起來。不提供空間保留功能。
注意:除非必要,我們儘可能選擇使用vector而非deque,因為deque的迭代器比vector迭代器複雜很多。對deque排序,為了提高效率,可先將deque複製到一個vector上排序,然後再複製回deque。
deque採用一塊map(不是STL的map容器)作為主控,其為一小塊連續空間,其中每個元素都是指標,指向另一段較大的連續空間(緩衝區)。
deque的迭代器包含4個內容:
1)cur:迭代器當前所指元素
2)first:此迭代器所指的緩衝區的頭。
3)last:緩衝區尾。
4)node:指向管控中心。
二十、說說std::map底層機制。
map以RB-TREE為底層機制。RB-TREE是一種平衡二叉搜尋樹,自動排序效果不錯。
通過map的迭代器不能修改其鍵值,只能修改其實值。所以map的迭代器既不是const也不是mutable。
二十一、紅黑樹有什麼性質?
1)每個結點是紅色或者黑色。
2)根結點為黑色。
3)葉結點為黑色的NULL結點。
4)如果結點為紅,其子節點必須為黑。
5)任一結點到NULL的任何路徑,所含黑結點數必須相同。
二十二、vector、list、map、deque用erase(it)後,迭代器的變化。
vector和deque是序列式容器,其記憶體分別是連續空間和分段連續空間,刪除迭代器it後,其後面的迭代器都失效了,此時it及其後面的迭代器會自動加1,使it指向被刪除元素的下一個元素。
list刪除迭代器it時,其後面的迭代器都不會失效,將前面和後面連線起來即可。
map也是隻能使當前刪除的迭代器失效,其後面的迭代器依然有效。
二十三、hash_map與map的區別?什麼時候用hash_map,什麼時候用map?
建構函式:hash_map需要hash function和等於函式,而map需要比較函式(大於或小於)。
儲存結構:hash_map以hashtable為底層,而map以RB-TREE為底層。
總的說來,hash_map查詢速度比map快,而且查詢速度基本和資料量大小無關,屬於常數級別。而map的查詢速度是logn級別。但不一定常數就比log小,而且hash_map還有hash function耗時。
如果考慮效率,特別當元素達到一定數量級時,用hash_map。
考慮記憶體,或者元素數量較少時,用map。
二十四、hashtable,hash_set,hash_map的區別。
hash_set以hashtable為底層,不具有排序功能,能快速查詢。其鍵值就是實值。(set以RB-TREE為底層,具有排序功能。)
hash_map以以hashtable為底層,沒有自動排序功能,能快速查詢,每一個元素同時擁有一個實值和鍵值。(map以RB-TREE為底層,具有排序功能。)
二十五、map和set的3個問題。
1)為何map和set的插入刪除效率比其他序列容器高。
因為不需要記憶體拷貝和記憶體移動
2)為何map和set每次Insert之後,以前儲存的iterator不會失效?
因為插入操作只是結點指標換來換去,結點記憶體沒有改變。而iterator就像指向結點的指標,記憶體沒變,指向記憶體的指標也不會變。
2)當資料元素增多時(從10000到20000),map的set的查詢速度會怎樣變化?
RB-TREE用二分查詢法,時間複雜度為logn,所以從10000增到20000時,查詢次數從log10000=14次到log20000=15次,多了1次而已。
二十六、map是怎麼實現的?查詢的複雜度是多少?能不能邊遍歷邊插入?
紅黑樹和雜湊
O(logn)
不可以,map不像vector,它在對容器執行erase操作後不會返回後一個元素的迭代器,所以不能遍歷地往後刪除。
二十七、hash_map和map的區別在哪裡?
hash_map底層是雜湊的所以理論上操作的平均複雜度是常數時間,map底層是紅黑樹,理論上平均複雜度是O(logn),這裡總結一下,選用map還是hash_map,關鍵是看關鍵字查詢操作次數,以及你所需要保證的是查詢總體時間還是單個查詢的時間。如果是要很多次操作,要求其整體效率,那麼使用hash_map,平均處理時間短。如果是少數次的操作,使用 hash_map可能造成不確定的O(N),那麼使用平均處理時間相對較慢、單次處理時間恆定的map,考慮整體穩定性應該要高於整體效率,因為前提在操作次數較少。如果在一次流程中,使用hash_map的少數操作產生一個最壞情況O(N),那麼hash_map的優勢也因此喪盡了。
二十八、為何map和set不能像vector一樣有個reserve函式來預分配資料?
map和set內部儲存的已經不是元素本身了,而是包含元素的節點。也就是說map內部使用的Alloc並不是map宣告的時候從引數中傳入的Alloc。例如:
map, Alloc > intmap;
這時候在intmap中使用的allocator並不是Alloc, 而是通過了轉換的Alloc,具體轉換的方法時在內部通過
Alloc::rebind重新定義了新的節點分配器,詳細的實現參看徹底學習STL中的Allocator。
其實你就記住一點,在map和set裡面的分配器已經發生了變化,reserve方法你就不要奢望了。