1. 程式人生 > >面試題--Java常用集合類

面試題--Java常用集合類

在Java中,有一套設計優良的介面和類組成了Java集合框架Collection,使程式設計師操作成批的資料或物件元素極為方便。例如Map(對映表)、Set(集合)、List(列表)等資料結構。Java用面向物件的設計對這些資料結構和演算法進行了封裝,這就極大的減化了程式設計師程式設計時的負擔。程式設計師也可以以這個集合框架為基礎,定義更高級別的資料抽象,比如Queue(佇列)、Stack(棧)和執行緒安全的集合等,從而滿足自己的需要。 

Java的集合框架,主要有三種:List、Set和Map。 需要注意的是,這裡的 Collection、List、Set和Map都是介面(Interface),不是具體的類實現。 List lst = new ArrayList(); 這是我們平常經常使用的建立一個新的List的語句,在這裡, List是介面,ArrayList才是具體的類。 


常用集合類的繼承結構如下: 
Collection<--List<--Vector 
Collection<--List<--ArrayList 
Collection<--List<--LinkedList 
Collection<--Set<--HashSet 
Collection<--Set<--HashSet<--LinkedHashSet 
Collection<--Set<--SortedSet<--TreeSet 
Map<--SortedMap<--TreeMap 
Map<--HashMap 


List:
List是有序的Collection,可以儲存重複的物件。它按照物件進入的順序儲存物件,使用此介面能夠精確的控制每個元素插入和刪除的位置。使用者能夠使用索引(元素在List中的位置,類似於陣列下標)來訪問List中的元素。LinkedList、ArrayList、Vector都實現了List介面。

Vector:
基於陣列(Array)的List,其實就是封裝了陣列所不具備的一些功能方便我們使用,所以它難易避免陣列的限制,同時效能也不可能超越陣列。所以,在可能的情況下,我們要多運用陣列。另外很重要的一點就是Vector是執行緒同步的(sychronized)的,這也是Vector和ArrayList 的一個的重要區別。 


ArrayList:
同Vector一樣是一個基於陣列上的連結串列,但是不同的是ArrayList不是同步的。所以在效能上要比Vector好一些,但是當執行到多執行緒環境中時,可需要自己在管理執行緒的同步問題。 

LinkedList:
LinkedList不同於前面兩種List,它不是基於陣列的,所以不受陣列效能的限制。 
它每一個節點(Node)都包含兩方面的內容: 
1.節點本身的資料(data); 
2.下一個節點的資訊(nextNode)。 
所以當對LinkedList做新增,刪除動作的時候就不用像基於陣列的ArrayList一樣,必須進行大量的資料移動。只要更改nextNode的相關資訊就可以實現了,這是LinkedList的優勢。 

List總結:
  • 所有的List中只能容納單個不同型別的物件組成的表,而不是Key-Value鍵值對。例如:[ tom,1,c ]
  • 所有的List中可以有相同的元素,例如Vector中可以有 [ tom,koo,too,koo ]
  • 所有的List中可以有null元素,例如[ tom,null,1 ]
  • 基於Array的List(Vector,ArrayList)適合查詢,而LinkedList 適合新增,刪除操作

Set:

Set是無序的Collection,表示數學意義上的集合概念,集合中的元素不能重複。因此Set中的每個元素都必須定義equals()方法來確保物件的唯一性。 HashSet、TreeSet實現了該介面,其中TreeSet實現了SortedSet介面,因此TreeSet容器中的元素是有序的。

HashSet:
雖然Set同List都實現了Collection介面,但是他們的實現方式卻大不一樣。List基本上都是以Array為基礎,但Set則是在 HashMap的基礎上來實現的,這個就是Set和List的根本區別。HashSet的儲存方式是把HashMap中的Key作為Set的對應儲存項。看看HashSet的add(Object obj)方法的實現就可以一目瞭然了。 
Java程式碼
  1. public boolean add(Object obj) {   
  2.    return map.put(obj, PRESENT) == null;   
  3. }   

這個也是為什麼在Set中不能像在List中一樣有重複的項的根本原因,因為HashMap的key是不能有重複的。 

LinkedHashSet:
HashSet的一個子類,一個連結串列。 

TreeSet:
SortedSet的子類,它不同於HashSet的根本就是TreeSet是有序的。它是通過SortedMap來實現的。 

Set總結:
  • Set實現的基礎是Map(HashMap)
  • Set中的元素是不能重複的,如果使用add(Object obj)方法新增已經存在的物件,則會覆蓋前面的物件
Map:
Map 是一種把鍵物件和值物件進行關聯的容器,而一個值物件又可以是一個Map,依次類推,這樣就可形成一個多級對映。對於鍵物件來說,像Set一樣,一個 Map容器中的鍵物件不允許重複,這是為了保持查詢結果的一致性;如果有兩個鍵物件一樣,那你想得到那個鍵物件所對應的值物件時就有問題了,可能你得到的並不是你想的那個值物件,結果會造成混亂,所以鍵的唯一性很重要,也是符合集合的性質的。當然在使用過程中,某個鍵所對應的值物件可能會發生變化,這時會按照最後一次修改的值物件與鍵對應。對於值物件則沒有唯一性的要求,你可以將任意多個鍵都對映到一個值物件上,這不會發生任何問題(不過對你的使用卻可能會造成不便,你不知道你得到的到底是那一個鍵所對應的值物件)。 

Map有兩種比較常用的實現:HashMap和TreeMap。 
HashMap是基於散列表實現的,採用物件的HashCode可以進行快速查詢。
TreeMap是基於紅黑樹的資料結構來實現的,是對鍵按序存放,因此它便有一些擴充套件的方法,比如firstKey()、lastKey()等,你還可以從TreeMap中指定一個範圍以取得其子Map。 
鍵和值的關聯很簡單,用put(Object key,Object value)方法即可將一個鍵與一個值物件關聯。用get(Object key)可得到與此key物件所對應的值物件。 


其它:
一、幾個常用類的區別 
1.ArrayList: 元素單個,效率高,多用於查詢 
2.Vector: 元素單個,執行緒安全,多用於查詢 
3.LinkedList:元素單個,多用於插入和刪除 
4.HashMap: 元素成對,元素可為空 
5.HashTable: 元素成對,執行緒安全,元素不可為空 

二、Vector、ArrayList和LinkedList 
大多數情況下,從效能上來說ArrayList最好,但是當集合內的元素需要頻繁插入、刪除時LinkedList會有比較好的表現,但是它們三個效能都比不上陣列,另外Vector是執行緒同步的。所以: 
如果能用陣列的時候(元素型別固定,陣列長度固定),請儘量使用陣列來代替List; 
如果沒有頻繁的刪除插入操作,又不用考慮多執行緒問題,優先選擇ArrayList; 
如果在多執行緒條件下使用,可以考慮Vector; 
如果需要頻繁地刪除插入,LinkedList就有了用武之地; 
如果你什麼都不知道,用ArrayList沒錯。 

三、Collections和Arrays 
在Java集合類框架裡有兩個類叫做Collections(注意,不是Collection!)和Arrays,這是JCF裡面功能強大的工具,但初學者往往會忽視。按JCF文件的說法,這兩個類提供了封裝器實現(Wrapper Implementations)、資料結構演算法和陣列相關的應用。 
想必大家不會忘記上面談到的“折半查詢”、“排序”等經典演算法吧,Collections類提供了豐富的靜態方法幫助我們輕鬆完成這些在資料結構中煩人的工作: 
binarySearch:折半查詢。 
sort:排序,這裡是一種類似於快速排序的方法,效率仍然是O(n * log n),但卻是一種穩定的排序方法。 
reverse:將線性表進行逆序操作,這個可是從前資料結構的經典考題哦! 
rotate:以某個元素為軸心將線性表“旋轉”。 
swap:交換一個線性表中兩個元素的位置。 
…… 
Collections還有一個重要功能就是“封裝器”(Wrapper),它提供了一些方法可以把一個集合轉換成一個特殊的集合,如下: 

unmodifiableXXX:轉換成只讀集合,這裡XXX代表六種基本集合介面:Collection、List、Map、Set、SortedMap和SortedSet。如果你對只讀集合進行插入刪除操作,將會丟擲UnsupportedOperationException異常。 

synchronizedXXX:轉換成同步集合。 

singleton:建立一個僅有一個元素的集合,這裡singleton生成的是單元素Set, 
singletonList和singletonMap分別生成單元素的List和Map。 

空集:由Collections的靜態屬性EMPTY_SET、EMPTY_LIST和EMPTY_MAP表示。