collection array hashMap list set ConcurrentHashMap詳解
一、集合與陣列
陣列(可以儲存基本資料型別)是用來存現物件的一種容器,但是陣列的長度固定,不適合在物件數量未知的情況下使用。
集合(只能儲存物件,物件型別可以不一樣)的長度可變,可在多數情況下使用。
二、層次關係
Collection介面是集合類的根介面,Java中沒有提供這個介面的直接的實現類。但是卻讓其被繼承產生了兩個介面,就是Set和List。Set中不能包含重複的元素。List是一個有序的集合,可以包含重複的元素,提供了按索引訪問的方式。
Map是Java.util包中的另一個介面,它和Collection介面沒有關係,是相互獨立的,但是都屬於集合類的一部分。Map包含了key-value對。Map不能包含重複的key,但是可以包含相同的value。
三、幾種重要的介面和類簡介
1、List(有序、可重複) List裡存放的物件是有序的,同時也是可以重複的,List關注的是索引,擁有一系列和索引相關的方法,查詢速度快。因為往list集合裡插入或刪除資料時,會伴隨著後面資料的移動,所有插入刪除資料速度慢。
2、Set(無序、不能重複) Set裡存放的物件是無序,不能重複的,集合中的物件不按特定的方式排序,只是簡單地把物件加入集合中。
3、Map(鍵值對、鍵唯一、值不唯一) Map集合中儲存的是鍵值對,鍵不能重複,值可以重複。根據鍵得到值,對map集合遍歷時先得到鍵的set集合,對set集合進行遍歷,得到相應的值。
對比如下:
是否有序 |
是否允許元素重複 |
||
Collection |
否 |
是 |
|
List |
是 |
是 |
|
Set |
AbstractSet |
否 |
否 |
HashSet |
|||
TreeSet |
是(用二叉排序樹) |
||
Map |
AbstractMap |
否 |
使用key-value來對映和儲存資料,key必須唯一,value可以重複 |
HashMap |
|||
TreeMap |
是(用二叉排序樹) |
四、遍歷
在類集中提供了以下四種的常見輸出方式:
1)Iterator:迭代輸出,是使用最多的輸出方式。
2)ListIterator:是Iterator的子介面,專門用於輸出List中的內容。
3)foreach輸出:JDK1.5之後提供的新功能,可以輸出陣列或集合。
4)for迴圈
程式碼示例如下:
for的形式:for(int i=0;i<arr.size();i++){...}
foreach的形式: for(int i:arr){...}
iterator的形式: Iterator it = arr.iterator(); while(it.hasNext()){ object o =it.next(); ...}
五、ArrayList和LinkedList
ArrayList和LinkedList在用法上沒有區別,但是在功能上還是有區別的。LinkedList經常用在增刪操作較多而查詢操作很少的情況下,ArrayList則相反。
六、Map集合
實現類:HashMap、Hashtable、LinkedHashMap和TreeMap
HashMap
HashMap是最常用的Map,它根據鍵的HashCode值儲存資料,根據鍵可以直接獲取它的值,具有很快的訪問速度,遍歷時,取得資料的順序是完全隨機的。因為鍵物件不可以重複,所以HashMap最多隻允許一條記錄的鍵為Null,允許多條記錄的值為Null,是非同步的
Hashtable
Hashtable與HashMap類似,是HashMap的執行緒安全版,它支援執行緒的同步,即任一時刻只有一個執行緒能寫Hashtable,因此也導致了Hashtale在寫入時會比較慢,它繼承自Dictionary類,不同的是它不允許記錄的鍵或者值為null,同時效率較低。
ConcurrentHashMap
執行緒安全,並且鎖分離。ConcurrentHashMap內部使用段(Segment)來表示這些不同的部分,每個段其實就是一個小的hash table,它們有自己的鎖。只要多個修改操作發生在不同的段上,它們就可以併發進行。
LinkedHashMap
LinkedHashMap儲存了記錄的插入順序,在用Iteraor遍歷LinkedHashMap時,先得到的記錄肯定是先插入的,在遍歷的時候會比HashMap慢,有HashMap的全部特性。
TreeMap
TreeMap實現SortMap介面,能夠把它儲存的記錄根據鍵排序,預設是按鍵值的升序排序(自然順序),也可以指定排序的比較器,當用Iterator遍歷TreeMap時,得到的記錄是排過序的。不允許key值為空,非同步的;
map的遍歷
第一種:KeySet() 將Map中所有的鍵存入到set集合中。因為set具備迭代器。所有可以迭代方式取出所有的鍵,再根據get方法。獲取每一個鍵對應的值。 keySet():迭代後只能通過get()取key 。 取到的結果會亂序,是因為取得資料行主鍵的時候,使用了HashMap.keySet()方法,而這個方法返回的Set結果,裡面的資料是亂序排放的。 典型用法如下: Map map = new HashMap(); map.put("key1","lisi1"); map.put("key2","lisi2"); map.put("key3","lisi3"); map.put("key4","lisi4"); //先獲取map集合的所有鍵的set集合,keyset() Iterator it = map.keySet().iterator(); //獲取迭代器 while(it.hasNext()){ Object key = it.next(); System.out.println(map.get(key)); }
第二種:entrySet() Set<Map.Entry<K,V>> entrySet() //返回此對映中包含的對映關係的 Set 檢視。(一個關係就是一個鍵-值對),就是把(key-value)作為一個整體一對一對地存放到Set集合當中的。Map.Entry表示對映關係。entrySet():迭代後可以e.getKey(),e.getValue()兩種方法來取key和value。返回的是Entry介面。 典型用法如下: Map map = new HashMap(); map.put("key1","lisi1"); map.put("key2","lisi2"); map.put("key3","lisi3"); map.put("key4","lisi4"); //將map集合中的對映關係取出,存入到set集合 Iterator it = map.entrySet().iterator(); while(it.hasNext()){ Entry e =(Entry) it.next(); System.out.println("鍵"+e.getKey () + "的值為" + e.getValue()); } 推薦使用第二種方式,即entrySet()方法,效率較高。 對於keySet其實是遍歷了2次,一次是轉為iterator,一次就是從HashMap中取出key所對於的value。而entryset只是遍歷了第一次,它把key和value都放到了entry中,所以快了。兩種遍歷的遍歷時間相差還是很明顯的。
七、主要實現類區別小結
Vector和ArrayList 1,vector是執行緒同步的,所以它也是執行緒安全的,而arraylist是執行緒非同步的,是不安全的。如果不考慮到執行緒的安全因素,一般用arraylist效率比較高。 2,如果集合中的元素的數目大於目前集合陣列的長度時,vector增長率為目前陣列長度的100%,而arraylist增長率為目前陣列長度的50%。如果在集合中使用資料量比較大的資料,用vector有一定的優勢。 3,如果查詢一個指定位置的資料,vector和arraylist使用的時間是相同的,如果頻繁的訪問資料,這個時候使用vector和arraylist都可以。而如果移動一個指定位置會導致後面的元素都發生移動,這個時候就應該考慮到使用linklist,因為它移動一個指定位置的資料時其它元素不移動。 ArrayList 和Vector是採用陣列方式儲存資料,此陣列元素數大於實際儲存的資料以便增加和插入元素,都允許直接序號索引元素,但是插入資料要涉及到陣列元素移動等記憶體操作,所以索引資料快,插入資料慢,Vector由於使用了synchronized方法(執行緒安全)所以效能上比ArrayList要差,LinkedList使用雙向連結串列實現儲存,按序號索引資料需要進行向前或向後遍歷,但是插入資料時只需要記錄本項的前後項即可,所以插入數度較快。
arraylist和linkedlist 1.ArrayList是實現了基於動態陣列的資料結構,LinkedList基於連結串列的資料結構。 2.對於隨機訪問get和set,ArrayList覺得優於LinkedList,因為LinkedList要移動指標。 3.對於新增和刪除操作add和remove,LinedList比較佔優勢,因為ArrayList要移動資料。 這一點要看實際情況的。若只對單條資料插入或刪除,ArrayList的速度反而優於LinkedList。但若是批量隨機的插入刪除資料,LinkedList的速度大大優於ArrayList. 因為ArrayList每插入一條資料,要移動插入點及之後的所有資料。
HashMap與TreeMap 1、 HashMap通過hashcode對其內容進行快速查詢,而TreeMap中所有的元素都保持著某種固定的順序,如果你需要得到一個有序的結果你就應該使用TreeMap(HashMap中元素的排列順序是不固定的)。 2、在Map 中插入、刪除和定位元素,HashMap是最好的選擇。但如果您要按自然順序或自定義順序遍歷鍵,那麼TreeMap會更好。使用HashMap要求新增的鍵類明確定義了hashCode()和 equals()的實現。 兩個map中的元素一樣,但順序不一樣,導致hashCode()不一樣。 同樣做測試: 在HashMap中,同樣的值的map,順序不同,equals時,false; 而在treeMap中,同樣的值的map,順序不同,equals時,true,說明,treeMap在equals()時是整理了順序了的。
HashTable與HashMap 1、同步性:Hashtable是執行緒安全的,也就是說是同步的,而HashMap是執行緒序不安全的,不是同步的。 2、HashMap允許存在一個為null的key,多個為null的value 。 3、hashtable的key和value都不允許為null。
如何解決HashMap的執行緒不安全問題?
1.替換成Hashtable,Hashtable通過對整個表上鎖實現執行緒安全,因此效率比較低
2.使用Collections類的synchronizedMap方法包裝一下。方法如下:
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) 返回由指定對映支援的同步(執行緒安全的)對映
3.使用ConcurrentHashMap,它使用分段鎖來保證執行緒安全
通過前兩種方式獲得的執行緒安全的HashMap在讀寫資料的時候會對整個容器上鎖,而ConcurrentHashMap並不需要對整個容器上鎖,它只需要鎖住要修改的部分就行了
ArrayList擴容機制
發生擴容的條件:
根據傳入的最小需要容量minCapacity來和陣列的容量長度對比,若minCapactity大於或等於陣列容量,則需要進行擴容。(如果實際儲存陣列是空陣列,則最小需要容量就是預設容量)
實現擴容: jdk7中採用>>位運算,()增加量)右移動一位。 容量相當於擴大了1.5倍;
舉例說明:新增20個元素到ArrayList中
當第一次插入元素時才分配10(預設)個物件空間。之後擴容會按照1.5倍增長。
也就是當新增第11個數據的時候,Arraylist繼續擴容變為10*1.5=15;
當新增第16個數據時,繼續擴容變為15 * 1.5 =22個;
HashMap擴容機制
1.三個常量
static final int DEFAULT_INITIAL_CAPACITY = 16;
static final int MAXIMUM_CAPACITY = 1 << 30;
static final float DEFAULT_LOAD_FACTOR = 0.75f;
三個常量中可以看出,預設的容器大小是16,最大長度是2的30次方,load factor預設是0.75,擴充的臨界值是16*0.75=12
2.HashMap什麼時候進行擴容呢?
當HashMap中的元素個數超過陣列大小乘以負載因子(loadFactor)時,就會進行陣列擴容,loadFactor的預設值為0.75,
也就是說,預設情況下,陣列大小為16,
那麼當HashMap中元素個數超過16*0.75=12的時候,
就把陣列的大小擴充套件為2*16=32,即擴大一倍,
然後重新計算每個元素在陣列中的位置。