java常用容器簡要效能分析(List。Map。Set)
嗯,實習的時候看到這個,感覺蠻好,這裡摘錄學習,生活加油:
我曾經害怕別人嘲笑的目光,後來,發現他們的目光不會在我身上停留太久,人們更願意把目光放在自己身上。 知乎上看到,講給自己。
List
List和Set都屬於Collection的子介面,List集合中的元素是按照插入順序進行排列的,允許出現重複元素,
List介面下的常用實現類有ArrayList和LinkedList,對於List來講,
元素只能是通過set更新,不能通過add更新,通過add只能在指定索引位置新增元素,不會實現元素的覆蓋,通過remove移除
介面繼承關係:
ArrayList :
// 查詢指定位置元素的下標 public int indexOf(Object o); // 查詢指定元素最後一次出現的位置 public int lastIndexOf(Object o) ; // 清空集合元素 public void clear(); // 等等......
ArrayList的特點: **
- ArrayList內部是使用陣列來儲存資料,並且是一個"動態"的陣列,在新增元素時,如果發現容量不夠時,會進 行擴容。
- ArrayList支援隨機訪問元素,隨機訪問元素的效率是O(1)
- ArrayList在尾部新增元素的效率為O(1),add方法預設在尾部進行新增,在使用的時候最好在尾部新增元素 效率更佳
- ArrayList在進行刪除元素或者在中間、頭部插入元素時會導致陣列內部移動,進行陣列拷貝,平均時間複雜度 為O(n)
ArrayList的迭代方式:
- 1、下標迭代
// 使用下標對List進行外部迭代 for (int i = 0; i < list.size(); i++) { System.out.println(list.get(i));}
- 2、可以使用增強for進行迭代
// 採用增強for的迭代方式其實底層是使用迭代器進行迭代,在迭代的過程中不允許對元素進行修改 for (String s : list) { System.out.println(s);}
- 3、採用內部迭代的方式
// 內部迭代forEach,在迭代的過程中仍然不允許對元素進行修改過刪除操作 list.forEach(item -> System.out.println(item)); // 內部迭代還支援並行方式對元素進行迭代 如果資料量非常大的時候可以採用該方式(一般不採用)迭代出來的元素可能無序 list.parallelStream().forEach(System.out::println);
list.stream().forEach(System.out::print);
- 4、內部迭代底層實現
public void forEach(Consumer<? super E> action) { Objects.requireNonNull(action); final int expectedModCount = modCount; @SuppressWarnings("unchecked") final E[] elementData = (E[]) this.elementData; final int size = this.size; for (int i=0; modCount == expectedModCount && i < size; i++) { action.accept(elementData[i]); } if (modCount != expectedModCount) { throw new ConcurrentModificationException(); } }
- 5、使用迭代器進行迭代
// 直接使用迭代器進行迭代 這種迭代方式允許在迭代中對元素進行修改和刪除操作 Iterator<Long> iterator = list.iterator(); while (iterator.hasNext()){ System.out.println(iterator.next()); }
幾種迭代方式的效能比較
在資料規模為一千萬的情況下內部迭代表現較好,儘管在千萬級的資料量並行迭代依然速度不快,因為線上程的頻換 切換和銷燬等因素造成了一定的開銷。
在百萬資料規模的情況下,增強for的效能較好,可以根據資料量來對元素進行迭代,fori方式和增強for效能差異不是很大。
LinkedList:
LinkedList繼承自AbstractSequentialList可以知道LinkedList的元素是順序訪問的,隨機訪問元素需要對連結串列進行遍歷, 同樣實現了克隆和序列化介面LinkedList還實現了Deque相關的方法,可以當做一個佇列來使用
LinkedList的類繼承關係
LinkedList的特點:
- LinkedList的內部資料結構是一個雙向連結串列,有一個頭結點和一個尾部節點,在頭部和尾部插入的效率非常高O(1)
- LinkedList的平均查詢效率為O(n)
- LinkedList的刪除和修改都需要先定位元素的位置,但是對於刪除操作本身只需要O(1)的時間複雜度LinkedList因為採用了連結串列結構,所以理論空間是沒有限制的,不需要擴容
- LinkedList在使用下標訪問元素的時候使用了折半查詢,但是在資料量大的情況下,查詢效率依然很慢 便於用作LRU
LinkedList的迭代方式
- LinkedList的迭代方式其實和ArrayList大同小異,但是ArrayList在進行get(index)的操作只需要O(1)的時間複雜度
所以我們在使用LinkedList的時候不採用fori形式的遍歷
- 增強for方式進行遍歷,其實相當於使用迭代器進行訪問,增強for反編譯以後其實就是iterator
- 使用迭代器對連結串列進行迭代,Linked的迭代器內部就是從頭節點開始依次向下尋找節點
- 使用內部迭代forEach方式
幾種迭代方式的比較:
- LinkedList使用增強for方式進行遍歷速度較快,使用該fori進行遍歷時候,在百萬級資料量程式直接卡死,所以LinkedList嚴禁使用fori遍歷
- 在千萬級別資料量的情況下,速度和ArrayList差不多,但ArrayList較快,因為ArrayList資料空間是連續的
ArrayList和LinkedList的區別
- 是否保證執行緒安全: ArrayList 和 LinkedList 都是不同步的,也就是不保證執行緒安全;
- 底層資料結構: Arraylist 底層使用的是Object陣列;LinkedList 底層使用的是雙向連結串列資料結構(JDK1.6之前為迴圈連結串列,JDK1.7取消了迴圈。注意雙向連結串列和雙向迴圈連結串列的區別,下面有介紹到!)
- 插入和刪除是否受元素位置的影響:
- ① ArrayList 採用陣列儲存,所以插入和刪除元素的時間複雜度受元素位置的影響。 比如:執行add(E e)方法的時候, ArrayList 會預設在將指定的元素追加到此列表的末尾,這種情況時間複雜度就是O(1)。但是如果要在指定位置 i 插入和刪除元素的話(add(int index, E element))時間複雜度就為 O(n-i)。因為在進行上述操作的時候集合中第 i 和第 i 個元素之後的(n-i)個元素都要執行向後位/向前移一位的操作。
- ② LinkedList 採用連結串列儲存,所以插入,刪除元素時間複雜度不受元素位置的影響,都是近似 O(1)而陣列為近似 O(n)。
- 是否支援快速隨機訪問: LinkedList 不支援高效的隨機元素訪問,而 ArrayList 支援。快速隨機訪問就是通過元素的序號快速獲取元素物件(對應於get(int index)方法)。
- 記憶體空間佔用: ArrayList的空 間浪費主要體現在在list列表的結尾會預留一定的容量空間,而LinkedList的空間花費則體現在它的每一個元素都需要消耗比ArrayList更多的空間(因為要存放直接後繼和直接前驅以及資料)
Map:
Map是雙列集合,即儲存元素的時候是鍵值對的形式在Map中儲存的,一個Entry<K,V>結構的鍵值對對映,一個鍵對 應一個值,不允許出現重複的鍵,
HashMap
HashMap的類繼承關係:
- HashMap繼承自AbstractMap同樣一個抽象類的出現是為了實現一些子類通用的方法,一些個性化的方法還需要子類 去實現
- HashMap內部是使用了散列表+紅黑樹進行儲存資料的,即陣列+連結串列+紅黑樹
HashMap的特點
- HashMap使用位運算將HashMap中陣列的大小一定是2的N次方,保證了在取出元素時候通過與運算能更高效 和更精確的定位陣列下標
- 即使兩個不一樣的元素也可能會出現同樣的hashCode,HashMap使用拉鍊法設計解決了Hash衝突問題,同一個雜湊槽(在我們這裡就是陣列的每一個槽)中的所有元素放到一個連結串列中
- HashMap在某一個槽上的連結串列長度大於等於8的時候並且HashMap中陣列的長度大於等於64會進行樹化,將 連結串列轉換成紅黑樹以提升查詢效率
- 在增刪改查元素的時候平均時間複雜度為O(1)非常高效
- HashMap在插入的時候允許空鍵空值
- HashMap是非同步的,多執行緒同時操作的時候會發生併發修改異常
HashMap的迭代方式
- 通過keySet||valueSet進行遍歷
// 獲取到所有的key然後依次進行獲取 Set<Integer> keySet = map.keySet(); Integer val = 0; for (Integer key : keySet) { val = map.get(key); System.out.print(""); }
- 通過entrySet對map進行遍歷
Set<Map.Entry<Integer, Integer>> entrySet = map.entrySet(); for (Map.Entry<Integer, Integer> entry : entrySet) { System.out.print(""); }
- 使用內部迭代
Map<Object,Object> objectObjectMap = new HashMap<>(); objectObjectMap.forEach( (o1, o2) ->System.out.println(o1.toString()+o2)); // 內部迭代底層依然是使用entrySet進行迭代,效率不如直接使用外部迭代 default void forEach(BiConsumer<? super K, ? super V> action) { Objects.requireNonNull(action); for (Map.Entry<K, V> entry : entrySet()) { K k; V v; try { k = entry.getKey(); v = entry.getValue(); } catch(IllegalStateException ise) { // this usually means the entry is no longer in the map. throw new ConcurrentModificationException(ise); } action.accept(k, v); } }
幾種迭代方式的效能差異
LinkedHashMap:
LinkedHashMap是HashMap的一個子類,內部維護了一個雙向連結串列保證了元素插入的順序
HashMap的類繼承關係
LinkedHashMap的資料結構
LinkedHashMap的特點
- LinkedHashMap是HashMap的子類,其增刪改查的平均時間複雜度依然是O(1)
- LinkedHashMap的節點佔用了更多的空間,包括指向前一個節點的指標before和指向後一個節點的after指標
- LinkedHashMap預設使用插入順序進行遍歷,也可以使用訪問順序,將accessOrder置為true即可
LinkedHashMap的迭代方式
- 使用keySet進行遍歷,keySet返回的是一個LinkedKeySet,LinkedKeySet的遍歷方式是按照插入時候的順序
- 使用entrySet進行遍歷,返回LinkedEntrySet
- 使用內部迭代forEach
public void forEach(BiConsumer<? super K, ? super V> action) { if (action == null) throw new NullPointerException(); int mc = modCount; for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after) action.accept(e.key, e.value); if (modCount != mc) throw new ConcurrentModificationException(); }
TreeMap
TreeMap中的元素預設按照keys的自然排序排列。(對Integer來說,其自然排序就是數字的升序;對String來說,其自然排序就是按照字母表排序)
TreeMap的定義如下:
public class TreeMap<K,V> extends AbstractMap<K,V> implements NavigableMap<K,V>, Cloneable, java.io.Serializable
TreeMap繼承AbstractMap,實現NavigableMap、Cloneable、Serializable三個介面。其中AbstractMap表明TreeMap為一個Map即支援key-value的集合, NavigableMap(更多)則意味著它支援一系列的導航方法,具備針對給定搜尋目標返回最接近匹配項的導航方法 。
TreeMap中同時也包含了如下幾個重要的屬性:
//比較器,因為TreeMap是有序的,通過comparator介面我們可以對TreeMap的內部排序進行精密的控制 private final Comparator<? super K> comparator; //TreeMap紅-黑節點,為TreeMap的內部類 private transient Entry<K,V> root = null; //容器大小 private transient int size = 0; //TreeMap修改次數 private transient int modCount = 0; //紅黑樹的節點顏色--紅色 private static final boolean RED = false; //紅黑樹的節點顏色--黑色 private static final boolean BLACK = true;
對於葉子節點Entry是TreeMap的內部類,它有幾個重要的屬性:
//鍵 K key; //值 V value; //左孩子 Entry<K,V> left = null; //右孩子 Entry<K,V> right = null; //父親 Entry<K,V> parent; //顏色 boolean color = BLACK;
資料結構:基於紅黑樹的一種實現,紅黑樹是自平橫的二叉搜尋樹。二叉搜尋樹是排序好的二叉樹。
Set
Set集合儲存元素的特點就是,set儲存元素都是無序並且不可重複的,比較常用的兩種有HashSet和TreeSet
HashSet:
HashSet的類繼承關係
Hashset的頂級介面是Collection介面,屬於單列集合,即每次儲存一個元素
HashSet的資料結構
private transient HashMap<E,Object> map;// 內部維護了一個map,其底層實現靠的就是HashMap,鍵用於存放值 // Dummy value to associate with an Object in the backing Map private static final Object PRESENT = new Object();// 這個空的Object物件作為所有的預設Value /** *Constructs a new, empty set; the backing <tt>HashMap</tt> instance has *default initial capacity (16) and load factor (0.75). */ public HashSet() { map = new HashMap<>(); } // add方法其實就是呼叫了map的put,並傳入一個空的value
public boolean add(E e) { return map.put(e, PRESENT)==null; }
因為Set的元素和HashMap中的鍵是有相同的特徵的,HashSet充分利用了HashMap的功能
HashSet的特點:
- 儲存元素時會去重,即集合中的元素都是不可重複的
- HashSet沒有get方法,其實道理也很顯而易見,因為元素是無序的所以不能根據下標來訪問元素
- HashSet的本質就是HashMap
HashSet的迭代方式:
- 使用迭代器進行迭代,其實本質上返回的就是HashMap的keySet
public Iterator<E> iterator() { return map.keySet().iterator(); }
- 使用forEach進行內部迭代,效能不如直接使用迭代器
set.forEach(k->System.out.println(k));
TreeSet
TreeSet是基於TreeMap實現的,TreeSet的元素支援2種排序方式:自然排序或者根據提供的Comparator進行排序。
繼承關係:
TreeSet的特點
- TreeSet中儲存的元素是有序且不可重複的,所謂有序就是按照元素自身的排序順序,或者使用者自定義比較 方式
- 和HashSet類似TreeSet的底層實現就是TreeMap
public TreeSet() { this(new TreeMap<E,Object>()); }
&n