OneinStack基礎搭建typecheo輕量級部落格
ArrayList概述
(1)ArrayList
是一種變長的集合類,基於定長陣列實現。
(2)ArrayList
允許空值和重複元素,當往 ArrayList 中新增的元素數量大於其底層陣列容量時,其會通過擴容機制重新生成一個更大的陣列。
(3)由於 ArrayList
底層基於陣列實現,所以其可以保證在 O(1)
複雜度下完成隨機查詢操作。
(4)ArrayList
是非執行緒安全類,併發環境下,多個執行緒同時操作 ArrayList,會引發不可預知的異常或錯誤。
類的繼承關係
原始碼分析
成員屬性
DEFAULTCAPACITY_EMPTY_ELEMENTDATA與EMPTY_ELEMENTDATA的區別是:當我們向陣列中新增第一個元素時,DEFAULTCAPACITY_EMPTY_ELEMENTDATA將會知道陣列該擴充多少
/** * 預設初始容量 */ private static final int DEFAULT_CAPACITY = 10;
//預設的空的陣列,這個主要是在構造方法初始化一個空陣列的時候使用
private static final Object[] EMPTY_ELEMENTDATA = {}; /** *ArrayList 實際資料儲存的一個數組 *儲存ArrayList的元素的陣列緩衝區。 ArrayList的容量是此陣列緩衝區的長度。 *新增第一個元素時,任何具有elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA的空ArrayList都將擴充套件為DEFAULT_CAPACITY。*/ transient Object[] elementData; /** * 共享的空陣列例項,用於預設大小的空例項 */ private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; /** * elementData 的大小 */ private int size;
static修飾的EMPTY_ELEMENTDATA
和DEFAULTCAPACITY_EMPTY_ELEMENTDATA
ArrayList構造方法
(1)帶有初始化容量的構造方法
- 引數大於0,elementData初始化為initialCapacity大小的陣列
- 引數小於0,elementData初始化為空陣列
- 引數小於0,丟擲異常
//引數為初始化容量 public ArrayList(int initialCapacity) { //判斷容量的合法性 if (initialCapacity > 0) { //elementData才是實際存放元素的陣列 this.elementData = new Object[initialCapacity]; } else if (initialCapacity == 0) { //如果傳遞的長度為0,就是直接使用自己已經定義的成員變數(一個空陣列) this.elementData = EMPTY_ELEMENTDATA; } else { throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); } }
(2)無參構造
- 構造方法中將elementData初始化為空陣列DEFAULTCAPACITY_EMPTY_ELEMENTDATA
- 當呼叫add方法新增第一個元素的時候,會進行擴容
- 擴容至大小為DEFAULT_CAPACITY=10
-
//無參構造,使用預設的size為10的空陣列,在構造方法中沒有對陣列長度進行設定,會在後續呼叫add方法的時候進行擴容 public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; }
//將一個引數為Collection的集合轉變為ArrayList(實際上就是將集合中的元素換為了陣列的形式)。如果 //傳入的集合為null會丟擲空指標異常(呼叫c.toArray()方法的時候) public ArrayList(Collection<? extends E> c) { elementData = c.toArray(); if ((size = elementData.length) != 0) { //c.toArray()可能不會正確地返回一個 Object[]陣列,那麼使用Arrays.copyOf()方法 if (elementData.getClass() != Object[].class) elementData = Arrays.copyOf(elementData, size, Object[].class); } else { //如果集合轉換為陣列之後陣列長度為0,就直接使用自己的空成員變數初始化elementData this.elementData = EMPTY_ELEMENTDATA; } }
上面的這些構造方法理解起來比較簡單,關注前兩個構造方法做的事情,目的都是初始化底層陣列 elementData(this.elementData=XXX)。區別在於無參構造方法會將 elementData 初始化一個空陣列,插入元素時,擴容將會按預設值重新初始化陣列
。而有參的構造方法則會將 elementData 初始化為引數值大小(>= 0)的陣列
。一般情況下,我們用預設的構造方法即可。倘若在可知道將會向 ArrayList 插入多少元素的情況下,可以使用有參構造方法。
上面說到了使用無參構造的時候,在呼叫add方法的時候會進行擴容,所以下面我們就看看add方法以及擴容的細節
ArrayList的add方法
add方法大致流程
//將指定元素新增到list的末尾 public boolean add(E e) { //因為要新增元素,所以新增之後可能導致容量不夠,所以需要在新增之前進行判斷(擴容) ensureCapacityInternal(size + 1); // Increments modCount!!(待會會介紹到fast-fail) elementData[size++] = e; return true; }
我們看到add方法中在新增元素之前,會先判斷size的大小,所以我們來看看ensureCapacityInternal方法的細節
ensureCapacityInternal方法分析
private void ensureCapacityInternal(int minCapacity) { //這裡就是判斷elementData陣列是不是為空陣列 //(使用的無參構造的時候,elementData=DEFAULTCAPACITY_EMPTY_ELEMENTDATA) //如果是,那麼比較size+1(第一次呼叫add的時候size+1=1)和DEFAULT_CAPACITY, //那麼顯然容量為10 if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); } ensureExplicitCapacity(minCapacity); }
**當 要 add 進第1個元素時,minCapacity為(size+1=0+1=)1,在Math.max()方法比較後,minCapacity 為10。**然後緊接著呼叫ensureExplicitCapacity更新modCount的值,並判斷是否需要擴容
ensureExplicitCapacity方法分析
private void ensureExplicitCapacity(int minCapacity) { modCount++; //這裡就是add方法中註釋的Increments modCount //溢位 if (minCapacity - elementData.length > 0) grow(minCapacity);//這裡就是執行擴容的方法 }
下面來看一下擴容的主要方法grow。
grow方法分析
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8; private void grow(int minCapacity) { // oldCapacity為舊陣列的容量 int oldCapacity = elementData.length; // newCapacity為新陣列的容量(oldCap+oldCap/2:即更新為舊容量的1.5倍) int newCapacity = oldCapacity + (oldCapacity >> 1); // 檢查新容量的大小是否小於最小需要容量,如果小於那舊將最小容量最為陣列的新容量 if (newCapacity - minCapacity < 0) newCapacity = minCapacity; //如果新容量大於MAX_ARRAY_SIZE,使用hugeCapacity比較二者 if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: // 將原陣列中的元素拷貝 elementData = Arrays.copyOf(elementData, newCapacity); }
hugeCapacity方法
這裡簡單看一下hugeCapacity方法
private static int hugeCapacity(int minCapacity) { if (minCapacity < 0) // overflow throw new OutOfMemoryError(); //對minCapacity和MAX_ARRAY_SIZE進行比較 //若minCapacity大,將Integer.MAX_VALUE作為新陣列的大小 //若MAX_ARRAY_SIZE大,將MAX_ARRAY_SIZE作為新陣列的大小 //MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8; return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE; }
add方法執行流程總結
我們用一幅圖來簡單梳理一下,當使用無參構造的時候,在第一次呼叫add方法之後的執行流程
這是第一次呼叫add方法的過程,當擴容值capacity為10之後,
-
繼續新增第2個元素(先注意呼叫ensureCapacityInternal方法傳遞的引數為size+1=1+1=2)
-
在ensureCapacityInternal方法中,elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA不成立,所以直接執行ensureExplicitCapacity方法
-
ensureExplicitCapacity方法中minCapacity為剛剛傳遞的2,所以第二個if判斷(2-10=-8)不會成立,即newCapacity 不比 MAX_ARRAY_SIZE大,則不會進入
grow
方法。陣列容量為10,add方法中 return true,size增為1。 -
假設又新增3、4......10個元素(其中過程類似,但是不會執行grow擴容方法)
-
當add第11個元素時候,會進入grow方法時,計算newCapacity為15,比minCapacity(為10+1=11)大,第一個if判斷不成立。新容量沒有大於陣列最大size,不會進入hugeCapacity方法。陣列容量擴為15,add方法中return true,size增為11。
add(int index,E element)方法
//在元素序列 index 位置處插入 public void add(int index, E element) { rangeCheckForAdd(index); //校驗傳遞的index引數是不是合法 // 1. 檢測是否需要擴容 ensureCapacityInternal(size + 1); // Increments modCount!! // 2. 將 index 及其之後的所有元素都向後移一位 System.arraycopy(elementData, index, elementData, index + 1, size - index); // 3. 將新元素插入至 index 處 elementData[index] = element; size++; } private void rangeCheckForAdd(int index) { if (index > size || index < 0) //這裡判斷的index>size(保證陣列的連續性),index小於0 throw new IndexOutOfBoundsException(outOfBoundsMsg(index)); }
add(int index, E element)方法(在元素序列指定位置(假設該位置合理
)插入)的過程大概是下面這些
- 檢測陣列是否有足夠的空間(這裡的實現和上面的)
- 將 index 及其之後的所有元素向後移一位
- 將新元素插入至 index 處.
將新元素插入至序列指定位置,需要先將該位置及其之後的元素都向後移動一位,為新元素騰出位置。這個操作的時間複雜度為O(N)
,頻繁移動元素可能會導致效率問題,特別是集合中元素數量較多時。在日常開發中,若非所需,我們應當儘量避免在大集合中呼叫第二個插入方法。
ArrayList的remove方法
ArrayList支援兩種刪除元素的方式
1、remove(int index) 按照下標刪除
public E remove(int index) { rangeCheck(index); //校驗下標是否合法(如果index>size,舊丟擲IndexOutOfBoundsException異常) modCount++;//修改list結構,就需要更新這個值 E oldValue = elementData(index); //直接在陣列中查詢這個值 int numMoved = size - index - 1;//這裡計算所需要移動的數目 //如果這個值大於0 說明後續有元素需要左移(size=index+1) //如果是0說明被移除的物件就是最後一位元素(不需要移動別的元素) if (numMoved > 0) //索引index只有的所有元素左移一位 覆蓋掉index位置上的元素 System.arraycopy(elementData, index+1, elementData, index, numMoved); //移動之後,原陣列中size位置null elementData[--size] = null; // clear to let GC do its work //返回舊值 return oldValue; } //src:源陣列 //srcPos:從源陣列的srcPos位置處開始移動 //dest:目標陣列 //desPos:源陣列的srcPos位置處開始移動的元素,這些元素從目標陣列的desPos處開始填充 //length:移動源陣列的長度 public static native void arraycopy(Object src, int srcPos, Object dest, int destPos, int length);
刪除過程如下圖所示
2、remove(Object o) 按照元素刪除,會刪除和引數匹配的第一個元素
public boolean remove(Object o) { //如果元素是null 遍歷陣列移除第一個null if (o == null) { for (int index = 0; index < size; index++) if (elementData[index] == null) { //遍歷找到第一個null元素的下標 呼叫下標移除元素的方法 fastRemove(index); return true; } } else { //找到元素對應的下標 呼叫下標移除元素的方法 for (int index = 0; index < size; index++) if (o.equals(elementData[index])) { fastRemove(index); return true; } } return false; } //按照下標移除元素(通過陣列元素的位置移動來達到刪除的效果) private void fastRemove(int index) { modCount++; int numMoved = size - index - 1; if (numMoved > 0) System.arraycopy(elementData, index+1, elementData, index, numMoved); elementData[--size] = null; // clear to let GC do its work }
ArrayList的其他方法
ensureCapacity方法
最好在 add 大量元素之前用 ensureCapacity 方法,以減少增量從新分配的次數
public void ensureCapacity(int minCapacity) { int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA) // any size if not default element table ? 0 // larger than default for default empty table. It's already // supposed to be at default size. : DEFAULT_CAPACITY; if (minCapacity > minExpand) { ensureExplicitCapacity(minCapacity); } }
ArrayList總結
(1)ArrayList
是一種變長的集合類,基於定長陣列實現,使用預設構造方法初始化出來的容量是10(1.7之後都是延遲初始化,即第一次呼叫add方法新增元素的時候才將elementData容量初始化為10)。
(2)ArrayList
允許空值和重複元素,當往 ArrayList 中新增的元素數量大於其底層陣列容量時,其會通過擴容機制重新生成一個更大的陣列。ArrayList
擴容的長度是原長度的1.5倍
(3)由於 ArrayList
底層基於陣列實現,所以其可以保證在 O(1)
複雜度下完成隨機查詢操作。
(4)ArrayList
是非執行緒安全類,併發環境下,多個執行緒同時操作 ArrayList,會引發不可預知的異常或錯誤。
(5)順序新增很方便
(6)刪除和插入需要複製陣列,效能差(可以使用LinkindList)
(7)Integer.MAX_VALUE - 8 :主要是考慮到不同的JVM,有的JVM會在加入一些資料頭,當擴容後的容量大於MAX_ARRAY_SIZE,我們會去比較最小需要容量和MAX_ARRAY_SIZE做比較,如果比它大, 只能取Integer.MAX_VALUE,否則是Integer.MAX_VALUE -8。 這個是從jdk1.7開始才有的
fast-fail機制
fail-fast的解釋:
在系統設計中,快速失效系統一種可以立即報告任何可能表明故障的情況的系統。快速失效系統通常設計用於停止正常操作,而不是試圖繼續可能存在缺陷的過程。這種設計通常會在操作中的多個點檢查系統的狀態,因此可以及早檢測到任何故障。快速失敗模組的職責是檢測錯誤,然後讓系統的下一個最高級別處理錯誤。
就是在做系統設計的時候先考慮異常情況,一旦發生異常,直接停止並上報,比如下面的這個簡單的例子
//這裡的程式碼是一個對兩個整數做除法的方法,在fast_fail_method方法中,我們對被除數做了個簡單的檢查,如果其值為0,那麼就直接丟擲一個異常,並明確提示異常原因。這其實就是fail-fast理念的實際應用。 public int fast_fail_method(int arg1,int arg2){ if(arg2 == 0){ throw new RuntimeException("can't be zero"); } return arg1/arg2; }
在Java集合類中很多地方都用到了該機制進行設計,一旦使用不當,觸發fail-fast機制設計的程式碼,就會發生非預期情況。我們通常說的Java中的fail-fast機制,預設指的是Java集合的一種錯誤檢測機制。當多個執行緒對部分集合進行結構上的改變的操作時,有可能會觸發該機制時,之後就會丟擲併發修改異常**ConcurrentModificationException
**.當然如果不在多執行緒環境下,如果在foreach遍歷的時候使用add/remove方法,也可能會丟擲該異常。參考fast-fail機制,這裡簡單做個總結
之所以會丟擲ConcurrentModificationException異常,是因為我們的程式碼中使用了增強for迴圈,而在增強for迴圈中,集合遍歷是通過iterator進行的,但是元素的add/remove卻是直接使用的集合類自己的方法。這就導致iterator在遍歷的時候,會發現有一個元素在自己不知不覺的情況下就被刪除/添加了,就會丟擲一個異常,用來提示可能發生了併發修改!所以,在使用Java的集合類的時候,如果發生ConcurrentModificationException,優先考慮fail-fast有關的情況,實際上這可能並沒有真的發生併發,只是Iterator使用了fail-fast的保護機制,只要他發現有某一次修改是未經過自己進行的,那麼就會丟擲異常。