Java原始碼解析系列(二)ArrayList原始碼解析
備註:以下都是基於JDK8 原始碼分析
ArrayList簡介
ArrayList 是一個數組佇列,相當於 動態陣列。與Java中的陣列相比,它的容量能動態增長。它繼承於AbstractList,實現了List, RandomAccess, Cloneable, java.io.Serializable這些介面。 ArrayList 繼承了AbstractList,實現了List。它是一個數組佇列,提供了相關的新增、刪除、修改、遍歷等功能。
ArrayList 實現了RandmoAccess介面,即提供了隨機訪問功能。RandmoAccess是java中用來被List實現,為List提供快速訪問功能的。在ArrayList中,我們即以O(1)的時間複雜度,通過元素的序號快速獲取元素物件,這就是快速隨機訪問。稍後,我們會比較List的“快速隨機訪問”和“通過Iterator迭代器訪問”的效率。
ArrayList 實現了Cloneable介面,即覆蓋了函式clone(),能被克隆。 ArrayList 實現java.io.Serializable介面,這意味著ArrayList支援序列化,能通過序列化去傳輸。 和Vector不同,ArrayList中的操作不是執行緒安全的!所以,建議在單執行緒中才使用ArrayList,而在多執行緒中可以選擇Vector或者CopyOnWriteArrayList。
因其底層資料結構是陣列,所以可想而知,它是佔據一塊連續的記憶體空間(容量就是陣列的length
),所以它也有陣列的缺點,空間效率不高。
由於陣列的記憶體連續,可以根據下標以O1的時間讀寫(改查)
當集合中的元素超出這個容量,便會進行擴容操作。擴容操作也是ArrayList
的一個性能消耗比較大的地方,所以若我們可以提前預知資料的規模,應該通過public ArrayList(int initialCapacity) {}
構造方法,指定集合的大小,去構建ArrayList
例項,以減少擴容次數,提高效率。
ArrayList屬性
ArrayList屬性主要就是當前陣列長度size,以及存放陣列的物件elementData陣列,除此之外還有一個經常用到的屬性就是從AbstractList繼承過來的modCount屬性,代表ArrayList集合的修改次數。
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
//序列化ID
private static final long serialVersionUID = 8683452581122892189L;
//預設初始化容量大小
private static final int DEFAULT_CAPACITY = 10;
//有參建構函式,初始化空陣列資料
private static final Object[] EMPTY_ELEMENTDATA = {};
//無參建構函式,初始化空陣列資料。用來區分,第一次新增元素時,是否需要擴容
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//儲存集合元素的底層實現:真正存放元素的陣列,不參與序列化
transient Object[] elementData;
//實際資料大小
private int size;
注意:EMPTY_ELEMENTDATA、DEFAULTCAPACITY_EMPTY_ELEMENTDATA都用static修飾,也就是當再次建立預設建構函式或0容量的ArrayList,並不會重新分配記憶體,其內部資料都指向同一個引用,起到快取的作用。
elementData 之所以用transient關鍵字修飾,是因為序列化的時候,其中有一些空資料,並不需要把整個陣列都序列化,只需要序列化實際資料大小的資料即可。
ArrayList建構函式
無參建構函式
如果不傳入引數,則使用預設無參構建方法建立ArrayList物件,如下:
//賦予一個空陣列物件,當第一新增元素時,elementData長度會設定成10
public ArrayList() {this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;}
帶int型別的建構函式
如果傳入引數,則代表指定ArrayList的初始陣列長度,傳入引數如果是大於等於0,則使用使用者的引數初始化,如果使用者傳入的引數小於0,則丟擲異常,構造方法如下:
/**
* 傳入指定容量來初始化ArrayList容量,如果大於0使用指定容量。
* 如果等於0則使用快取的空陣列物件。
*
* @param initialCapacity 容量大小
* @throws IllegalArgumentException 如果容量小於0,則丟擲異常
*
*/
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
帶Collection物件的建構函式
1)將collection物件轉換成陣列,然後將陣列的地址的賦給elementData。
2)更新size的值,同時判斷size的大小,如果是size等於0,直接將空物件EMPTY_ELEMENTDATA的地址賦給elementData
3)如果size的值大於0,則執行Arrays.copy方法,把collection物件的內容(可以理解為深拷貝)copy到elementData中。
/**
*
* 傳入一個集合構造ArrayList
*
* @param c 集合資料
* @throws NullPointerException 如果集合為空,則丟擲異常
*/
public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
if ((size = elementData.length) != 0) {
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
} else {
// replace with empty array.
this.elementData = EMPTY_ELEMENTDATA;
}
}
注意:this.elementData = c.toArray(); 這裡會有一個bug。如果是Arrays.asList呼叫產出的集合,其會保留原始型別,會導致後面加入其它型別的資料,丟擲異常。所以需要判斷其中的型別是否是Object[].class,如果不是則執行深度拷貝,將型別轉為Object[].class。
其測試程式碼如下
public static void test2()
{
List<String> list = Arrays.asList("abc");
// 這裡是 java.util.Arrays$ArrayList
System.out.println(list.getClass());
// 陣列中的實際型別是 [java.lang.String];
Object[] objArray = list.toArray();
System.out.println(objArray.getClass());
objArray[0] = new Object(); // 此處會丟擲 ArrayStoreException
}
add(E e) 方法
add主要的執行邏輯如下:
1)計算陣列已使用長度(size)加1之後,所需的最小容量
2)修改次數modCount 標識自增1,如果當前陣列已使用長度(size)加1後的大於當前的陣列長度,則呼叫grow方法,增長陣列,grow方法會將當前陣列的長度變為原來容量的1.5倍。如果還是小於所需容量,則以所需容量為準。如果大於MAX_ARRAY_SIZE,則使用Integer.MAX_VALUE。備註:陣列作為一個物件,一些機器需要一定的記憶體儲存物件頭資訊,物件頭資訊最大佔用記憶體不可超過8位元組。所以MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8,避免出錯。
3)確保新增的資料有地方儲存之後,則將新元素新增到位於size的位置上。
4)返回新增成功布爾值。
/**
* 在列表末尾新增元素
*
* @param e 元素
* @return true 新增成功返回值
*/
public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
//計算新增資料後,所需容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
//確認容量
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
//確認需要擴容容量
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
//擴容
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
add(int index, E element)方法
這個方法其實和上面的add類似,該方法可以按照元素的位置,指定位置插入元素,具體的執行邏輯如下:
1)確保數插入的位置小於等於當前陣列長度,並且不小於0,否則丟擲異常
2)確保陣列已使用長度(size)加1之後足夠存下 下一個資料
3)修改次數(modCount)標識自增1,如果當前陣列已使用長度(size)加1後的大於當前的陣列長度,則呼叫grow方法,增長陣列
4)grow方法會將當前陣列的長度變為原來容量的1.5倍。
5)確保有足夠的容量之後,使用System.arraycopy 將需要插入的位置(index)後面的元素統統往後移動一位。
6)將新的資料內容存放到陣列的指定位置(index)上
/**
* 在List中的指定位置插入元素
*
* @param index 插入的指定座標
* @param element 插入元素
* @throws IndexOutOfBoundsException 越界後拋異常
*/
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
/**
* 確認下標是否越界
*/
private void rangeCheckForAdd(int index) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
get方法
返回指定位置上的元素,
/**
* 返回指定座標下的元素
*
* @param index 指定座標
* @return the element at the specified position in this list
* @throws IndexOutOfBoundsException
*/
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
set方法
確保set的位置小於當前陣列的長度(size)並且大於0,獲取指定位置(index)元素,然後放到oldValue存放,將需要設定的元素放到指定的位置(index)上,然後將原來位置上的元素oldValue返回給使用者。
/**
* 替換指定座標下的元素為指定新元素
*
*
* @param index 被替換的下標
* @param element 指定的新元素
* @return the element 老元素
* @throws IndexOutOfBoundsException
*/
public E set(int index, E element) {
rangeCheck(index);
E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}
contains方法
呼叫indexOf方法,遍歷陣列中的每一個元素作對比,如果找到對於的元素,則返回true,沒有找到則返回false。
/**
*
* 確認List中是否包含指定元素
*
* @param o 指定元素
* @return 如果包含,則返回true
*/
public boolean contains(Object o) {
return indexOf(o) >= 0;
}
/**
* 返回List中,找到的第一個元素的座標,如果不包含則返回-1
*
*
*/
public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}
remove方法
根據索引remove
1)判斷索引有沒有越界
2)自增修改次數
3)將指定位置(index)上的元素儲存到oldValue
4)將指定位置(index)上的元素都往前移動一位
5)將最後面的一個元素置空,好讓垃圾回收器回收
6)將原來的值oldValue返回
/**
* 刪除指定下標的元素,右邊的元素往左移
*
*
* @param index 指定下標
* @return 返回已刪除的舊元素
* @throws IndexOutOfBoundsException
*/
public E remove(int index) {
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
根據物件remove
迴圈遍歷所有物件,得到物件所在索引位置,然後呼叫fastRemove方法,執行remove操作,呼叫此方法不會縮減陣列長度
/**
* 移除List中第一個匹配找到的物件
*
* @param o 要刪除的物件
* @return 找到並移除返回true,否則返回false
*/
public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
//移除指定下標元素,並置空
private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}
clear方法
新增操作次數(modCount),將陣列內的元素都置空,等待垃圾收集器收集,不減小陣列容量。
//刪除所有元素,並把陣列內資料置空,等待GC回收記憶體
public void clear() {
modCount++;
// clear to let GC do its work
for (int i = 0; i < size; i++)
elementData[i] = null;
size = 0;
}
sublist方法
我們看到程式碼中是建立了一個ArrayList 類裡面的一個內部類SubList物件,傳入的值中第一個引數時this引數,其實可以理解為返回當前list的部分檢視,真實指向的存放資料內容的地方還是同一個地方,如果修改了sublist返回的內容的話,那麼原來的list也會變動。
/**
* 返回指定區域內的元素List,包含fromIndex,不包含toIndex,如果fromIndex與toIndex相同
* 則返回空List。子List是原List的備份,如果對子List操作都會影響到原List,反之亦然。
*
*
* @throws IndexOutOfBoundsException
* @throws IllegalArgumentException
*/
public List<E> subList(int fromIndex, int toIndex) {
subListRangeCheck(fromIndex, toIndex, size);
return new SubList(this, 0, fromIndex, toIndex);
}
trimToSize方法
1)修改次數加1
2)將elementData中空餘的空間(包括null值)去除,例如:陣列長度為10,其中只有前三個元素有值,其他為空,那麼呼叫該方法之後,陣列的長度變為3。
public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = (size == 0)
? EMPTY_ELEMENTDATA
: Arrays.copyOf(elementData, size);
}
}
iterator方法
interator方法返回的是一個內部類,由於內部類的建立預設含有外部的this指標,所以這個內部類可以呼叫到外部類的屬性。
public Iterator<E> iterator() {
return new Itr();
}
一般的話,呼叫完iterator之後,我們會使用iterator做遍歷,這裡使用next做遍歷的時候有個需要注意的地方,就是呼叫next的時候,可能會引發ConcurrentModificationException,當修改次數,與期望的修改次數(呼叫iterator方法時候的修改次數)不一致的時候,會發生該異常.
expectedModCount這個值是在使用者呼叫ArrayList的iterator方法時候確定的,但是在這之後使用者add,或者remove了ArrayList的元素,那麼modCount就會改變,那麼這個值就會不相等,將會引發ConcurrentModificationException異常,這個是在多執行緒使用情況下,比較常見的一個異常。
private class Itr implements Iterator<E> {
int cursor; // index of next element to return
int lastRet = -1; // index of last element returned; -1 if no such
int expectedModCount = modCount;
public boolean hasNext() {
return cursor != size;
}
@SuppressWarnings("unchecked")
public E next() {
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
@Override
@SuppressWarnings("unchecked")
public void forEachRemaining(Consumer<? super E> consumer) {
Objects.requireNonNull(consumer);
final int size = ArrayList.this.size;
int i = cursor;
if (i >= size) {
return;
}
final Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length) {
throw new ConcurrentModificationException();
}
while (i != size && modCount == expectedModCount) {
consumer.accept((E) elementData[i++]);
}
// update once at end of iteration to reduce heap write traffic
cursor = i;
lastRet = i - 1;
checkForComodification();
}
final void checkForComodification() {
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}
listIterator方法
listInterator方法返回的也是一個內部類,它繼承了Itr內部類,與之不同的是。可以指定從某個位置,向前或向後遍歷元素
/**
*
* 從指定位置開始,返回一個ListIterator
*
*
* @throws IndexOutOfBoundsException
*/
public ListIterator<E> listIterator(int index) {
if (index < 0 || index > size)
throw new IndexOutOfBoundsException("Index: "+index);
return new ListItr(index);
}
/**
* An optimized version of AbstractList.ListItr
*/
private class ListItr extends Itr implements ListIterator<E> {
ListItr(int index) {
super();
cursor = index;
}
public boolean hasPrevious() {
return cursor != 0;
}
public int nextIndex() {
return cursor;
}
public int previousIndex() {
return cursor - 1;
}
@SuppressWarnings("unchecked")
public E previous() {
checkForComodification();
int i = cursor - 1;
if (i < 0)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i;
return (E) elementData[lastRet = i];
}
public void set(E e) {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.set(lastRet, e);
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
public void add(E e) {
checkForComodification();
try {
int i = cursor;
ArrayList.this.add(i, e);
cursor = i + 1;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
}
小結
ArrayList總體來說比較簡單,不過ArrayList還有以下一些特點:
- ArrayList自己實現了序列化和反序列化的方法,因為它自己實現了 private void writeObject(java.io.ObjectOutputStream s)和 private void readObject(java.io.ObjectInputStream s) 方法
- ArrayList基於陣列方式實現,無容量的限制(會擴容)
- 新增元素時可能要擴容(所以最好預判一下),刪除元素時會減少容量(若希望減少容量,trimToSize()),刪除元素時,將刪除掉的位置元素置為null,下次gc就會回收這些元素所佔的記憶體空間。
- 執行緒不安全
- add(int index, E element):新增元素到陣列中指定位置的時候,需要將該位置及其後邊所有的元素都整塊向後複製一位
- get(int index):獲取指定位置上的元素時,可以通過索引直接獲取(O(1))
- remove(Object o)需要遍歷陣列
- remove(int index)不需要遍歷陣列,只需判斷index是否符合條件即可,效率比remove(Object o)高
- contains(E)需要遍歷陣列
- 使用iterator遍歷過程中,如果對ArrayList做修改,可能會引發多執行緒異常
- 增刪改查中, 增導致擴容,則會修改modCount,刪一定會修改。 改和查一定不會修改modCount
- 擴容操作會導致陣列複製,批量刪除會導致 找出兩個集合的交集,以及陣列複製操作,因此,增、刪都相對低效。 而 改、查都是很高效的操作
-
結合特點,在使用中,以Android中最常用的展示列表為例,列表滑動時需要展示每一個Item(element)的陣列,所以 查 操作是最高頻的。相對來說,增操作 只有在列表載入更多時才會用到 ,而且是在列表尾部插入,所以也不需要移動資料的操作。而刪操作則更低頻。 故選用ArrayList作為儲存資料的結構
參考連結