Iterator——叠代接口
叠代對於JAVA的來說絕對不陌生。我們常常使用JDK提供的叠代接口進行Java集合的叠代。
Iterator iterator = list.iterator(); while(iterator.hasNext()){ String string = iterator.next(); //do something }
叠代其實我們可以簡單地理解為遍歷,是一個標準化遍歷各類容器裏面的所有對象的方法類,它是一個很典型的設計模式。Iterator模式是用於遍歷集合類的標準訪問方法。它可以把訪問邏輯從不同類型的集合類中抽象出來,從而避免向客戶端暴露集合的內部結構。 在沒有叠代器時我們都是這麽進行處理的。如下:
對於數組我們是使用下標來進行處理的:
int[] arrays = new int[10]; for(int i = 0 ; i < arrays.length ; i++){ int a = arrays[i]; //do something }
對於ArrayList是這麽處理的:
List<String> list = new ArrayList<String>(); for(int i = 0 ; i < list.size() ; i++){ String string = list.get(i); //do something }
對於這兩種方式,我們總是都事先知道集合的內部結構,訪問代碼和集合本身是緊密耦合的,無法將訪問邏輯從集合類和客戶端代碼中分離出來。同時每一種集合對應一種遍歷方法,客戶端代碼無法復用。 在實際應用中如何需要將上面將兩個集合進行整合是相當麻煩的。所以為了解決以上問題,Iterator模式騰空出世,它總是用同一種邏輯來遍歷集合。使得客戶端自身不需要來維護集合的內部結構,所有的內部狀態都由Iterator來維護。客戶端從不直接和集合類打交道,它總是控制Iterator,向它發送"向前","向後","取當前元素"的命令,就可以間接遍歷整個集合。
上面只是對Iterator模式進行簡單的說明,下面我們看看Java中Iterator接口,看他是如何來進行實現的。
一、java.util.Iterator
在Java中Iterator為一個接口,它只提供了叠代了基本規則,在JDK中他是這樣定義的:對collection進行叠代的叠代器。叠代器取代了Java Collections Framework 中的 Enumeration。叠代器與枚舉有兩點不同:
1、叠代器允許調用者利用定義良好的語義在叠代期間從叠代器所指向的 collection 移除元素。
2、方法名稱得到了改進。
其接口定義如下:
public interface Iterator { boolean hasNext(); Object next(); void remove(); }
其中:
Object next():返回叠代器剛越過的元素的引用,返回值是Object,需要強制轉換成自己需要的類型
boolean hasNext():判斷容器內是否還有可供訪問的元素
void remove():刪除叠代器剛越過的元素
對於我們而言,我們只一般只需使用next()、hasNext()兩個方法即可完成叠代。如下:
for(Iterator it = c.iterator(); it.hasNext(); ) { Object o = it.next(); //do something }
前面闡述了Iterator有一個很大的優點,就是我們不必知道集合的內部結果,集合的內部結構、狀態由Iterator來維持,通過統一的方法hasNext()、next()來判斷、獲取下一個元素,至於具體的內部實現我們就不用關心了。接下來我們將弄清楚Iterator的實現。如下就ArrayList的源碼進行分析。
二、各個集合的Iterator的實現
下面就ArrayList的Iterator實現來分析,其實如果我們理解了ArrayList、Hashset、TreeSet的數據結構,內部實現,對於他們是如何實現Iterator也會胸有成竹的。因為ArrayList的內部實現采用數組,所以我們只需要記錄相應位置的索引即可,其方法的實現比較簡單。
2.1、ArrayList的Iterator實現
在ArrayList內部首先是定義一個內部類Itr,該內部類實現Iterator接口,如下:
private class Itr implements Iterator<E> { //do something }
而ArrayList的iterator()方法實現:
public Iterator<E> iterator() { return new Itr(); }
所以通過使用ArrayList.iterator()方法返回的是Itr()內部類,所以現在我們需要關心的就是Itr()內部類的實現:
在Itr內部定義了三個int型的變量:cursor、lastRet、expectedModCount。其中cursor表示下一個元素的索引位置,lastRet表示上一個元素的索引位置
int cursor; int lastRet = -1; int expectedModCount = modCount;
從cursor、lastRet定義可以看出,lastRet一直比cursor少一所以hasNext()實現方法異常簡單,只需要判斷cursor和lastRet是否相等即可。
public boolean hasNext() { return cursor != size; }
對於next()實現其實也是比較簡單的,只要返回cursor索引位置處的元素即可,然後修改cursor、lastRet即可,
public E next() { checkForComodification(); int i = cursor; //記錄索引位置 if (i >= size) //如果獲取元素大於集合元素個數,則拋出異常 throw new NoSuchElementException(); Object[] elementData = ArrayList.this.elementData; if (i >= elementData.length) throw new ConcurrentModificationException(); cursor = i + 1; //cursor + 1 return (E) elementData[lastRet = i]; //lastRet + 1 且返回cursor處元素 }
checkForComodification()主要用來判斷集合的修改次數是否合法,即用來判斷遍歷過程中集合是否被修改過。modCount用於記錄ArrayList集合的修改次數,初始化為0,每當集合被修改一次(結構上面的修改,內部update不算),如add、remove等方法,modCount + 1,所以如果modCount不變,則表示集合內容沒有被修改。該機制主要是用於實現ArrayList集合的快速失敗機制,在Java的集合中,較大一部分集合是存在快速失敗機制的。所以要保證在遍歷過程中不出錯誤,我們就應該保證在遍歷過程中不會對集合產生結構上的修改(當然remove方法除外),出現了異常錯誤,我們就應該認真檢查程序是否出錯而不是catch後不做處理。
final void checkForComodification() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); }
對於remove()方法的是實現,它是調用ArrayList本身的remove()方法刪除lastRet位置元素,然後修改modCount即可。
public void remove() { if (lastRet < 0) throw new IllegalStateException(); checkForComodification(); try { ArrayList.this.remove(lastRet); cursor = lastRet; lastRet = -1; expectedModCount = modCount; } catch (IndexOutOfBoundsException ex) { throw new ConcurrentModificationException(); } }
這裏就對ArrayList的Iterator實現講解到這裏,對於Hashset、TreeSet等集合的Iterator實現,各位如果感興趣可以繼續研究,個人認為在研究這些集合的源碼之前,有必要對該集合的數據結構有清晰的認識,這樣會達到事半功倍的效果!!!!
Iterator——叠代接口