JAVA泛型-型別擦除太噁心,但專案中大量使用,以及型別擦除引起的問題及解決方法
泛型概念的提出(為什麼需要泛型)?
首先,我們看下下面這段簡短的程式碼:
1 public class GenericTest {
2
3 public static void main(String[] args) {
4 List list = new ArrayList();
5 list.add("qqyumidi");
6 list.add("corn");
7 list.add(100);
8
9 for (int i = 0; i < list.size(); i++) {
10 String name = (String) list.get(i); // 1
11 System.out.println("name:" + name);
12 }
13 }
14 }
定義了一個List型別的集合,先向其中加入了兩個字串型別的值,隨後加入一個Integer型別的值。這是完全允許的,因為此時list預設的型別為Object型別。在之後的迴圈中,由於忘記了之前在list中也加入了Integer型別的值或其他編碼原因,很容易出現類似於//1中的錯誤。因為編譯階段正常,而執行時會出現“java.lang.ClassCastException”異常。因此,導致此類錯誤編碼過程中不易發現。
在如上的編碼過程中,我們發現主要存在兩個問題:
1.當我們將一個物件放入集合中,集合不會記住此物件的型別,當再次從集合中取出此物件時,改物件的編譯型別變成了Object型別,但其執行時型別任然為其本身型別。
2.因此,//1處取出集合元素時需要人為的強制型別轉化到具體的目標型別,且很容易出現“java.lang.ClassCastException”異常。
那麼有沒有什麼辦法可以使集合能夠記住集合內元素各型別,且能夠達到只要編譯時不出現問題,執行時就不會出現“java.lang.ClassCastException”異常呢?答案就是使用泛型。
二.什麼是泛型?
泛型,即“引數化型別”。一提到引數,最熟悉的就是定義方法時有形參,然後呼叫此方法時傳遞實參。那麼引數化型別怎麼理解呢?顧名思義,就是將型別由原來的具體的型別引數化,類似於方法中的變數引數,此時型別也定義成引數形式(可以稱之為型別形參),然後在使用/呼叫時傳入具體的型別(型別實參)。
看著好像有點複雜,首先我們看下上面那個例子採用泛型的寫法。
1 public class GenericTest {
2
3 public static void main(String[] args) {
4 /*
5 List list = new ArrayList();
6 list.add("qqyumidi");
7 list.add("corn");
8 list.add(100);
9 */
10
11 List<String> list = new ArrayList<String>();
12 list.add("qqyumidi");
13 list.add("corn");
14 //list.add(100); // 1 提示編譯錯誤
15
16 for (int i = 0; i < list.size(); i++) {
17 String name = list.get(i); // 2
18 System.out.println("name:" + name);
19 }
20 }
21 }
採用泛型寫法後,在//1處想加入一個Integer型別的物件時會出現編譯錯誤,通過List<String>,直接限定了list集合中只能含有String型別的元素,從而在//2處無須進行強制型別轉換,因為此時,集合能夠記住元素的型別資訊,編譯器已經能夠確認它是String型別了。
結合上面的泛型定義,我們知道在List<String>中,String是型別實參,也就是說,相應的List介面中肯定含有型別形參。且get()方法的返回結果也直接是此形參型別(也就是對應的傳入的型別實參)。下面就來看看List介面的的具體定義:
1 public interface List<E> extends Collection<E> {
2
3 int size();
4
5 boolean isEmpty();
6
7 boolean contains(Object o);
8
9 Iterator<E> iterator();
10
11 Object[] toArray();
12
13 <T> T[] toArray(T[] a);
14
15 boolean add(E e);
16
17 boolean remove(Object o);
18
19 boolean containsAll(Collection<?> c);
20
21 boolean addAll(Collection<? extends E> c);
22
23 boolean addAll(int index, Collection<? extends E> c);
24
25 boolean removeAll(Collection<?> c);
26
27 boolean retainAll(Collection<?> c);
28
29 void clear();
30
31 boolean equals(Object o);
32
33 int hashCode();
34
35 E get(int index);
36
37 E set(int index, E element);
38
39 void add(int index, E element);
40
41 E remove(int index);
42
43 int indexOf(Object o);
44
45 int lastIndexOf(Object o);
46
47 ListIterator<E> listIterator();
48
49 ListIterator<E> listIterator(int index);
50
51 List<E> subList(int fromIndex, int toIndex);
52 }
我們可以看到,在List介面中採用泛型化定義之後,<E>中的E表示型別形參,可以接收具體的型別實參,並且此介面定義中,凡是出現E的地方均表示相同的接受自外部的型別實參。
自然的,ArrayList作為List介面的實現類,其定義形式是:
1 public class ArrayList<E> extends AbstractList<E>
2 implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
3
4 public boolean add(E e) {
5 ensureCapacityInternal(size + 1); // Increments modCount!!
6 elementData[size++] = e;
7 return true;
8 }
9
10 public E get(int index) {
11 rangeCheck(index);
12 checkForComodification();
13 return ArrayList.this.elementData(offset + index);
14 }
15
16 //...省略掉其他具體的定義過程
17
18 }
由此,我們從原始碼角度明白了為什麼//1處加入Integer型別物件編譯錯誤,且//2處get()到的型別直接就是String型別了。
三.自定義泛型介面、泛型類和泛型方法
從上面的內容中,大家已經明白了泛型的具體運作過程。也知道了介面、類和方法也都可以使用泛型去定義,以及相應的使用。是的,在具體使用時,可以分為泛型介面、泛型類和泛型方法。
自定義泛型介面、泛型類和泛型方法與上述Java原始碼中的List、ArrayList類似。如下,我們看一個最簡單的泛型類和方法定義:
1 public class GenericTest {
2
3 public static void main(String[] args) {
4
5 Box<String> name = new Box<String>("corn");
6 System.out.println("name:" + name.getData());
7 }
8
9 }
10
11 class Box<T> {
12
13 private T data;
14
15 public Box() {
16
17 }
18
19 public Box(T data) {
20 this.data = data;
21 }
22
23 public T getData() {
24 return data;
25 }
26
27 }
在泛型介面、泛型類和泛型方法的定義過程中,我們常見的如T、E、K、V等形式的引數常用於表示泛型形參,由於接收來自外部使用時候傳入的型別實參。那麼對於不同傳入的型別實參,生成的相應物件例項的型別是不是一樣的呢?
1 public class GenericTest {
2
3 public static void main(String[] args) {
4
5 Box<String> name = new Box<String>("corn");
6 Box<Integer> age = new Box<Integer>(712);
7
8 System.out.println("name class:" + name.getClass()); // com.qqyumidi.Box
9 System.out.println("age class:" + age.getClass()); // com.qqyumidi.Box
10 System.out.println(name.getClass() == age.getClass()); // true
11
12 }
13
14 }
由此,我們發現,在使用泛型類時,雖然傳入了不同的泛型實參,但並沒有真正意義上生成不同的型別,傳入不同泛型實參的泛型類在記憶體上只有一個,即還是原來的最基本的型別(本例項中為Box),當然,在邏輯上我們可以理解成多個不同的泛型型別。
究其原因,在於Java中的泛型這一概念提出的目的,導致其只是作用於程式碼編譯階段,在編譯過程中,對於正確檢驗泛型結果後,會將泛型的相關資訊擦出,也就是說,成功編譯過後的class檔案中是不包含任何泛型資訊的。泛型資訊不會進入到執行時階段。
對此總結成一句話:泛型型別在邏輯上看以看成是多個不同的型別,實際上都是相同的基本型別。
四.型別萬用字元
接著上面的結論,我們知道,Box<Number>和Box<Integer>實際上都是Box型別,現在需要繼續探討一個問題,那麼在邏輯上,類似於Box<Number>和Box<Integer>是否可以看成具有父子關係的泛型型別呢?
為了弄清這個問題,我們繼續看下下面這個例子:
1 public class GenericTest {
2
3 public static void main(String[] args) {
4
5 Box<Number> name = new Box<Number>(99);
6 Box<Integer> age = new Box<Integer>(712);
7
8 getData(name);
9
10 //The method getData(Box<Number>) in the type GenericTest is
11 //not applicable for the arguments (Box<Integer>)
12 getData(age); // 1
13
14 }
15
16 public static void getData(Box<Number> data){
17 System.out.println("data :" + data.getData());
18 }
19
20 }
我們發現,在程式碼//1處出現了錯誤提示資訊:The method getData(Box<Number>) in the t ype GenericTest is not applicable for the arguments (Box<Integer>)。顯然,通過提示資訊,我們知道Box<Number>在邏輯上不能視為Box<Integer>的父類。那麼,原因何在呢?
1 public class GenericTest {
2
3 public static void main(String[] args) {
4
5 Box<Integer> a = new Box<Integer>(712);
6 Box<Number> b = a; // 1
7 Box<Float> f = new Box<Float>(3.14f);
8 b.setData(f); // 2
9
10 }
11
12 public static void getData(Box<Number> data) {
13 System.out.println("data :" + data.getData());
14 }
15
16 }
17
18 class Box<T> {
19
20 private T data;
21
22 public Box() {
23
24 }
25
26 public Box(T data) {
27 setData(data);
28 }
29
30 public T getData() {
31 return data;
32 }
33
34 public void setData(T data) {
35 this.data = data;
36 }
37
38 }
這個例子中,顯然//1和//2處肯定會出現錯誤提示的。在此我們可以使用反證法來進行說明。
假設Box<Number>在邏輯上可以視為Box<Integer>的父類,那麼//1和//2處將不會有錯誤提示了,那麼問題就出來了,通過getData()方法取出資料時到底是什麼型別呢?Integer? Float? 還是Number?且由於在程式設計過程中的順序不可控性,導致在必要的時候必須要進行型別判斷,且進行強制型別轉換。顯然,這與泛型的理念矛盾,因此,在邏輯上Box<Number>不能視為Box<Integer>的父類。
好,那我們回過頭來繼續看“型別萬用字元”中的第一個例子,我們知道其具體的錯誤提示的深層次原因了。那麼如何解決呢?總部能再定義一個新的函式吧。這和Java中的多型理念顯然是違背的,因此,我們需要一個在邏輯上可以用來表示同時是Box<Integer>和Box<Number>的父類的一個引用型別,由此,型別萬用字元應運而生。
型別萬用字元一般是使用 ? 代替具體的型別實參。注意了,此處是型別實參,而不是型別形參!且Box<?>在邏輯上是Box<Integer>、Box<Number>...等所有Box<具體型別實參>的父類。由此,我們依然可以定義泛型方法,來完成此類需求。
1 public class GenericTest {
2
3 public static void main(String[] args) {
4
5 Box<String> name = new Box<String>("corn");
6 Box<Integer> age = new Box<Integer>(712);
7 Box<Number> number = new Box<Number>(314);
8
9 getData(name);
10 getData(age);
11 getData(number);
12 }
13
14 public static void getData(Box<?> data) {
15 System.out.println("data :" + data.getData());
16 }
17
18 }
有時候,我們還可能聽到型別萬用字元上限和型別萬用字元下限。具體有是怎麼樣的呢?
在上面的例子中,如果需要定義一個功能類似於getData()的方法,但對型別實參又有進一步的限制:只能是Number類及其子類。此時,需要用到型別萬用字元上限。
1 public class GenericTest {
2
3 public static void main(String[] args) {
4
5 Box<String> name = new Box<String>("corn");
6 Box<Integer> age = new Box<Integer>(712);
7 Box<Number> number = new Box<Number>(314);
8
9 getData(name);
10 getData(age);
11 getData(number);
12
13 //getUpperNumberData(name); // 1
14 getUpperNumberData(age); // 2
15 getUpperNumberData(number); // 3
16 }
17
18 public static void getData(Box<?> data) {
19 System.out.println("data :" + data.getData());
20 }
21
22 public static void getUpperNumberData(Box<? extends Number> data){
23 System.out.println("data :" + data.getData());
24 }
25
26 }
此時,顯然,在程式碼//1處呼叫將出現錯誤提示,而//2 //3處呼叫正常。
型別萬用字元上限通過形如Box<? extends Number>形式定義,相對應的,型別萬用字元下限為Box<? super Number>形式,其含義與型別萬用字元上限正好相反,在此不作過多闡述了。
五.話外篇
本文中的例子主要是為了闡述泛型中的一些思想而簡單舉出的,並不一定有著實際的可用性。另外,一提到泛型,相信大家用到最多的就是在集合中,其實,在實際的程式設計過程中,自己可以使用泛型去簡化開發,且能很好的保證程式碼質量。並且還要注意的一點是,Java中沒有所謂的泛型陣列一說。
對於泛型,最主要的還是需要理解其背後的思想和目的。
型別擦除引起的問題及解決方法
因為種種原因,Java不能實現真正的泛型,只能使用型別擦除來實現偽泛型,這樣雖然不會有型別膨脹的問題,但是也引起了許多新的問題。所以,Sun對這些問題作出了許多限制,避免我們犯各種錯誤。
1、先檢查,在編譯,以及檢查編譯的物件和引用傳遞的問題
既然說型別變數會在編譯的時候擦除掉,那為什麼我們往ArrayList<String> arrayList=new ArrayList<String>();所建立的陣列列表arrayList中,不能使用add方法新增整形呢?不是說泛型變數Integer會在編譯時候擦除變為原始型別Object嗎,為什麼不能存別的型別呢?既然型別擦除了,如何保證我們只能使用泛型變數限定的型別呢?
java是如何解決這個問題的呢?java編譯器是通過先檢查程式碼中泛型的型別,然後再進行型別擦除,在進行編譯的。舉個例子說明:
- publicstaticvoid main(String[] args) {
- ArrayList<String> arrayList=new ArrayList<String>();
- arrayList.add("123");
- arrayList.add(123);//編譯錯誤
- }
那麼,這麼型別檢查是針對誰的呢?我們先看看引數化型別與原始型別的相容
- ArrayList arrayList=new ArrayList();
- ArrayList<String> arrayList=new ArrayList<String>();
如果是與以前的程式碼相容,各種引用傳值之間,必然會出現如下的情況:
- ArrayList<String> arrayList1=new ArrayList(); //第一種 情況
- ArrayList arrayList2=new ArrayList<String>();//第二種 情況
這樣是沒有錯誤的,不過會有個編譯時警告。
不過在第一種情況,可以實現與 完全使用泛型引數一樣的效果,第二種則完全沒效果。
因為,本來型別檢查就是編譯時完成的。new ArrayList()只是在記憶體中開闢一個儲存空間,可以儲存任何的型別物件。而真正涉及型別檢查的是它的引用,因為我們是使用它引用arrayList1 來呼叫它的方法,比如說呼叫add()方法。所以arrayList1引用能完成泛型型別的檢查。
而引用arrayList2沒有使用泛型,所以不行。
舉例子:
- publicclass Test10 {
- publicstaticvoid main(String[] args) {
- //
- ArrayList<String> arrayList1=new ArrayList();
- arrayList1.add("1");//編譯通過
- arrayList1.add(1);//編譯錯誤
- String str1=arrayList1.get(0);//返回型別就是String
- ArrayList arrayList2=new ArrayList<String>();
- arrayList2.add("1");//編譯通過
- arrayList2.add(1);//編譯通過
- Object object=arrayList2.get(0);//返回型別就是Object
- new ArrayList<String>().add("11");//編譯通過
- new ArrayList<String>().add(22);//編譯錯誤
- String string=new ArrayList<String>().get(0);//返回型別就是String
- }
- }
通過上面的例子,我們可以明白,型別檢查就是針對引用的,誰是一個引用,用這個引用呼叫泛型方法,就會對這個引用呼叫的方法進行型別檢測,而無關它真正引用的物件。
從這裡,我們可以再討論下 泛型中引數化型別為什麼不考慮繼承關係
在Java中,像下面形式的引用傳遞是不允許的:
- ArrayList<String> arrayList1=new ArrayList<Obj