1. 程式人生 > >JAVA泛型-型別擦除太噁心,但專案中大量使用,以及型別擦除引起的問題及解決方法

JAVA泛型-型別擦除太噁心,但專案中大量使用,以及型別擦除引起的問題及解決方法

泛型概念的提出(為什麼需要泛型)?

首先,我們看下下面這段簡短的程式碼:

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4         List list = new ArrayList();
 5         list.add("qqyumidi");
 6         list.add("corn");
 7         list.add(100);
 8 
 9         for (int i = 0; i < list.size(); i++) {
10
String name = (String) list.get(i); // 1 11 System.out.println("name:" + name); 12 } 13 } 14 }
複製程式碼

定義了一個List型別的集合,先向其中加入了兩個字串型別的值,隨後加入一個Integer型別的值。這是完全允許的,因為此時list預設的型別為Object型別。在之後的迴圈中,由於忘記了之前在list中也加入了Integer型別的值或其他編碼原因,很容易出現類似於//1中的錯誤。因為編譯階段正常,而執行時會出現“java.lang.ClassCastException”異常。因此,導致此類錯誤編碼過程中不易發現。

 在如上的編碼過程中,我們發現主要存在兩個問題:

1.當我們將一個物件放入集合中,集合不會記住此物件的型別,當再次從集合中取出此物件時,改物件的編譯型別變成了Object型別,但其執行時型別任然為其本身型別。

2.因此,//1處取出集合元素時需要人為的強制型別轉化到具體的目標型別,且很容易出現“java.lang.ClassCastException”異常。

那麼有沒有什麼辦法可以使集合能夠記住集合內元素各型別,且能夠達到只要編譯時不出現問題,執行時就不會出現“java.lang.ClassCastException”異常呢?答案就是使用泛型。

二.什麼是泛型?

泛型,即“引數化型別”。一提到引數,最熟悉的就是定義方法時有形參,然後呼叫此方法時傳遞實參。那麼引數化型別怎麼理解呢?顧名思義,就是將型別由原來的具體的型別引數化,類似於方法中的變數引數,此時型別也定義成引數形式(可以稱之為型別形參),然後在使用/呼叫時傳入具體的型別(型別實參)。

 看著好像有點複雜,首先我們看下上面那個例子採用泛型的寫法。

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4         /*
 5         List list = new ArrayList();
 6         list.add("qqyumidi");
 7         list.add("corn");
 8         list.add(100);
 9         */
10 
11         List<String> list = new ArrayList<String>();
12         list.add("qqyumidi");
13         list.add("corn");
14         //list.add(100);   // 1  提示編譯錯誤
15 
16         for (int i = 0; i < list.size(); i++) {
17             String name = list.get(i); // 2
18             System.out.println("name:" + name);
19         }
20     }
21 }
複製程式碼

採用泛型寫法後,在//1處想加入一個Integer型別的物件時會出現編譯錯誤,通過List<String>,直接限定了list集合中只能含有String型別的元素,從而在//2處無須進行強制型別轉換,因為此時,集合能夠記住元素的型別資訊,編譯器已經能夠確認它是String型別了。

結合上面的泛型定義,我們知道在List<String>中,String是型別實參,也就是說,相應的List介面中肯定含有型別形參。且get()方法的返回結果也直接是此形參型別(也就是對應的傳入的型別實參)。下面就來看看List介面的的具體定義:

複製程式碼
 1 public interface List<E> extends Collection<E> {
 2 
 3     int size();
 4 
 5     boolean isEmpty();
 6 
 7     boolean contains(Object o);
 8 
 9     Iterator<E> iterator();
10 
11     Object[] toArray();
12 
13     <T> T[] toArray(T[] a);
14 
15     boolean add(E e);
16 
17     boolean remove(Object o);
18 
19     boolean containsAll(Collection<?> c);
20 
21     boolean addAll(Collection<? extends E> c);
22 
23     boolean addAll(int index, Collection<? extends E> c);
24 
25     boolean removeAll(Collection<?> c);
26 
27     boolean retainAll(Collection<?> c);
28 
29     void clear();
30 
31     boolean equals(Object o);
32 
33     int hashCode();
34 
35     E get(int index);
36 
37     E set(int index, E element);
38 
39     void add(int index, E element);
40 
41     E remove(int index);
42 
43     int indexOf(Object o);
44 
45     int lastIndexOf(Object o);
46 
47     ListIterator<E> listIterator();
48 
49     ListIterator<E> listIterator(int index);
50 
51     List<E> subList(int fromIndex, int toIndex);
52 }
複製程式碼

我們可以看到,在List介面中採用泛型化定義之後,<E>中的E表示型別形參,可以接收具體的型別實參,並且此介面定義中,凡是出現E的地方均表示相同的接受自外部的型別實參。

自然的,ArrayList作為List介面的實現類,其定義形式是:

複製程式碼
 1 public class ArrayList<E> extends AbstractList<E> 
 2         implements List<E>, RandomAccess, Cloneable, java.io.Serializable {
 3     
 4     public boolean add(E e) {
 5         ensureCapacityInternal(size + 1);  // Increments modCount!!
 6         elementData[size++] = e;
 7         return true;
 8     }
 9     
10     public E get(int index) {
11         rangeCheck(index);
12         checkForComodification();
13         return ArrayList.this.elementData(offset + index);
14     }
15     
16     //...省略掉其他具體的定義過程
17 
18 }
複製程式碼

由此,我們從原始碼角度明白了為什麼//1處加入Integer型別物件編譯錯誤,且//2處get()到的型別直接就是String型別了。

三.自定義泛型介面、泛型類和泛型方法

從上面的內容中,大家已經明白了泛型的具體運作過程。也知道了介面、類和方法也都可以使用泛型去定義,以及相應的使用。是的,在具體使用時,可以分為泛型介面、泛型類和泛型方法。

自定義泛型介面、泛型類和泛型方法與上述Java原始碼中的List、ArrayList類似。如下,我們看一個最簡單的泛型類和方法定義:

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4 
 5         Box<String> name = new Box<String>("corn");
 6         System.out.println("name:" + name.getData());
 7     }
 8 
 9 }
10 
11 class Box<T> {
12 
13     private T data;
14 
15     public Box() {
16 
17     }
18 
19     public Box(T data) {
20         this.data = data;
21     }
22 
23     public T getData() {
24         return data;
25     }
26 
27 }
複製程式碼

在泛型介面、泛型類和泛型方法的定義過程中,我們常見的如T、E、K、V等形式的引數常用於表示泛型形參,由於接收來自外部使用時候傳入的型別實參。那麼對於不同傳入的型別實參,生成的相應物件例項的型別是不是一樣的呢?

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4 
 5         Box<String> name = new Box<String>("corn");
 6         Box<Integer> age = new Box<Integer>(712);
 7 
 8         System.out.println("name class:" + name.getClass());      // com.qqyumidi.Box
 9         System.out.println("age class:" + age.getClass());        // com.qqyumidi.Box
10         System.out.println(name.getClass() == age.getClass());    // true
11 
12     }
13 
14 }
複製程式碼

由此,我們發現,在使用泛型類時,雖然傳入了不同的泛型實參,但並沒有真正意義上生成不同的型別,傳入不同泛型實參的泛型類在記憶體上只有一個,即還是原來的最基本的型別(本例項中為Box),當然,在邏輯上我們可以理解成多個不同的泛型型別。

究其原因,在於Java中的泛型這一概念提出的目的,導致其只是作用於程式碼編譯階段,在編譯過程中,對於正確檢驗泛型結果後,會將泛型的相關資訊擦出,也就是說,成功編譯過後的class檔案中是不包含任何泛型資訊的。泛型資訊不會進入到執行時階段。

對此總結成一句話:泛型型別在邏輯上看以看成是多個不同的型別,實際上都是相同的基本型別。

四.型別萬用字元

接著上面的結論,我們知道,Box<Number>和Box<Integer>實際上都是Box型別,現在需要繼續探討一個問題,那麼在邏輯上,類似於Box<Number>和Box<Integer>是否可以看成具有父子關係的泛型型別呢?

為了弄清這個問題,我們繼續看下下面這個例子:

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4 
 5         Box<Number> name = new Box<Number>(99);
 6         Box<Integer> age = new Box<Integer>(712);
 7 
 8         getData(name);
 9         
10         //The method getData(Box<Number>) in the type GenericTest is 
11         //not applicable for the arguments (Box<Integer>)
12         getData(age);   // 1
13 
14     }
15     
16     public static void getData(Box<Number> data){
17         System.out.println("data :" + data.getData());
18     }
19 
20 }
複製程式碼

我們發現,在程式碼//1處出現了錯誤提示資訊:The method getData(Box<Number>) in the t ype GenericTest is not applicable for the arguments (Box<Integer>)。顯然,通過提示資訊,我們知道Box<Number>在邏輯上不能視為Box<Integer>的父類。那麼,原因何在呢?

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4 
 5         Box<Integer> a = new Box<Integer>(712);
 6         Box<Number> b = a;  // 1
 7         Box<Float> f = new Box<Float>(3.14f);
 8         b.setData(f);        // 2
 9 
10     }
11 
12     public static void getData(Box<Number> data) {
13         System.out.println("data :" + data.getData());
14     }
15 
16 }
17 
18 class Box<T> {
19 
20     private T data;
21 
22     public Box() {
23 
24     }
25 
26     public Box(T data) {
27         setData(data);
28     }
29 
30     public T getData() {
31         return data;
32     }
33 
34     public void setData(T data) {
35         this.data = data;
36     }
37 
38 }
複製程式碼

這個例子中,顯然//1和//2處肯定會出現錯誤提示的。在此我們可以使用反證法來進行說明。

假設Box<Number>在邏輯上可以視為Box<Integer>的父類,那麼//1和//2處將不會有錯誤提示了,那麼問題就出來了,通過getData()方法取出資料時到底是什麼型別呢?Integer? Float? 還是Number?且由於在程式設計過程中的順序不可控性,導致在必要的時候必須要進行型別判斷,且進行強制型別轉換。顯然,這與泛型的理念矛盾,因此,在邏輯上Box<Number>不能視為Box<Integer>的父類。

好,那我們回過頭來繼續看“型別萬用字元”中的第一個例子,我們知道其具體的錯誤提示的深層次原因了。那麼如何解決呢?總部能再定義一個新的函式吧。這和Java中的多型理念顯然是違背的,因此,我們需要一個在邏輯上可以用來表示同時是Box<Integer>和Box<Number>的父類的一個引用型別,由此,型別萬用字元應運而生。

型別萬用字元一般是使用 ? 代替具體的型別實參。注意了,此處是型別實參,而不是型別形參!且Box<?>在邏輯上是Box<Integer>、Box<Number>...等所有Box<具體型別實參>的父類。由此,我們依然可以定義泛型方法,來完成此類需求。

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4 
 5         Box<String> name = new Box<String>("corn");
 6         Box<Integer> age = new Box<Integer>(712);
 7         Box<Number> number = new Box<Number>(314);
 8 
 9         getData(name);
10         getData(age);
11         getData(number);
12     }
13 
14     public static void getData(Box<?> data) {
15         System.out.println("data :" + data.getData());
16     }
17 
18 }
複製程式碼

有時候,我們還可能聽到型別萬用字元上限和型別萬用字元下限。具體有是怎麼樣的呢?

在上面的例子中,如果需要定義一個功能類似於getData()的方法,但對型別實參又有進一步的限制:只能是Number類及其子類。此時,需要用到型別萬用字元上限。

複製程式碼
 1 public class GenericTest {
 2 
 3     public static void main(String[] args) {
 4 
 5         Box<String> name = new Box<String>("corn");
 6         Box<Integer> age = new Box<Integer>(712);
 7         Box<Number> number = new Box<Number>(314);
 8 
 9         getData(name);
10         getData(age);
11         getData(number);
12         
13         //getUpperNumberData(name); // 1
14         getUpperNumberData(age);    // 2
15         getUpperNumberData(number); // 3
16     }
17 
18     public static void getData(Box<?> data) {
19         System.out.println("data :" + data.getData());
20     }
21     
22     public static void getUpperNumberData(Box<? extends Number> data){
23         System.out.println("data :" + data.getData());
24     }
25 
26 }
複製程式碼

此時,顯然,在程式碼//1處呼叫將出現錯誤提示,而//2 //3處呼叫正常。

型別萬用字元上限通過形如Box<? extends Number>形式定義,相對應的,型別萬用字元下限為Box<? super Number>形式,其含義與型別萬用字元上限正好相反,在此不作過多闡述了。

五.話外篇

本文中的例子主要是為了闡述泛型中的一些思想而簡單舉出的,並不一定有著實際的可用性。另外,一提到泛型,相信大家用到最多的就是在集合中,其實,在實際的程式設計過程中,自己可以使用泛型去簡化開發,且能很好的保證程式碼質量。並且還要注意的一點是,Java中沒有所謂的泛型陣列一說。

對於泛型,最主要的還是需要理解其背後的思想和目的。

型別擦除引起的問題及解決方法

因為種種原因,Java不能實現真正的泛型,只能使用型別擦除來實現偽泛型,這樣雖然不會有型別膨脹的問題,但是也引起了許多新的問題。所以,Sun對這些問題作出了許多限制,避免我們犯各種錯誤。

1、先檢查,在編譯,以及檢查編譯的物件和引用傳遞的問題

既然說型別變數會在編譯的時候擦除掉,那為什麼我們往ArrayList<String> arrayList=new ArrayList<String>();所建立的陣列列表arrayList中,不能使用add方法新增整形呢?不是說泛型變數Integer會在編譯時候擦除變為原始型別Object嗎,為什麼不能存別的型別呢?既然型別擦除了,如何保證我們只能使用泛型變數限定的型別呢?

java是如何解決這個問題的呢?java編譯器是通過先檢查程式碼中泛型的型別,然後再進行型別擦除,在進行編譯的。

舉個例子說明:

  1. publicstaticvoid main(String[] args) {  
  2.         ArrayList<String> arrayList=new ArrayList<String>();  
  3.         arrayList.add("123");  
  4.         arrayList.add(123);//編譯錯誤
  5.     }  
在上面的程式中,使用add方法新增一個整形,在eclipse中,直接就會報錯,說明這就是在編譯之前的檢查。因為如果是在編譯之後檢查,型別擦除後,原始型別為Object,是應該執行任意引用型別的新增的。可實際上卻不是這樣,這恰恰說明了關於泛型變數的使用,是會在編譯之前檢查的。

那麼,這麼型別檢查是針對誰的呢?我們先看看引數化型別與原始型別的相容

以ArrayList舉例子,以前的寫法:

  1. ArrayList arrayList=new ArrayList();  
現在的寫法:
  1. ArrayList<String>  arrayList=new ArrayList<String>();  

如果是與以前的程式碼相容,各種引用傳值之間,必然會出現如下的情況:
  1. ArrayList<String> arrayList1=new ArrayList(); //第一種 情況
  1. ArrayList arrayList2=new ArrayList<String>();//第二種 情況

這樣是沒有錯誤的,不過會有個編譯時警告。

不過在第一種情況,可以實現與 完全使用泛型引數一樣的效果,第二種則完全沒效果。

因為,本來型別檢查就是編譯時完成的。new ArrayList()只是在記憶體中開闢一個儲存空間,可以儲存任何的型別物件。而真正涉及型別檢查的是它的引用,因為我們是使用它引用arrayList1 來呼叫它的方法,比如說呼叫add()方法。所以arrayList1引用能完成泛型型別的檢查。

而引用arrayList2沒有使用泛型,所以不行。

舉例子:

  1. publicclass Test10 {  
  2.     publicstaticvoid main(String[] args) {  
  3.         //
  4.         ArrayList<String> arrayList1=new ArrayList();  
  5.         arrayList1.add("1");//編譯通過
  6.         arrayList1.add(1);//編譯錯誤
  7.         String str1=arrayList1.get(0);//返回型別就是String
  8.         ArrayList arrayList2=new ArrayList<String>();  
  9.         arrayList2.add("1");//編譯通過
  10.         arrayList2.add(1);//編譯通過
  11.         Object object=arrayList2.get(0);//返回型別就是Object
  12.         new ArrayList<String>().add("11");//編譯通過
  13.         new ArrayList<String>().add(22);//編譯錯誤
  14.         String string=new ArrayList<String>().get(0);//返回型別就是String
  15.     }  
  16. }  

通過上面的例子,我們可以明白,型別檢查就是針對引用的,誰是一個引用,用這個引用呼叫泛型方法,就會對這個引用呼叫的方法進行型別檢測,而無關它真正引用的物件。

從這裡,我們可以再討論下 泛型中引數化型別為什麼不考慮繼承關係

在Java中,像下面形式的引用傳遞是不允許的:

  1. ArrayList<String> arrayList1=new ArrayList<Obj