1. 程式人生 > >Java Class檔案詳解

Java Class檔案詳解

Java Class檔案中包含以下資訊:

ClassFile {
 
u4 magic;                                  //模數
u2 minor_version;                          //次版本號
u2 major_version;                          //主版本號
u2 constant_pool_count;                    //常量池大小
cp_info constant_pool[constant_pool_count-1];   //常量池
u2 access_flags;                            //類和介面層次的訪問標誌(通過|運算得到)
u2 this_class;                                                                       //類索引(指向常量池中的類常量)
u2 super_class;                                //父類索引(指向常量池中的類常量)
u2 interfaces_count;                           //介面索引計數器
u2 interfaces[interfaces_count];               //介面索引集合
u2 fields_count;                               //欄位數量計數器
field_info fields[fields_count];              //欄位表集合
u2 methods_count;                              //方法數量計數器
method_info methods[methods_count];            //方法表集合
u2 attributes_count;                           //屬性個數
attribute_info attributes[attributes_count];   //屬性表
 
}


1. 通過例項來看

public interface InterA {
 
    voidinterA();
}
public interface InterB {
    String interB(inti);
}
public interface InterC {
    voidinterC();
}
public class Base implementsInterA {
 
    private int baseInt;
    protected String baseString;
 
    public int getBaseInt() {
        returnbaseInt;
    }
    public void setBaseInt(intbaseInt) {
        this.baseInt = baseInt;
    }
 
    @Override
    public void interA() {
        System.out.println("the interA in Base");
    }
}
 
 public class Sub extends Base implements InterB, InterC {
 
    private int subInt;
    private static String subString;
    private static Object subObject;
 
    public int getSubInt() {
        return subInt;
    }
    public void setSubInt(intsubInt) {
        this.subInt = subInt;
    }
    public static String getSubString() {
        return subString;
    }
    public static void setSubString(String subString) {
        Sub.subString = subString;
    }
    public static Object getSubObject() {
        return subObject;
    }
    public static void setSubObject(Object subObject) {
        Sub.subObject = subObject;
    }
 
    @Override
    public void interC() {
        System.out.println("the interC in Sub");
    }
 
    @Override
    public String interB(inti) {
        return "the interB in Sub";
    }
}

我們使用WinHex檢視Sub類的.class檔案:

2. 魔數

作用:確定該檔案是否是虛擬機器可接受的class檔案。java的魔數統一為 0xCAFEBABE (來源於一款咖啡)。

區域:檔案第0~3位元組。

3. 版本號

作用:表示class檔案的版本,由minorversion和majorversion組成。

區域:檔案第4~7位元組。

51代表,jdk為1.7.0

需要注意的是java版本號是從45開始的,大版本釋出,主版本號+1.高版本的jdk能向下相容以前版本的class檔案,但不相容以後版本的class檔案。

4. 常量池

常量池的大小是不固定的,根據你的類中的常量的多少而定,所以在常量池的入口,放置了一個u2型別的表示常量池中常量個數的常量池容量計數器。計數器從1開始,第0位有特殊含義,表示指向常量池的索引值資料不引用

任何一個常量池專案。池中的資料項就像陣列一樣是通過索引訪問的。

我們可以清楚的看到,我們常量池中有63-1=62個常量。這些常量是什麼呢?

要存放字面量Literal和符號引用Symbolic References。

字面量可能是文字字串,或final的常量值。
符號引用包括以下:

  • 類或介面全限定名 Full Qualified Name
  • 欄位名稱和描述符 Descriptor
  • 方法名稱和描述符

我們使用反編譯工具檢視一下:

E:\program\JVM\bin\com\gissky\clazz>javap -v Sub.class
Classfile /E:/program/JVM/bin/com/gissky/clazz/Sub.class
  Last modified 2015-2-22; size 1363bytes
  MD5 checksum 2dc77c79e4790422407eb7092085883c
  Compiled from "Sub.java"
publicclass com.gissky.clazz.Sub extendscom.gissky.clazz.Base implementscom.gissky.clazz.InterB,com.gissky.clazz.InterC
  SourceFile:"Sub.java"
  minor version: 0
  major version: 51
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1= Class              #2    //  com/gissky/clazz/Sub    →類和介面的全限定名    
   #2= Utf8               com/gissky/clazz/Sub
   #3= Class              #4            //  com/gissky/clazz/Base
   #4= Utf8               com/gissky/clazz/Base
   #5= Class              #6            //  com/gissky/clazz/InterB
   #6= Utf8               com/gissky/clazz/InterB
   #7= Class              #8            //  com/gissky/clazz/InterC
   #8= Utf8               com/gissky/clazz/InterC
   #9= Utf8               subInt 
  #10= Utf8              I 
  #11= Utf8              subString
  #12= Utf8               Ljava/lang/String;
  #13= Utf8               subObject
  #14= Utf8               Ljava/lang/Object;
  #15= Utf8               <init>
  #16= Utf8               ()V
  #17= Utf8               Code
  #18= Methodref          #3.#19        //  com/gissky/clazz/Base."<init>":()V
  #19= NameAndType        #15:#16       //  "<init>":()V
  #20= Utf8               LineNumberTable
  #21= Utf8               LocalVariableTable
  #22= Utf8               this
  #23= Utf8               Lcom/gissky/clazz/Sub;
  #24= Utf8               getSubInt
  #25= Utf8               ()I 
  #26= Fieldref           #1.#27  //com/gissky/clazz/Sub.subInt:I → 類中欄位的符號引用
  #27= NameAndType        #9:#10        //  subInt:I                                     → 類中欄位的部分符號引用之名稱和型別
  #28= Utf8               setSubInt
  #29= Utf8               (I)V
  #30= Utf8               getSubString
  #31= Utf8               ()Ljava/lang/String;
  #32= Fieldref           #1.#33        //  com/gissky/clazz/Sub.subString:Ljava/lang/String;
  #33= NameAndType        #11:#12       //  subString:Ljava/lang/String;
  #34= Utf8               setSubString
  #35= Utf8               (Ljava/lang/String;)V
  #36= Utf8               getSubObject
  #37= Utf8               ()Ljava/lang/Object;
  #38= Fieldref           #1.#39        //  com/gissky/clazz/Sub.subObject:Ljava/lang/Object;
  #39= NameAndType        #13:#14       //  subObject:Ljava/lang/Object;
  #40= Utf8               setSubObject
  #41= Utf8               (Ljava/lang/Object;)V
  #42= Utf8               interC
  #43= Fieldref           #44.#46       //  java/lang/System.out:Ljava/io/PrintStream;
  #44= Class              #45           //  java/lang/System
  #45= Utf8               java/lang/System
  #46= NameAndType        #47:#48       //  out:Ljava/io/PrintStream;
  #47= Utf8               out
  #48= Utf8               Ljava/io/PrintStream;
  #49= String             #50           //  the interC in Sub
  #50= Utf8               the interC in Sub
  #51= Methodref          #52.#54       //  java/io/PrintStream.println:(Ljava/lang/String;)V
  #52= Class              #53           //  java/io/PrintStream
  #53= Utf8               java/io/PrintStream
  #54= NameAndType        #55:#35       //  println:(Ljava/lang/String;)V
  #55= Utf8               println
  #56= Utf8               interB
  #57= Utf8               (I)Ljava/lang/String;
  #58= String             #59           //  the interB in Sub                                    →方法中用到的String常量
  #59= Utf8               the interB in Sub
  #60= Utf8               i
  #61= Utf8               SourceFile
  #62= Utf8               Sub.java

常量池中的專案型別如下:

  • CONSTANT_Utf8_info      tag標誌位為1,   UTF-8編碼的字串
  • CONSTANT_Integer_info  tag標誌位為3, 整形字面量
  • CONSTANT_Float_info     tag標誌位為4, 浮點型字面量
  • CONSTANT_Long_info     tag標誌位為5, 長整形字面量
  • CONSTANT_Double_info  tag標誌位為6, 雙精度字面量
  • CONSTANT_Class_info    tag標誌位為7, 類或介面的符號引用
  • CONSTANT_String_info    tag標誌位為8,字串型別的字面量
  • CONSTANT_Fieldref_info  tag標誌位為9,  欄位的符號引用
  • CONSTANT_Methodref_info  tag標誌位為10,類中方法的符號引用
  • CONSTANT_InterfaceMethodref_info tag標誌位為11, 介面中方法的符號引用
  • CONSTANT_NameAndType_info tag 標誌位為12,欄位和方法的名稱以及型別的符號引用

5. 類或介面訪問標誌

表示類或者介面方面的訪問資訊,比如Class表示的是類還是介面,是否為public、static、final等。,下面我們就來看看TestClass的訪問標示。Class的訪問標誌值為0×0021:

根據前面說的各種訪問標示的標誌位,我們可以知道:0×0021=0×0001|0×0020 也即ACC_PUBLIC 和 ACC_SUPER為真,其中ACC_PUBLIC大家好理解,ACC_SUPER是jdk1.2之後編譯的類都會帶有的標誌。

6. 類索引、父類索引與介面索引集合

Class檔案中由這3項資料來確定類的繼承關係。

類索引和父類索引都是指向常量池中的常量索引:

緊接著後面是一個介面的計數器和介面描述符:

7. 欄位表集合

作用:描述介面或者類中宣告的類變數以及例項變數,不包括方法中的區域性變數。

緊接著介面索引集合之後的2位元組是欄位計數器:

表示我們類中有3個欄位,這裡便是subInt、subString、subObject 3個欄位。緊接其後的是欄位表,欄位表結構為:

field_info
{
    u2                               access_flags; 
    u2                               name_index; 
    u2                               descriptor_index; 
    u2                               attributes_count; 
    attribute_info          attributes[attributes_count]; 
}

access_flags項的值是用於定義欄位被訪問許可權和基礎屬性的掩碼標誌。取值範圍如下表:

描述符標識字元含義:

V 表示特殊型別void。

對於陣列型別,每一個維度將使用一個前置的”["字元來描述,如一個定義的"java.lang.String[][]“型別的二維陣列,將被記錄為:”[[Ljava/lang/String;",一個整型陣列"int[]“將被記錄為”[I"

父類中的欄位不會出現在子類的欄位表中。

8. 方法表集合

欄位表集合結束後便是方法表集合。

作用:描述該類中的方法。

和欄位表一樣,使用一個u2型別的方法計數器,記錄該類中方法的個數。

表示我們的類中有9個方法。

方法表的結構如下圖所示

其中name_index和descriptor_index表示的是方法的名稱和描述符,他們分別是指向常量池的索引。這裡需要結解釋一下方法的描述符,方法的描述符的結構為:(引數列表)返回值,比如public int instanceMethod(int param)的描述符為:(I)I,表示帶有一個int型別引數且返回值也為int型別的方法,方法java.lang.String.toString()的描述符為"()Ljava/lang/String;",int IndexOf(char[] source,int sourceOffset,int sourceCount,char[] target int targetOffset,int targetCount,int fromIndex) 表示為([CII[CII)I。接下來就是屬性數量以及屬性表了,方法表和欄位表雖然都有 屬性數量和屬性表,但是他們裡面所包含的屬性是不同。

如果父類方法在子類中沒有被重寫(@Override),方法表中就不會出現來自父類的方法資訊。

9. 屬性表集合

上面的方法表中我們就看到<init>方法有一個Code的屬性。在本節我們將闡述這些屬性:

Code屬性:

該屬性裡主要存放由javac編譯器處理後得到的位元組碼指令。

其中attribute_name_index指向常量池中值為Code的常量,attribute_length的長度表示Code屬性表的長度(這裡 需要注意的時候長度不包括attribute_name_index和attribute_length的6個位元組的長度)。

max_stack表示最大棧深度,虛擬機器在執行時根據這個值來分配棧幀中運算元的深度,而max_locals代表了局部變量表所需的儲存空間。

max_locals的單位為slot,slot是虛擬機器為區域性變數分配記憶體的最小單元,在執行時,對於不超過32位型別的資料型別,比如 byte,char,int等佔用1個slot,而double和Long這種64位的資料型別則需要分配2個slot,另外max_locals的值並不是所有區域性變數所需要的記憶體數量之和,因為slot是可以重用的,當局部變數超過了它的作用域以後,區域性變數所佔用的slot就會被重用。方法引數、顯示異常處理器的引數、方法體中定義的區域性變數都要使用區域性變量表來存放。

code_length代表了位元組碼指令的數量,而code表示的是位元組碼指令,從上圖可以知道code的型別為u1,一個u1型別的取值為0x00-0xFF,對應的十進位制為0-255,目前虛擬機器規範已經定義了200多條指令。

exception_table_length以及exception_table分別代表方法對應的異常資訊。

attributes_count和attribute_info分別表示了Code屬性中的屬性數量和屬性表,從這裡可以看出Class的檔案結構中,屬性表是很靈活的,它可以存在於Class檔案,方法表,欄位表以及Code屬性中。

修改一下Sub中的InterB方法:

@Override
 
   public int interB(inti){
       int x=0;
       try{
           x+=i;
           return x;
       }catch(Exception e){
           x=-1;
           return x;
       }finally{
           x=3;
       }
   }


大家不妨先猜一下這個函式的結果是什麼?假如在try塊中發生異常,結構又是什麼?我相信對Java語言熟悉的朋友,肯定知道答案。<a href="http://images.cnitblog.com/blog/692756/201502/222239118613000.gif" 0="rel=" lightbox[15161]”"="" title="”em1″" class="external" rel="nofollow" target="_blank" style="border: 0px; margin: 0px; padding: 0px; text-decoration: none; color: rgb(0, 153, 204);">em1

使用反編譯工具檢視:

public int interB(int);
 
    flags: ACC_PUBLIC
 
    Code:
 
      stack=2, locals=6, args_size=2
 
         0: iconst_0
 
         1: istore_2
 
         2: iload_2
 
         3: iload_1
 
         4: iadd
 
         5: istore_2
 
         6: iload_2
 
         7: istore        5
 
         9: iconst_3
 
        10: istore_2
 
        11: iload         5
 
        13: ireturn
 
        14: astore_3
 
        15: iconst_m1
 
        16: istore_2
 
        17: iload_2
 
        18: istore        5
 
        20: iconst_3
 
        21: istore_2
 
        22: iload         5
 
        24: ireturn
 
        25: astore        4
 
        27: iconst_3
 
        28: istore_2
 
        29: aload         4
 
        31: athrow
 
      Exception table:
 
         from    to   target    type
 
             2      9       14         Class java/lang/Exception
 
             2      9       25         any
 
            14     20    25         any
 
      LineNumberTable:
 
        line35:0
 
        line37:2
 
        line38:6
 
        line43:9
 
        line38:11
 
        line39:14
 
        line40:15
 
        line41:17
 
        line43:20
 
        line41:22
 
        line42:25
 
        line43:27
 
        line44:29
 
      LocalVariableTable:
 
        Start  Length  Slot  Name   Signature
 
               0     32        0      this         Lcom/gissky/clazz/Sub;
 
               0     32        1        i             I
 
               2     30        2        x            I
 
              15   10        3        e            Ljava/lang/Exception;
 
      StackMapTable: number_of_entries = 2
 
           frame_type = 255/* full_frame */
 
          offset_delta = 14
 
          locals = [ class com/gissky/clazz/Sub, int, int ]
 
          stack = [ class java/lang/Exception ]
 
           frame_type = 74 /* same_locals_1_stack_item */
 
          stack = [ classjava/lang/Throwable ]
 
}

從 args_size=2這條反編譯程式碼,我們可以知道,在public int interB(int i)這個方法中有6個區域性變數,2個引數,可是我們的函式中明明只有一個引數麼……這是因為編譯器會為每一個例項函式包括構造器新增一個引數this,在JVM呼叫該方法的時候會該形參傳遞一個實參—方法所在物件的自身。

Exception table:

from    to   target    type

2       9       14         Class java/lang/Exception

2       9       25         any

14      20    25         any

上表表頭表示,當位元組碼在form行到to行(不包括to行)出現型別為type的異常,則轉到第target行繼續處理。

從方法的異常表中,我們可以看到這個函式有3條執行路徑:

這裡我們插入闡述一下LineNumberTable表的含義:它表示Java原始碼行號與位元組碼行號之間的對應關係。

知道了該方法執行的3條路徑,我們也就知道剛才我們的那個問題有3個答案:沒有異常是為x+i;try塊中出現Exception型別的錯誤時,返回-1;出現Exception以外的任何異常方法非正常結束,沒有返回值。

LocalVariableTable:

Start  Length  Slot  Name   Signature

0      32        0      this         Lcom/gissky/clazz/Sub;

0      32        1        i             I

2      30        2        x            I

15    10        3        e            Ljava/lang/Exception;

LocalVariableTable表示區域性變量表,描述方法中區域性變數。

如果你對返回的答案能理解的話,那麼我相信你也肯定知道,我們函式中只有4個引數,但max_locals卻等於6。不懂的話仔細看一下Code中位元組碼的執行過程變可以理解了。

一個方法在執行時需要多大的區域性變數空間在編譯時期就知道了,方法執行期間不會改變區域性變量表的大小。

Signature 屬性:

該屬性是在JDK1.5新增的。該屬性可用於類、屬性表和方法表結構的屬性表中。使用泛型簽名如果包含了型別變數(Type Variables)或引數化型別(Parameterized Types),則Signature 屬性會為它記錄泛型簽名信息。當我們要泛型類中拿到泛型的實際型別的時候非常有用。

例項:

在使用Hibernate時,我習慣將為Dao層封裝一個泛型基類,來放置一些通用的方法,而Hibernate有很多方法都要傳遞一個POJO的型別,然後進行查詢,如load方法。我們構建這樣的一個基類:

public abstract class BaseDaoImpl<T, PK extends Serializable> extends HibernateDaoSupport implements BaseDao<T, PK>

那麼load中要使用的POJO型別便是T的實際型別。怎麼來那倒這個屬性呢?這裡邊要使用到Signature屬性了。

public abstract class BaseDaoImpl<T, PK extends Serializable> extends HibernateDaoSupport implements BaseDao<T, PK> {
 
    private Class<T> entityClass;
 
    @SuppressWarnings("unchecked")
    public BaseDaoImpl() {
        //class OrgDao extends BaseDaoImpl<Organization, String> implements OrgDao {}
        Class c = this.getClass();//返回的是使用new建立的泛型類對應的物件的class物件。
        Type type = c.getGenericSuperclass(); //取得該物件的泛型類
        //取得泛型對應的真正的class,並放到陣列中
        Type[] types = ((ParameterizedType)type).getActualTypeArguments();
        entityClass = (Class<T>) types[0];
    }

這時,getById中就可以直接使用了:
public T getById(PK id) {
    return(T) getHibernateTemplate().load(entityClass, id);
}