1. 程式人生 > >第八周:hashCode()方法 & equals()方法

第八周:hashCode()方法 & equals()方法

數字 string類型 mce product util 面向對象設計 lin att 語言

在Java語言中,equals()和hashCode()兩個函數的使用是緊密配合的,要是自己設計其中一個,就要設計另外一個。在多數情況 下,這兩個函數是不用考慮的,直接使用它們的默認設計就可以了。但是在一些情況下,這兩個函數最好是自己設計,才能確保整個程序的正常運行。最常見的是當 一個對象被加入收集對象(collection object)時,這兩個函數必須自己設計。更細化的定義是:如果你想將一個對象A放入另一個收集對象B裏,或者使用這個對象A為查找一個元對象在收集對 象B裏位置的鑰匙,並支持是否容納,刪除收集對象B裏的元對象這樣的操作,那麽,equals()和hashCode()函數必須開發者自己定義。其他情況下,這兩個函數是不需要定義的。

一、equal()方法

它是用於進行兩個對象的比較的,是對象內容的比較,當然也能用於進行對象參閱值的比較。什麽是對象參閱值的比較?就是兩個參閱變量的值得比較,我們 都知道參閱變量的值其實就是一個數字,這個數字可以看成是鑒別不同對象的代號。兩個對象參閱值的比較,就是兩個數字的比較,兩個代號的比較。這種比較是默 認的對象比較方式,在Object這個對象中,這種方式就已經設計好了。所以你也不用自己來重寫,浪費不必要的時間。

Object類中equals()方法實現如下:

public boolean equals(Object obj) {
    return (this == obj);
}

 通過該實現可以看出,Object類的實現采用了區分度最高的算法,即只要兩個對象不是同一個對象,那麽equals()一定返回false。

雖然我們在定義類時,可以重寫equals()方法,但是有一些註意事項;JDK中說明了實現equals()方法應該遵守的約定:

(1)自反性:x.equals(x)必須返回true。

(2)對稱性:x.equals(y)與y.equals(x)的返回值必須相等。

(3)傳遞性:x.equals(y)為true,y.equals(z)也為true,那麽x.equals(z)必須為true。

(4)一致性:如果對象x和y在equals()中使用的信息都沒有改變,那麽x.equals(y)值始終不變。

(5)非null:x不是null,y為null,則x.equals(y)必須為false。

二、hashCode()方法

1、Object的hashCode()

Object類中hashCode()方法的聲明如下:

public native int hashCode();

可以看出,hashCode()是一個native方法,而且返回值類型是整形;實際上,該native方法將對象在內存中的地址作為哈希碼返回,可以保證不同對象的返回值不同。

與equals()方法類似,hashCode()方法可以被重寫。JDK中對hashCode()方法的作用,以及實現時的註意事項做了說明:

(1)hashCode()在哈希表中起作用,如java.util.HashMap。

(2)如果對象在equals()中使用的信息都沒有改變,那麽hashCode()值始終不變。

(3)如果兩個對象使用equals()方法判斷為相等,則hashCode()方法也應該相等。

(4)如果兩個對象使用equals()方法判斷為不相等,則不要求hashCode()也必須不相等;但是開發人員應該認識到,不相等的對象產生不相同的hashCode可以提高哈希表的性能。

2、hashCode()的作用

總的來說,hashCode()在哈希表中起作用,如HashSet、HashMap等。

當我們向哈希表(如HashSet、HashMap等)中添加對象object時,首先調用hashCode()方法計算object的哈希碼,通過哈希碼可以直接定位object在哈希表中的位置(一般是哈希碼對哈希表大小取余)。如果該位置沒有對象,可以直接將object插入該位置;如果該位置有對象(可能有多個,通過鏈表實現),則調用equals()方法比較這些對象與object是否相等,如果相等,則不需要保存object;如果不相等,則將該對象加入到鏈表中。

這也就解釋了為什麽equals()相等,則hashCode()必須相等。如果兩個對象equals()相等,則它們在哈希表(如HashSet、HashMap等)中只應該出現一次;如果hashCode()不相等,那麽它們會被散列到哈希表的不同位置,哈希表中出現了不止一次。

實際上,在JVM中,加載的對象在內存中包括三部分:對象頭、實例數據、填充。其中,對象頭包括指向對象所屬類型的指針和MarkWord,而MarkWord中除了包含對象的GC分代年齡信息、加鎖狀態信息外,還包括了對象的hashcode;對象實例數據是對象真正存儲的有效信息;填充部分僅起到占位符的作用, 原因是HotSpot要求對象起始地址必須是8字節的整數倍。

三、如何重寫hashCode()

本節先介紹重寫hashCode()方法應該遵守的原則,再介紹通用的hashCode()重寫方法。

1、重寫hashcode()的原則

通過前面的描述我們知道,重寫hashCode需要遵守以下原則:

(1)如果重寫了equals()方法,檢查條件“兩個對象使用equals()方法判斷為相等,則hashCode()方法也應該相等”是否成立,如果不成立,則重寫hashCode ()方法。

(2)hashCode()方法不能太過簡單,否則哈希沖突過多。

(3)hashCode()方法不能太過復雜,否則計算復雜度過高,影響性能。

2、hashCode()重寫方法

Effective Java》中提出了一種簡單通用的hashCode算法

A、初始化一個整形變量,為此變量賦予一個非零的常數值,比如int result = 17;
B、選取equals方法中用於比較的所有域(之所以只選擇equals()中使用的域,是為了保證上述原則的第1條),然後針對每個域的屬性進行計算:

(1) 如果是boolean值,則計算f ? 1:0
(2) 如果是byte\char\short\int,則計算(int)f
(3) 如果是long值,則計算(int)(f ^ (f >>> 32))
(4) 如果是float值,則計算Float.floatToIntBits(f)
(5) 如果是double值,則計算Double.doubleToLongBits(f),然後返回的結果是long,再用規則(3)去處理long,得到int
(6) 如果是對象應用,如果equals方法中采取遞歸調用的比較方式,那麽hashCode中同樣采取遞歸調用hashCode的方式。否則需要為這個域計算一個範式,比如當這個域的值為null的時候,那麽hashCode 值為0
(7) 如果是數組,那麽需要為每個元素當做單獨的域來處理。java.util.Arrays.hashCode方法包含了8種基本類型數組和引用數組的hashCode計算,算法同上。

C、最後,把每個域的散列碼合並到對象的哈希碼中。

下面通過一個例子進行說明。在該例中,Person類重寫了equals()方法和hashCode()方法。因為equals()方法中只使用了name域和age域,所以hashCode()方法中,也只計算name域和age域。

對於String類型的name域,直接使用了String的hashCode()方法;對於int類型的age域,直接用其值作為該域的hash。

public class Person {
    private String name;
    private int age;
    private boolean gender;
  
    public Person() {
        super();
    }
  
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getAge() {
        return age;
    }
    public void setAge(int age) {
        this.age = age;
    }
    public boolean isGender() {
        return gender;
    }
    public void setGender(boolean gender) {
        this.gender = gender;
    }
  
    @Override
    public boolean equals(Object another) {
        if (this == another) {
            return true;
        }
        if (another instanceof Person) {
            Person anotherPerson = (Person) another;
            if (this.getName().equals(anotherPerson.getName()) && this.getAge() == anotherPerson.getAge()) {
                return true;
            } else {
                return false;
            }
        }
        return false;
    }
  
    @Override
    public int hashCode() {
        int hash = 17;
        hash = hash * 31 + getName().hashCode();
        hash = hash * 31 + getAge();
        return hash;
    }
}

  

五、hashCode()的返回值和equals()的關系如下:

?如果x.equals(y)返回“true”,那麽x和y的hashCode()必須相等。

?如果x.equals(y)返回“false”,那麽x和y的hashCode()有可能相等,也有可能不等。

為什麽這兩個規則是這樣的,原因其實很簡單,拿HashSet來說吧,HashSet可以擁有一個或更多的箱子,在同一個箱子中可以有一個 或更多的獨特元對象(HashSet所容納的必須是獨特的元對象)。這個例子說明一個元對象可以和其他不同的元對象擁有相同的hashCode。但是一個 元對象只能和擁有同樣內容的元對象相等。所以這兩個規則必須成立。

六、設計這兩個函數所要註意到的:

如果你設計的對象類型並不使用於收集性對象,那麽沒有必要自己再設計這兩個函數的處理方式。這是正確的面向對象設計方法,任何用戶一時用不到的功能,就先不要設計,以免給日後功能擴展帶來麻煩。

如果你在設計時想別出心裁,不遵守以上的兩套規則,那麽勸你還是不要做這樣想入非非的事。我還沒有遇到過哪一個開發者和我說設計這兩個函數要違背前面說的兩個規則,我碰到這些違反規則的情況時,都是作為設計錯誤處理。

當一個對象類型作為收集型對象的元對象時,這個對象應該擁有自己處理equals(),和/或處理hashCode()的設計,而且要遵守前面所說 的兩種原則。equals()先要查null和是否是同一類型。查同一類型是為了避免出現ClassCastException這樣的異常給丟出來。查 null是為了避免出現NullPointerException這樣的異常給丟出來。

如果你的對象裏面容納的數據過多,那麽這兩個函數 equals()和hashCode()將會變得效率低。如果對象中擁有無法serialized的數據,equals()有可能在操作中出現錯誤。想象 一個對象x,它的一個整型數據是transient型(不能被serialize成二進制數據流)。然而equals()和hashCode()都有依靠 這個整型數據,那麽,這個對象在serialization之前和之後,是否一樣?答案是不一樣。因為serialization之前的整型數據是有效的 數據,在serialization之後,這個整型數據的值並沒有存儲下來,再重新由二進制數據流轉換成對象後,兩者(對象在serialization 之前和之後)的狀態已經不同了。這也是要註意的。

參於:http://www.importnew.com/25783.html,http://www.importnew.com/25783.html

第八周:hashCode()方法 & equals()方法