1. 程式人生 > >Java中的hashcode和equals

Java中的hashcode和equals

equals作用

equals() 的作用是 用來判斷兩個物件是否相等。

equals() 定義在JDK的Object.java中。通過判斷兩個物件的地址是否相等(即,是否是同一個物件)來區分它們是否相等。原始碼如下:

public boolean equals(Object obj) {
    return (this == obj);
}

既然Object.java中定義了equals()方法,這就意味著所有的Java類都實現了equals()方法,
所有的類都可以通過equals()去比較兩個物件是否相等。
但是,我們已經說過,使用預設的“equals()”方法,等價於“==”方法。
因此,我們通常會重寫equals()方法:若兩個物件的內容相等,則equals()方法返回true;否則,返回fasle。

下面根據“類是否覆蓋equals()方法”,將它分為2類。

  • 若某個類沒有覆蓋equals()方法,當它的通過equals()比較兩個物件時,
    實際上是比較兩個物件是不是同一個物件。這時,等價於通過“==”去比較這兩個物件。
  • 我們可以覆蓋類的equals()方法,來讓equals()通過其它方式比較兩個物件是否相等。
    通常的做法是:若兩個物件的內容相等,則equals()方法返回true;否則,返回fasle。

順便說一下java對equals()的要求。有以下幾點:

  • 對稱性:如果x.equals(y)返回是"true",那麼y.equals(x)也應該返回是"true"。
  • 反射性:x.equals(x)必須返回是"true"。
  • 類推性:如果x.equals(y)返回是"true",而且y.equals(z)返回是"true",那麼z.equals(x)也應該返回是"true"。
  • 一致性:如果x.equals(y)返回是"true",只要x和y內容一直不變,不管你重複x.equals(y)多少次,返回都是"true"。
  • 非空性,x.equals(null),永遠返回是"false";x.equals(和x不同型別的物件)永遠返回是"false"。

equals() 與 == 的區別是什麼?

它的作用是判斷兩個物件的地址是不是相等。即,判斷兩個物件是不試同一個物件。

hashCode() 的作用

hashCode() 的作用是獲取雜湊碼,也稱為雜湊碼;它實際上是返回一個int整數。
這個雜湊碼的作用是確定該物件在雜湊表中的索引位置。

hashCode() 定義在JDK的Object.java中,這就意味著Java中的任何類都包含有hashCode() 函式。

雖然,每個Java類都包含hashCode() 函式。但是,僅僅當建立並某個“類的散列表”(關於“散列表”見下面說明)時,該類的hashCode() 才有用(作用是:確定該類的每一個物件在散列表中的位置;其它情況下(例如,建立類的單個物件,或者建立類的物件陣列等等),類的hashCode() 沒有作用。
上面的散列表,指的是:Java集合中本質是散列表的類,如HashMap,Hashtable,HashSet。

也就是說:hashCode() 在散列表中才有用,在其它情況下沒用。在散列表中hashCode() 的作用是獲取物件的雜湊碼,進而確定該物件在散列表中的位置。

為了能理解後面的內容,這裡簡單的介紹一下雜湊碼的作用。

我們都知道,散列表儲存的是鍵值對(key-value),它的特點是:能根據“鍵”快速的檢索出對應的“值”。這其中就利用到了雜湊碼!
散列表的本質是通過陣列實現的。當我們要獲取散列表中的某個“值”時,實際上是要獲取陣列中的某個位置的元素。而陣列的位置,就是通過“鍵”來獲取的;更進一步說,陣列的位置,是通過“鍵”對應的雜湊碼計算得到的。
下面,我們以HashSet為例,來深入說明hashCode()的作用。

假設,HashSet中已經有1000個元素。當插入第1001個元素時,需要怎麼處理?因為HashSet是Set集合,它允許有重複元素。
“將第1001個元素逐個的和前面1000個元素進行比較”?顯然,這個效率是相等低下的。散列表很好的解決了這個問題,它根據元素的雜湊碼計算出元素在散列表中的位置,然後將元素插入該位置即可。對於相同的元素,自然是隻儲存了一個。
由此可知,若兩個元素相等,它們的雜湊碼一定相等;但反過來確不一定。在散列表中,

  • 如果兩個物件相等,那麼它們的hashCode()值一定要相同;
  • 如果兩個物件hashCode()相等,它們並不一定相等。

注意:這是在散列表中的情況。在非散列表中一定如此!

hashCode() 和 equals() 的關係

接下面,我們討論另外一個話題。網上很多文章將 hashCode() 和 equals 關聯起來,有的講的不透徹,
有誤導讀者的嫌疑。在這裡,我自己梳理了一下 “hashCode() 和 equals()的關係”。

我們以“類的用途”來將“hashCode() 和 equals()的關係”分2種情況來說明。

第一種不會建立“類對應的散列表”

這裡所說的“不會建立類對應的散列表”是說:我們不會在HashSet, Hashtable, HashMap等等這些本質是
散列表的資料結構中,用到該類。例如,不會建立該類的HashSet集合。

在這種情況下,該類的“hashCode() 和 equals() ”沒有半毛錢關係的!

這種情況下,equals() 用來比較該類的兩個物件是否相等。而hashCode() 則根本沒有任何作用,
所以,不用理會hashCode()。

第二種 會建立“類對應的散列表”

這裡所說的“會建立類對應的散列表”是說:我們會在HashSet, Hashtable, HashMap等等這些本質是
散列表的資料結構中,用到該類。例如,會建立該類的HashSet集合。

在這種情況下,該類的“hashCode() 和 equals() ”是有關係的

  • 如果兩個物件相等,那麼它們的hashCode()值一定相同。這裡的相等是指,通過equals()比較兩個物件時返回true。
  • 如果兩個物件hashCode()相等,它們並不一定相等。因為在散列表中,hashCode()相等,即兩個鍵值對的雜湊值相等。然而雜湊值相等,並不一定能得出鍵值對相等。補充說一句:“兩個不同的鍵值對,雜湊值相等”,這就是雜湊衝突。

此外,在這種情況下。若要判斷兩個物件是否相等,除了要覆蓋equals()之外,也要覆蓋hashCode()函式。否則,equals()無效。
例如,建立Person類的HashSet集合,必須同時覆蓋Person類的equals() 和 hashCode()方法。
如果單單只是覆蓋equals()方法。我們會發現,equals()方法沒有達到我們想要的效果。

一般來說涉及到物件之間的比較大小就需要重寫equals方法,但是為什麼第一點說重寫了equals就需要重寫hashCode呢

實際上這只是一條規範,如果不這樣做程式也可以執行,只不過會隱藏bug。一般一個類的物件如果會儲存在HashTable,HashSet,HashMap
等雜湊儲存結構中,那麼重寫equals後最好也重寫hashCode,否則會導致儲存資料的不唯一性(儲存了兩個equals相等的資料)。
而如果確定不會儲存在這些雜湊結構中,則可以不重寫hashCode。但是個人覺得還是重寫比較好一點,
誰能保證後期不會儲存在這些結構中呢,況且重寫了hashCode也不會降低效能,因為線上性結構(如ArrayList)中是不會呼叫hashCode,
所以重寫了也不要緊,也為後期的修改打了補丁。

總結

  • hashCode是為了提高在雜湊結構儲存中查詢的效率,線上性表中沒有作用。
  • equals和hashCode需要同時覆蓋。
  • 若兩個物件equals返回true,則hashCode有必要也返回相同的int數。
  • 若兩個物件equals返回false,則hashCode不一定返回不同的int數,但為不相等的物件生成不同hashCode值可以提高雜湊表的效能。
  • 若兩個物件hashCode返回相同int數,則equals不一定返回true。
  • 若兩個物件hashCode返回不同int數,則equals一定返回false。
  • 同一物件在執行期間若已經儲存在集合中,則不能修改影響hashCode值的相關資訊,否則會導致記憶體洩露問題。

轉自

Java hashCode() 和 equals()的若干問題解答

徹底搞懂hashCode與equals的作用與區別及應當注意的細節