Java hashCode()和equals()的若干問題解答
本章的內容主要解決下面幾個問題:
1.equals()的作用是什麼?
2.equals()與==的區別是什麼?
3.hashCode()的作用是什麼?
4.hashCode()和equals()之間有什麼聯絡?
第一部分 equals()的作用
equals()的作用是用來判斷兩個物件是否相等。
equals()定義在JDK的Object類中。通過判斷兩個物件的地址是否相等(即,是否是同一個物件)來區分它們是否相等。原始碼如下:
public boolean equals(Object obj){ return (this==obj); }
既然Object.java中定義了equals()方法,這就意味著所有的java類都實現了equals()方法,所有的類都可以通過equals()方法去比較兩個物件是否相等。但是,我們已經說過,使用預設的“equals()”方法,等價於“==”方法。因此,我們通常會重寫equals()方法:若兩個物件的內容相等,則equals()方法返回true;否則,返回false。
下面根據“類是否覆蓋equals()方法”,將它分為兩類:
(1) 若某個類沒有覆蓋equals()方法,當它的通過equals()比較兩個物件時,實際上是比較兩個物件的地址是否相等。這時,等價於通過“==”去比較這兩個物件。
(2)我們可以覆蓋類的equals()方法,來讓equals()通過其它方式比較兩個物件是否相等。通常的做法是:若兩個物件的內容相等
下面,舉例對上面的2種情況進行說明。
1.“沒有覆蓋equals()方法”的情況
程式碼如下:
import java.util.*; import java.lang.Comparable; public class EqualsTest1{ public static void main(String[] args){ Person p1=new Person("eee",100); Person p2=new Person("eee",100); System.out.printf("%s\n",p1.equals(p2)); } public static class Person{ int age; String name; public Perosn(String name,int age){ this.name=name; this.age=age; } }
執行結果:
false
結果分析:
我們通過 p1.equals(p2) 來“比較p1和p2是否相等時”。實際上,呼叫的Object.java的equals()方法,即呼叫的 (p1==p2) 。它是比較“p1和p2是否是同一個物件”。
而由 p1 和 p2 的定義可知,它們雖然內容相同;但它們是兩個不同的物件!因此,返回結果是false。
2.“覆蓋equals()方法”的情況
我們修改上面的EqualsTest1.java:覆蓋equals()方法
程式碼如下:
import java.util.*;
import java.lang.Comparable;
public class EqualsTest1{
public static void main(String[] args){
Person p1=new Person("eee",100);
Person p2=new Person("eee",100);
System.out.printf("%s\n",p1.equals(p2));
}
public static class Person{
int age;
String name;
public Perosn(String name,int age){
this.name=name;
this.age=age;
}
@Override
public boolean equals(Object obj){
if(obj==null)
return false;
if(this==obj)
return true;
if(this.getClass()!=obj.getClass()){
return false;
}
Person person=(Person)obj;
return name.equals(person.name) && age==person.age;
}
}
執行結果:
true
我們在EqualsTest2.java 中重寫了Person的equals()函式:當兩個Person物件的 name 和 age 都相等,則返回true。因此,執行結果返回true。
講到這裡,順便說一下Java對equals()的要求,有以下幾點:
1.自反性:對於任何非空引用x,x.equals(x)應該返回true。
2.對稱性:對於任何引用x和y,當且僅當y.equals(x)返回true,x.equals(y)也應該返回true
3.傳遞性:對於任何引用x,y和z,如果x,equals(y)返回true,y.equals(z)返回true,那麼x.equals(z)也應該返回true
4.一致性:如果x和y引用的物件沒有發生變化,反覆呼叫x.equals(y)應該返回相同的結果
5.對於任何非空引用x,x,equals(null)應該返回false
現在,再回顧一下equals()的作用:判斷兩個物件是否相等。當我們重寫equals()的時候,可千萬不好將它的作用給改變了!
第2部分 equals()與==的區別是什麼?
==:它的作用是判斷兩個物件的地址是不是相等。
equals():它的作用也是判斷兩個物件是否相等。但它一般分兩種情況:
情況1:類沒有覆蓋equals()方法。則通過equals()比較該類的兩個物件時,等價於==比較兩個物件。
情況2:類覆蓋了equals()方法。一般,我們都覆蓋equals()方法來比較兩個物件的內容;若它們的內容相等,則返回true。
第3部分 hashCode()的作用
hashCode() 的作用是獲取雜湊碼,也稱為雜湊碼;它實際上是返回一個int整數。這個雜湊碼的作用是確定該物件在雜湊表中的索引位置。
hashCode() 定義在JDK的Object.java中,這就意味著Java中的任何類都包含有hashCode() 函式。 雖然,每個Java類都包含hashCode() 函式。但是,僅僅當建立並某個“類的散列表”(關於“散列表”見下面說明)時,該類的hashCode() 才有用(作用是:確定該類的每一個物件在散列表中的位置;其它情況下(例如,建立類的單個物件,或者建立類的物件陣列等等),類的hashCode() 沒有作用。
上面的散列表,指的是:Java集合中本質是散列表的類,如HashMap,Hashtable,HashSet。 也就是說:hashCode() 在散列表中才有用,在其它情況下沒用。在散列表中hashCode() 的作用是獲取物件的雜湊碼,進而確定該物件在散列表中的位置。
雜湊碼的作用:
我們都知道,散列表儲存的是鍵值對(key-value),它的特點是:能根據“鍵”快速的檢索出對應的“值”。這其中就利用到了雜湊碼!
散列表的本質是通過陣列實現的。當我們要獲取散列表中的某個“值”時,實際上是要獲取陣列中的某個位置的元素。而陣列的位置,就是通過“鍵”來獲取的;更進一步說,陣列的位置,是通過“鍵”對應的雜湊碼計算得到的。
下面,我們以HashSet為例,來深入說明hashCode()的作用。
假設,HashSet中已經有1000個元素。當插入第1001個元素時,需要怎麼處理?因為HashSet是Set集合,它不允許有重複元素。“將第1001個元素逐個的和前面1000個元素進行比較”?顯然,這個效率是相等低下的。散列表很好的解決了這個問題,它根據元素的雜湊碼計算出元素在散列表中的位置,然後將元素插入該位置即可。對於相同的元素,自然是隻儲存了一個。
在散列表中:
1、如果兩個物件相等,那麼它們的hashCode()值一定要相同;
2、如果兩個物件hashCode()相等,它們並不一定相等。
注意:這是在散列表中的情況。在非散列表中一定如此!
第4部分 hashCode()和equals()的關係
我們以“類的用途”來將“hashCode() 和 equals()的關係”分2種情況來說明。
第一種 不會建立的散列表
在這種情況下,該類的“hashCode() 和 equals() ”沒有關係的!
這種情況下,equals() 用來比較該類的兩個物件是否相等。而hashCode() 則根本沒有任何作用,所以,不用理會hashCode()。
原始碼如下:
import java.util.*;
import java.lang.Comparable;
public class EqualsTest1{
public static void main(String[] args){
Person p1=new Person("eee",100);
Person p2=new Person("eee",100);
System.out.printf("%s\n",p1.equals(p2));
}
public static class Person{
int age;
String name;
public Perosn(String name,int age){
this.name=name;
this.age=age;
}
}
執行結果:
false
結果分析:
我們通過 p1.equals(p2) 來“比較p1和p2是否相等時”。實際上,呼叫的Object.java的equals()方法,即呼叫的 (p1==p2) 。它是比較“p1和p2是否是同一個物件”。
而由 p1 和 p2 的定義可知,它們雖然內容相同;但它們是兩個不同的物件!因此,返回結果是false。
2.“覆蓋equals()方法”的情況
我們修改上面的EqualsTest1.java:覆蓋equals()方法
程式碼如下:
import java.util.*;
import java.lang.Comparable;
public class NormalHashCodeTest{
public static void main(String[] args){
Person p1=new Person("eee",100);
Person p2=new Person("eee",100);
Person p3=new Person("aaa",200);
System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
System.out.printf("p1.equals(p3) : %s; p1(%d) p3(%d)\n", p1.equals(p3), p1.hashCode(), p3.hashCode());
}
public static class Person{
int age;
String name;
public Perosn(String name,int age){
this.name=name;
this.age=age;
}
@Override
public boolean equals(Object obj){
if(obj==null)
return false;
if(this==obj)
return true;
if(this.getClass()!=obj.getClass()){
return false;
}
Person person=(Person)obj;
return name.equals(person.name) && age==person.age;
}
}
執行結果:
p1.equals(p2) : true; p1(1169863946) p2(1901116749)
p1.equals(p3) : false; p1(1169863946) p3(2131949076)
從結果可以看出:p1和p2相等的情況下,hashCode()也不一定相等
第二種 會建立散列表
這裡所說的“會建立散列表"是說:我們會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中,用到該類。例如,會建立該類的HashSet集合。
在這種情況下,該類的“hashCode() 和 equals() ”是有關係的:
1)、如果兩個物件相等,那麼它們的hashCode()值一定相同。
這裡的相等是指,通過equals()比較兩個物件時返回true。
2)、如果兩個物件hashCode()相等,它們並不一定相等。
因為在散列表中,hashCode()相等,即兩個鍵值對的雜湊值相等。然而雜湊值相等,並不一定能得出鍵值對相等。補充說一句:“兩個不同的鍵值對,雜湊值相等”,這就是雜湊衝突。
此外,在這種情況下。若要判斷兩個物件是否相等,除了要覆蓋equals()之外,也要覆蓋hashCode()函式。否則,equals()無效。
例如,建立Person類的HashSet集合,必須同時覆蓋Person類的equals() 和 hashCode()方法。如果單單只是覆蓋equals()方法。我們會發現,equals()方法沒有達到我們想要的效果。
參考程式碼:
import java.util.*;
import java.lang.Comparable;
public class NormalHashCodeTest{
public static void main(String[] args){
Person p1=new Person("eee",100);
Person p2=new Person("eee",100);
Person p3=new Person("aaa",200);
HashSet set=new HashSet<>();
set.add(p1);
set.add(p2);
set.add(p3);
System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
System.out.printf("set:%s\n",set);
}
public static class Person{
int age;
String name;
public Perosn(String name,int age){
this.name=name;
this.age=age;
}
@Override
public boolean equals(Object obj){
if(obj==null)
return false;
if(this==obj)
return true;
if(this.getClass()!=obj.getClass()){
return false;
}
Person person=(Person)obj;
return name.equals(person.name) && age==person.age;
}
}
執行結果:
p1.equals(p2) : true; p1(1169863946) p2(1690552137)
set:[(eee, 100), (eee, 100), (aaa, 200)]
結果分析:
我們重寫了Person的equals()。但是,很奇怪的發現:HashSet中仍然有重複元素:p1 和 p2。為什麼會出現這種情況呢?
這是因為雖然p1 和 p2的內容相等,但是它們的hashCode()不等;所以,HashSet在新增p1和p2的時候,認為它們不相等。(在HashSet中,兩個物件的內容相等,它們的hashCode()必然相等)
下面,同時覆蓋equals()和hashCode()方法
import java.util.*;
import java.lang.Comparable;
public class ConflictHashCodeTest2{
public static void main(String[] args) {
// 新建Person物件,
Person p1 = new Person("eee", 100);
Person p2 = new Person("eee", 100);
Person p3 = new Person("aaa", 200);
Person p4 = new Person("EEE", 100);
// 新建HashSet物件
HashSet set = new HashSet();
set.add(p1);
set.add(p2);
set.add(p3);
// 比較p1 和 p2, 並列印它們的hashCode()
System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
// 比較p1 和 p4, 並列印它們的hashCode()
System.out.printf("p1.equals(p4) : %s; p1(%d) p4(%d)\n", p1.equals(p4), p1.hashCode(), p4.hashCode());
// 列印set
System.out.printf("set:%s\n", set);
}
private
static class Person {
int age;
String name;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
public String toString() {
return name + " - " +age;
}
/**
* @desc重寫hashCode
*/
@Override
public int hashCode(){
int nameHash = name.toUpperCase().hashCode();
return nameHash ^ age;
}
/**
* @desc 覆蓋equals方法
*/
@Override
public boolean equals(Object obj){
if(obj == null){
return false;
}
//如果是同一個物件返回true,反之返回false
if(this == obj){
return true;
}
//判斷是否型別相同
if(this.getClass() != obj.getClass()){
return false;
}
Person person = (Person)obj;
return name.equals(person.name) && age==person.age;
}
}
}
執行結果:
p1.equals(p2) : true; p1(68545) p2(68545)
p1.equals(p4) : false; p1(68545) p4(68545)
set:[aaa - 200, eee - 100]
綜合分析:
這下,equals()生效了,HashSet中沒有重複元素。
比較p1和p2,我們發現:它們的hashCode()相等,通過equals()比較它們也返回true。所以,p1和p2被視為相等。
比較p1和p4,我們發現:雖然它們的hashCode()相等;但是,通過equals()比較它們返回false。所以,p1和p4被視為不相等。