1. 程式人生 > >Java中的hashCode() 和 equals()

Java中的hashCode() 和 equals()

 

一、 equals() 的作用

equals() 的作用是 用來判斷兩個物件是否相等

equals() 定義在JDK的Object.java中。通過判斷兩個物件的地址是否相等(即,是否是同一個物件)來區分它們是否相等。原始碼如下:

public boolean equals(Object obj) {
    return (this == obj);
}

既然Object.java中定義了equals()方法,這就意味著所有的Java類都實現了equals()方法,所有的類都可以通過equals()去比較兩個物件是否相等。 但是,我們已經說過,使用預設的“equals()

”方法,等價於“==”方法。因此,我們通常會重寫equals()方法:若兩個物件的內容相等,則equals()方法返回true;否則,返回fasle。  

下面根據“類是否覆蓋equals()方法”,將它分為2類。
(01) 若某個類沒有覆蓋equals()方法,當它的通過equals()比較兩個物件時,實際上是比較兩個物件是不是同一個物件。這時,等價於通過“==”去比較這兩個物件。(“==”:比較是否是同一物件,即比較物件的記憶體地址是否相同)
(02) 我們可以覆蓋類的equals()方法,來讓equals()通過其它方式比較兩個物件是否相等。通常的做法是:若兩個物件的內容相等,則equals()方法返回true;否則,返回fasle。

 

Object類中的equals方法和“==”是一樣的,沒有區別,即倆個物件的比較是比較他們的棧記憶體中儲存的記憶體地址。而String類,Integer類等等一些類,是重寫了equals方法,才使得equals和“==不同”,他們比較的是值是不是相等。所以,當自己建立類時,自動繼承了Object的equals方法,要想實現不同的等於比較,必須重寫equals方法。


下面,舉例對上面的2種情況進行說明。

1.  “沒有覆蓋equals()方法”的情況

import java.util.*;
import java.lang.Comparable;

/**
 * @desc equals()的測試程式。
 *
 * @author skywang
 * @emai 
[email protected]
*/ public class EqualsTest1{ public static void main(String[] args) { // 新建2個相同內容的Person物件, // 再用equals比較它們是否相等 Person p1 = new Person("eee", 100); Person p2 = new Person("eee", 100); System.out.printf("%s\n", p1.equals(p2)); //結果:false } /** * @desc Person類。 */ private static class Person { int age; String name; public Person(String name, int age) { this.name = name; this.age = age; } public String toString() { return name + " - " +age; } } }

結果分析

       我們通過 p1.equals(p2) 來“比較p1和p2是否相等時”。實際上,呼叫的Object.java的equals()方法,即呼叫的 (p1==p2) 。它是比較“p1和p2是否是同一個物件”。
       而由 p1 和 p2 的定義可知,它們雖然內容相同;但它們是兩個不同的物件!因此,返回結果是false。

2. "覆蓋equals()方法"的情況

我們修改上面的EqualsTest1.java覆蓋equals()方法

import java.util.*;
import java.lang.Comparable;

/**
 * @desc equals()的測試程式。
 *
 * @author skywang
 * @emai [email protected]
 */
public class EqualsTest2{

    public static void main(String[] args) {
        // 新建2個相同內容的Person物件,
        // 再用equals比較它們是否相等
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        System.out.printf("%s\n", p1.equals(p2)); //結果:true
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  
              
            //如果是同一個物件返回true,反之返回false  
            if(this == obj){  
                return true;  
            }  
              
            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  
              
            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

結果分析

我們在EqualsTest2.java 中重寫了Person的equals()函式:當兩個Person物件的 name 和 age 都相等,則返回true。
因此,執行結果返回true。

 

講到這裡,順便說一下java對equals()的要求。有以下幾點:

1. 對稱性:如果x.equals(y)返回是"true",那麼y.equals(x)也應該返回是"true"。
2. 反射性:x.equals(x)必須返回是"true"。
3. 類推性:如果x.equals(y)返回是"true",而且y.equals(z)返回是"true",那麼z.equals(x)也應該返回是"true"。
4. 一致性:如果x.equals(y)返回是"true",只要x和y內容一直不變,不管你重複x.equals(y)多少次,返回都是"true"。
5. 非空性,x.equals(null),永遠返回是"false";x.equals(和x不同型別的物件)永遠返回是"false"。

現在,再回顧一下equals()的作用:判斷兩個物件是否相等。當我們重寫equals()的時候,可千萬不好將它的作用給改變了!

第2部分 equals() 與 == 的區別

== : 它的作用是判斷兩個物件的地址是不是相等。即,判斷兩個物件是不試同一個物件。

equals() : 它的作用也是判斷兩個物件是否相等。但它一般有兩種使用情況(前面第1部分已詳細介紹過):
                 情況1,類沒有覆蓋equals()方法。則通過equals()比較該類的兩個物件時,等價於通過“==”比較這兩個物件。
                 情況2,類覆蓋了equals()方法。一般,我們都覆蓋equals()方法來兩個物件的內容相等;若它們的內容相等,則返回true(即,認為這兩個物件相等)。

第3部分 hashCode() 的作用

   hashCode() 的作用是獲取雜湊碼,也稱為雜湊碼;它實際上是返回一個int整數。這個雜湊碼的作用是確定該物件在雜湊表中的索引位置。

    hashCode() 定義在JDK的Object.java中,這就意味著Java中的任何類都包含有hashCode() 函式。
        雖然,每個Java類都包含hashCode() 函式。但是,僅僅當建立並某個“類的散列表”(關於“散列表”見下面說明)時,該類的hashCode() 才有用 (作用是:確定該類的每一個物件在散列表中的位置;其它情況下(例如,建立類的單個物件,或者建立類的物件陣列等等),類的hashCode() 沒有作用。
       上面的散列表,指的是:Java集合中本質是散列表的類,如HashMap,Hashtable,HashSet。

       也就是說:hashCode() 在散列表中才有用,在其它情況下沒用。在散列表中hashCode() 的作用是獲取物件的雜湊碼,進而確定該物件在散列表中的位置。

     至此,我們搞清楚了:hashCode()的作用是獲取雜湊碼

我們都知道,散列表儲存的是鍵值對(key-value),它的特點是:能根據“鍵”快速的檢索出對應的“值”。這其中就利用到了雜湊碼!
散列表的本質是通過陣列實現的。當我們要獲取散列表中的某個“值”時,實際上是要獲取陣列中的某個位置的元素。而陣列的位置,就是通過“鍵”來獲取的;更進一步說,陣列的位置,是通過“鍵”對應的雜湊碼計算得到的

下面,我們以HashSet為例,來深入說明hashCode()的作用。

        假設,HashSet中已經有1000個元素。當插入第1001個元素時,需要怎麼處理?因為HashSet是Set集合,它允許有重複元素。
        “將第1001個元素逐個的和前面1000個元素進行比較”?顯然,這個效率是相等低下的。散列表很好的解決了這個問題,它根據元素的雜湊碼計算出元素在散列表中的位置,然後將元素插入該位置即可。對於相同的元素,自然是隻儲存了一個。
        由此可知,若兩個元素相等,它們的雜湊碼一定相等;但反過來確不一定。在散列表中,
                           1、如果兩個物件相等,那麼它們的hashCode()值一定要相同;
                           2、如果兩個物件hashCode()相等,它們並不一定相等。
                           注意:這是在散列表中的情況。在非散列表中一定如此!

第4部分 hashCode() 和 equals() 的關係

接下面,我們討論另外一個話題。網上很多文章將 hashCode() 和 equals 關聯起來,有的講的不透徹,有誤導讀者的嫌疑。在這裡,我自己梳理了一下 “hashCode() 和 equals()的關係”。

我們以“類的用途”來將“hashCode() 和 equals()的關係”分2種情況來說明。

1. 第一種 不會建立“類對應的散列表”

         這裡所說的“不會建立類對應的散列表”是說:我們不會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中,用到該類。例如,不會建立該類的HashSet集合。

        在這種情況下,該類的“hashCode() 和 equals() ”沒有任何關係!這種情況下,equals() 用來比較該類的兩個物件是否相等。而hashCode() 則根本沒有任何作用,所以,不用理會hashCode()。

2. 第二種 會建立“類對應的散列表”

        這裡所說的“會建立類對應的散列表”是說:我們會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中,用到該類。例如,會建立該類的HashSet集合。

        在這種情況下,該類的“hashCode() 和 equals() ”是有關係的:
        1)、如果兩個物件相等,那麼它們的hashCode()值一定相同。
              這裡的相等是指,通過equals()比較兩個物件時返回true。
        2)、如果兩個物件hashCode()相等,它們並不一定相等。
               因為在散列表中,hashCode()相等,即兩個鍵值對的雜湊值相等。然而雜湊值相等,並不一定能得出鍵值對相等。補充說一句:“兩個不同的鍵值對,雜湊值相等”,這就是雜湊衝突。

        此外,在這種情況下。若要判斷兩個物件是否相等,除了要覆蓋equals()之外,也要覆蓋hashCode()函式。否則,equals()無效。
例如,建立Person類的HashSet集合,必須同時覆蓋Person類的equals() 和 hashCode()方法。
        如果單單只是覆蓋equals()方法。我們會發現,equals()方法沒有達到我們想要的效果。

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時, hashCode()的值。
 *
 * @author skywang
 * @emai [email protected]
 */
public class ConflictHashCodeTest1{

    public static void main(String[] args) {
        // 新建Person物件,
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);

        // 新建HashSet物件 
        HashSet set = new HashSet();
        set.add(p1);
        set.add(p2);
        set.add(p3);

        // 比較p1 和 p2, 並列印它們的hashCode()
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        // 列印set
        System.out.printf("set:%s\n", set);
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return "("+name + ", " +age+")";
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  
              
            //如果是同一個物件返回true,反之返回false  
            if(this == obj){  
                return true;  
            }  
              
            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  
              
            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

執行結果

p1.equals(p2) : true; p1(1169863946) p2(1690552137)
set:[(eee, 100), (eee, 100), (aaa, 200)]

結果分析

        我們重寫了Person的equals()。但是,很奇怪的發現:HashSet中仍然有重複元素:p1 和 p2。為什麼會出現這種情況呢?

        這是因為雖然p1 和 p2的內容相等,但是它們的hashCode()不等;所以,HashSet在新增p1和p2的時候,認為它們不相等

 

下面,我們同時覆蓋equals() 和 hashCode()方法。

參考程式碼 (ConflictHashCodeTest2.java):

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時, hashCode()的值。
 *
 * @author skywang
 * @emai [email protected]
 */
public class ConflictHashCodeTest2{

    public static void main(String[] args) {
        // 新建Person物件,
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);
        Person p4 = new Person("EEE", 100);

        // 新建HashSet物件 
        HashSet set = new HashSet();
        set.add(p1);
        set.add(p2);
        set.add(p3);

        // 比較p1 和 p2, 並列印它們的hashCode()
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        // 比較p1 和 p4, 並列印它們的hashCode()
        System.out.printf("p1.equals(p4) : %s; p1(%d) p4(%d)\n", p1.equals(p4), p1.hashCode(), p4.hashCode());
        // 列印set
        System.out.printf("set:%s\n", set);
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }

        /** 
         * @desc重寫hashCode 
         */  
        @Override
        public int hashCode(){  
            int nameHash =  name.toUpperCase().hashCode();
            return nameHash ^ age;
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  
              
            //如果是同一個物件返回true,反之返回false  
            if(this == obj){  
                return true;  
            }  
              
            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  
              
            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

執行結果

p1.equals(p2) : true; p1(68545) p2(68545)
p1.equals(p4) : false; p1(68545) p4(68545)
set:[aaa - 200, eee - 100]

結果分析

        這下,equals()生效了,HashSet中沒有重複元素。
        比較p1和p2,我們發現:它們的hashCode()相等,通過equals()比較它們也返回true。所以,p1和p2被視為相等。
        比較p1和p4,我們發現:雖然它們的hashCode()相等;但是,通過equals()比較它們返回false。所以,p1和p4被視為不相等。


重寫equals()方法就必須重寫hashCode()方法的原因

 

從Object類的hashCode()和equals()方法講起:   
      最近看了Object類的原始碼,對hashCode() 和equals()方法有了更深的認識。重寫equals()方法就必須重寫hashCode()方法的原因,從源頭Object類講起就更好理解了。

先來看Object關於hashCode()和equals()的原始碼:

 public native int hashCode();
    public boolean equals(Object obj) {
        return (this == obj);
    }


     光從程式碼中我們可以知道,hashCode()方法是一個本地native方法,返回的是物件引用中儲存的物件的記憶體地址,而equals方法是利用==來比較的也是物件的記憶體地址。從上邊我們可以看出,hashCode方法和equals方法是一致的。還有最關鍵的一點,我們來看Object類中關於hashCode()方法的註釋:

/**
     * Returns a hash code value for the object. This method is
     * supported for the benefit of hash tables such as those provided by
     * {@link java.util.HashMap}.
     * <p>
     * The general contract of {@code hashCode} is:
     * <ul>
     * <li>Whenever it is invoked on the same object more than once during
     *     an execution of a Java application, the {@code hashCode} method
     *     must consistently return the same integer, provided no information
     *     used in {@code equals} comparisons on the object is modified.
     *     This integer need not remain consistent from one execution of an
     *     application to another execution of the same application.
     * <li>If two objects are equal according to the {@code equals(Object)}
     *     method, then calling the {@code hashCode} method on each of
     *     the two objects must produce the same integer result.
     * <li>It is <em>not</em> required that if two objects are unequal
     *     according to the {@link java.lang.Object#equals(java.lang.Object)}
     *     method, then calling the {@code hashCode} method on each of the
     *     two objects must produce distinct integer results.  However, the
     *     programmer should be aware that producing distinct integer results
     *     for unequal objects may improve the performance of hash tables.
     * </ul>
     * <p>
     * As much as is reasonably practical, the hashCode method defined by
     * class {@code Object} does return distinct integers for distinct
     * objects. (This is typically implemented by converting the internal
     * address of the object into an integer, but this implementation
     * technique is not required by the
     * Java™ programming language.)
     *
     * @return  a hash code value for this object.
     * @see     java.lang.Object#equals(java.lang.Object)
     * @see     java.lang.System#identityHashCode
     */
    public native int hashCode();


    簡單的翻譯一下就是,hashCode方法一般的規定是:
    1.在 Java 應用程式執行期間,在對同一物件多次呼叫 hashCode 方法時,必須一致地返回相同的整數,前提是將物件進行 equals 比較時所用的資訊沒有被修改。從某一應用程式的一次執行到同一應用程式的另一次執行,該整數無需保持一致。    
    2.如果根據 equals(Object) 方法,兩個物件是相等的,那麼對這兩個物件中的每個物件呼叫 hashCode 方法都必須生成相同的整數結果。    
   3.如果根據 equals(java.lang.Object) 方法,兩個物件不相等,那麼對這兩個物件中的任一物件上呼叫 hashCode 方法不 要求一定生成不同的整數結果。但是,程式設計師應該意識到,為不相等的物件生成不同整數結果可以提高雜湊表的效能。


     再簡單的翻譯一下第二三點就是:hashCode()和equals()保持一致,如果equals方法返回true,那麼兩個物件的hasCode()返回值必須一樣。如果equals方法返回false,hashcode可以不一樣,但是這樣不利於雜湊表的效能,一般我們也不要這樣做。重寫equals()方法就必須重寫hashCode()方法的原因也就顯而易見了。

   假設兩個物件,重寫了其equals方法,其相等條件是屬性相等,就返回true。如果不重寫hashcode方法,其返回的依然是兩個物件的記憶體地址值,必然不相等。這就出現了equals方法相等,但是hashcode不相等的情況。這不符合hashcode的規則。下邊,會介紹在集合框架中,這種情況會導致的嚴重問題。

    重寫的作用:
        如果重寫(用於需求,比如建立一個Person類,比較相等我只比較其屬性身份證相等就可不管其他屬性,這時候重寫)equals,就得重寫hashCode,和其物件相等保持一致。如果不重寫,那麼呼叫的Object中的方法一定保持一致。
       1.  重寫equals()方法就必須重寫hashCode()方法,主要是針對HashSet和Map集合型別。集合框架只能存入物件(物件的引用(基本型別資料:自動裝箱))。
        在向HashSet集合中存入一個元素時,HashSet會呼叫該物件(存入物件)的hashCode()方法來得到該物件的hashCode()值,然後根據該hashCode值決定該物件在HashSet中儲存的位置。簡單的說:HashSet集合判斷兩個元素相等的標準是:兩個物件通過equals()方法比較相等,並且兩個物件的HashCode()方法返回值也相等。如果兩個元素通過equals()方法比較返回true,但是它們的hashCode()方法返回值不同,HashSet會把它們儲存在不同的位置,依然可以新增成功。同樣:在Map集合中,例如其子類Hashtable(jdk1.0錯誤的命名規範),HashMap,儲存的資料是<key,value>對,key,value都是物件,被封裝在Map.Entry,即:每個集合元素都是Map.Entry物件。在Map集合中,判斷key相等標準也是:兩個key通過equals()方法比較返回true,兩個key的hashCode的值也必須相等。判斷valude是否相等equal()相等即可。
      稍微提一句:(1)兩個物件,用==比較比較的是地址,需採用equals方法(可根據需求重寫)比較。
                              (2)重寫equals()方法就重寫hashCode()方法。
                               (3)一般相等的物件都規定有相同的hashCode。
                                hash:雜湊,Map關聯陣列,字典


     2. 集合類都重寫了toString方法。String類重寫了equal和hashCode方法,比較的是值。
     


重寫equals方法時需要重寫hashCode方法,主要是針對Map、Set等集合型別的使用;

a: Map、Set等集合型別存放的物件必須是唯一的;

b: 集合類判斷兩個物件是否相等,是先判斷equals是否相等,如果equals返回TRUE,還要再判斷HashCode返回值是否ture,只有兩者都返回ture,才認為該兩個物件是相等的。

2、由於Object的hashCode返回的是物件的hash值,所以即使equals返回TRUE,集合也可能判定兩個物件不等,所以必須重寫hashCode方法,以保證當equals返回TRUE時,hashCode也返回Ture,這樣才能使得集合中存放的物件唯一。


重寫hashcode的時候會用31這個數 一般寫法:

    @Override  
    public int hashCode() {  
        int result = 17;  
        result = result * 31 + name.hashCode();  
        result = result * 31 + age;  
         
        return result;  
    }  

我的理解是:

首先為了儘量讓產生hashcode保持唯一,所以一定使用一個素數來做係數(這裡的31)。

但為什麼是31而不是別的素數呢,因為: 
   31可以 由i*31== (i<<5)-1來表示,現在很多虛擬機器裡面都有做相關優化,使用31的原因可能是為了更好的分配hash地址,並且31只佔用5bits! 
     所以從效率上 它是2的5次減1,對計算機來說2的乘除操作只需要做位移操作,例如*32就是左移5位。 
也就是說31對計算機的角度來說運算更快、切佔記憶體不多不少,而且形成慣例,虛擬機器甚至都專門對他做了優化。所以常用31做係數算hashcode