Java中的hashCode() 和 equals()

阿新 • • 發佈：2018-12-13

一、 equals() 的作用

equals() 的作用是 用來判斷兩個物件是否相等。

equals() 定義在JDK的Object.java中。通過判斷兩個物件的地址是否相等(即，是否是同一個物件)來區分它們是否相等。原始碼如下：

public boolean equals(Object obj) {
    return (this == obj);
}

既然Object.java中定義了equals()方法，這就意味著所有的Java類都實現了equals()方法，所有的類都可以通過equals()去比較兩個物件是否相等。但是，我們已經說過，使用預設的“equals()

”方法，等價於“==”方法。因此，我們通常會重寫equals()方法：若兩個物件的內容相等，則equals()方法返回true；否則，返回fasle。

下面根據“類是否覆蓋equals()方法”，將它分為2類。
(01) 若某個類沒有覆蓋equals()方法，當它的通過equals()比較兩個物件時，實際上是比較兩個物件是不是同一個物件。這時，等價於通過“==”去比較這兩個物件。(“==”：比較是否是同一物件，即比較物件的記憶體地址是否相同)
(02) 我們可以覆蓋類的equals()方法，來讓equals()通過其它方式比較兩個物件是否相等。通常的做法是：若兩個物件的內容相等，則equals()方法返回true；否則，返回fasle。

Object類中的equals方法和“==”是一樣的，沒有區別，即倆個物件的比較是比較他們的棧記憶體中儲存的記憶體地址。而String類，Integer類等等一些類，是重寫了equals方法，才使得equals和“==不同”，他們比較的是值是不是相等。所以，當自己建立類時，自動繼承了Object的equals方法，要想實現不同的等於比較，必須重寫equals方法。

下面，舉例對上面的2種情況進行說明。

1. “沒有覆蓋equals()方法”的情況

import java.util.*;
import java.lang.Comparable;

/**
 * @desc equals()的測試程式。
 *
 * @author skywang
 * @emai  
[email protected]
 */
public class EqualsTest1{

    public static void main(String[] args) {
        // 新建2個相同內容的Person物件，
        // 再用equals比較它們是否相等
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        System.out.printf("%s\n", p1.equals(p2)); //結果：false

    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }
    }
}

結果分析：

我們通過 p1.equals(p2) 來“比較p1和p2是否相等時”。實際上，呼叫的Object.java的equals()方法，即呼叫的 (p1==p2) 。它是比較“p1和p2是否是同一個物件”。
而由 p1 和 p2 的定義可知，它們雖然內容相同；但它們是兩個不同的物件！因此，返回結果是false。

2. "覆蓋equals()方法"的情況

我們修改上面的EqualsTest1.java：覆蓋equals()方法。

import java.util.*;
import java.lang.Comparable;

/**
 * @desc equals()的測試程式。
 *
 * @author skywang
 * @emai [email protected]
 */
public class EqualsTest2{

    public static void main(String[] args) {
        // 新建2個相同內容的Person物件，
        // 再用equals比較它們是否相等
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        System.out.printf("%s\n", p1.equals(p2)); //結果：true
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  
              
            //如果是同一個物件返回true，反之返回false  
            if(this == obj){  
                return true;  
            }  
              
            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  
              
            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

結果分析：

我們在EqualsTest2.java 中重寫了Person的equals()函式：當兩個Person物件的 name 和 age 都相等，則返回true。
因此，執行結果返回true。

講到這裡，順便說一下java對equals()的要求。有以下幾點：

1. 對稱性：如果x.equals(y)返回是"true"，那麼y.equals(x)也應該返回是"true"。
2. 反射性：x.equals(x)必須返回是"true"。
3. 類推性：如果x.equals(y)返回是"true"，而且y.equals(z)返回是"true"，那麼z.equals(x)也應該返回是"true"。
4. 一致性：如果x.equals(y)返回是"true"，只要x和y內容一直不變，不管你重複x.equals(y)多少次，返回都是"true"。
5. 非空性，x.equals(null)，永遠返回是"false"；x.equals(和x不同型別的物件)永遠返回是"false"。

現在，再回顧一下equals()的作用：判斷兩個物件是否相等。當我們重寫equals()的時候，可千萬不好將它的作用給改變了！

第2部分 equals() 與 == 的區別

== : 它的作用是判斷兩個物件的地址是不是相等。即，判斷兩個物件是不試同一個物件。

equals() : 它的作用也是判斷兩個物件是否相等。但它一般有兩種使用情況(前面第1部分已詳細介紹過)：
情況1，類沒有覆蓋equals()方法。則通過equals()比較該類的兩個物件時，等價於通過“==”比較這兩個物件。
情況2，類覆蓋了equals()方法。一般，我們都覆蓋equals()方法來兩個物件的內容相等；若它們的內容相等，則返回true(即，認為這兩個物件相等)。

第3部分 hashCode() 的作用

hashCode() 的作用是獲取雜湊碼，也稱為雜湊碼；它實際上是返回一個int整數。這個雜湊碼的作用是確定該物件在雜湊表中的索引位置。

hashCode() 定義在JDK的Object.java中，這就意味著Java中的任何類都包含有hashCode() 函式。
雖然，每個Java類都包含hashCode() 函式。但是，僅僅當建立並某個“類的散列表”(關於“散列表”見下面說明)時，該類的hashCode() 才有用 (作用是：確定該類的每一個物件在散列表中的位置；其它情況下(例如，建立類的單個物件，或者建立類的物件陣列等等)，類的hashCode() 沒有作用。
上面的散列表，指的是：Java集合中本質是散列表的類，如HashMap，Hashtable，HashSet。

也就是說：hashCode() 在散列表中才有用，在其它情況下沒用。在散列表中hashCode() 的作用是獲取物件的雜湊碼，進而確定該物件在散列表中的位置。

至此，我們搞清楚了：hashCode()的作用是獲取雜湊碼。

我們都知道，散列表儲存的是鍵值對(key-value)，它的特點是：能根據“鍵”快速的檢索出對應的“值”。這其中就利用到了雜湊碼！
散列表的本質是通過陣列實現的。當我們要獲取散列表中的某個“值”時，實際上是要獲取陣列中的某個位置的元素。而陣列的位置，就是通過“鍵”來獲取的；更進一步說，陣列的位置，是通過“鍵”對應的雜湊碼計算得到的。

下面，我們以HashSet為例，來深入說明hashCode()的作用。

假設，HashSet中已經有1000個元素。當插入第1001個元素時，需要怎麼處理？因為HashSet是Set集合，它允許有重複元素。
“將第1001個元素逐個的和前面1000個元素進行比較”？顯然，這個效率是相等低下的。散列表很好的解決了這個問題，它根據元素的雜湊碼計算出元素在散列表中的位置，然後將元素插入該位置即可。對於相同的元素，自然是隻儲存了一個。
由此可知，若兩個元素相等，它們的雜湊碼一定相等；但反過來確不一定。在散列表中，
1、如果兩個物件相等，那麼它們的hashCode()值一定要相同；
2、如果兩個物件hashCode()相等，它們並不一定相等。
注意：這是在散列表中的情況。在非散列表中一定如此！

第4部分 hashCode() 和 equals() 的關係

接下面，我們討論另外一個話題。網上很多文章將 hashCode() 和 equals 關聯起來，有的講的不透徹，有誤導讀者的嫌疑。在這裡，我自己梳理了一下 “hashCode() 和 equals()的關係”。

我們以“類的用途”來將“hashCode() 和 equals()的關係”分2種情況來說明。

1. 第一種不會建立“類對應的散列表”

這裡所說的“不會建立類對應的散列表”是說：我們不會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中，用到該類。例如，不會建立該類的HashSet集合。

在這種情況下，該類的“hashCode() 和 equals() ”沒有任何關係！這種情況下，equals() 用來比較該類的兩個物件是否相等。而hashCode() 則根本沒有任何作用，所以，不用理會hashCode()。

2. 第二種會建立“類對應的散列表”

這裡所說的“會建立類對應的散列表”是說：我們會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中，用到該類。例如，會建立該類的HashSet集合。

在這種情況下，該類的“hashCode() 和 equals() ”是有關係的：
1)、如果兩個物件相等，那麼它們的hashCode()值一定相同。
這裡的相等是指，通過equals()比較兩個物件時返回true。
2)、如果兩個物件hashCode()相等，它們並不一定相等。
因為在散列表中，hashCode()相等，即兩個鍵值對的雜湊值相等。然而雜湊值相等，並不一定能得出鍵值對相等。補充說一句：“兩個不同的鍵值對，雜湊值相等”，這就是雜湊衝突。

此外，在這種情況下。若要判斷兩個物件是否相等，除了要覆蓋equals()之外，也要覆蓋hashCode()函式。否則，equals()無效。
例如，建立Person類的HashSet集合，必須同時覆蓋Person類的equals() 和 hashCode()方法。
如果單單只是覆蓋equals()方法。我們會發現，equals()方法沒有達到我們想要的效果。

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時， hashCode()的值。
 *
 * @author skywang
 * @emai [email protected]
 */
public class ConflictHashCodeTest1{

    public static void main(String[] args) {
        // 新建Person物件，
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);

        // 新建HashSet物件 
        HashSet set = new HashSet();
        set.add(p1);
        set.add(p2);
        set.add(p3);

        // 比較p1 和 p2， 並列印它們的hashCode()
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        // 列印set
        System.out.printf("set:%s\n", set);
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return "("+name + ", " +age+")";
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  
              
            //如果是同一個物件返回true，反之返回false  
            if(this == obj){  
                return true;  
            }  
              
            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  
              
            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

執行結果：

p1.equals(p2) : true; p1(1169863946) p2(1690552137)
set:[(eee, 100), (eee, 100), (aaa, 200)]

結果分析：

我們重寫了Person的equals()。但是，很奇怪的發現：HashSet中仍然有重複元素：p1 和 p2。為什麼會出現這種情況呢？

這是因為雖然p1 和 p2的內容相等，但是它們的hashCode()不等；所以，HashSet在新增p1和p2的時候，認為它們不相等。

下面，我們同時覆蓋equals() 和 hashCode()方法。

參考程式碼 (ConflictHashCodeTest2.java)：

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時， hashCode()的值。
 *
 * @author skywang
 * @emai [email protected]
 */
public class ConflictHashCodeTest2{

    public static void main(String[] args) {
        // 新建Person物件，
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);
        Person p4 = new Person("EEE", 100);

        // 新建HashSet物件 
        HashSet set = new HashSet();
        set.add(p1);
        set.add(p2);
        set.add(p3);

        // 比較p1 和 p2， 並列印它們的hashCode()
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)\n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        // 比較p1 和 p4， 並列印它們的hashCode()
        System.out.printf("p1.equals(p4) : %s; p1(%d) p4(%d)\n", p1.equals(p4), p1.hashCode(), p4.hashCode());
        // 列印set
        System.out.printf("set:%s\n", set);
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }

        /** 
         * @desc重寫hashCode 
         */  
        @Override
        public int hashCode(){  
            int nameHash =  name.toUpperCase().hashCode();
            return nameHash ^ age;
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  
              
            //如果是同一個物件返回true，反之返回false  
            if(this == obj){  
                return true;  
            }  
              
            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  
              
            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

執行結果：

p1.equals(p2) : true; p1(68545) p2(68545)
p1.equals(p4) : false; p1(68545) p4(68545)
set:[aaa - 200, eee - 100]

結果分析：

這下，equals()生效了，HashSet中沒有重複元素。
比較p1和p2，我們發現：它們的hashCode()相等，通過equals()比較它們也返回true。所以，p1和p2被視為相等。
比較p1和p4，我們發現：雖然它們的hashCode()相等；但是，通過equals()比較它們返回false。所以，p1和p4被視為不相等。

重寫equals()方法就必須重寫hashCode()方法的原因

從Object類的hashCode()和equals()方法講起：
最近看了Object類的原始碼，對hashCode() 和equals()方法有了更深的認識。重寫equals()方法就必須重寫hashCode()方法的原因，從源頭Object類講起就更好理解了。

先來看Object關於hashCode()和equals()的原始碼：

 public native int hashCode();
    public boolean equals(Object obj) {
        return (this == obj);
    }

光從程式碼中我們可以知道，hashCode()方法是一個本地native方法，返回的是物件引用中儲存的物件的記憶體地址，而equals方法是利用==來比較的也是物件的記憶體地址。從上邊我們可以看出，hashCode方法和equals方法是一致的。還有最關鍵的一點，我們來看Object類中關於hashCode()方法的註釋：

/**
     * Returns a hash code value for the object. This method is
     * supported for the benefit of hash tables such as those provided by
     * {@link java.util.HashMap}.
     * <p>
     * The general contract of {@code hashCode} is:
     * <ul>
     * <li>Whenever it is invoked on the same object more than once during
     *     an execution of a Java application, the {@code hashCode} method
     *     must consistently return the same integer, provided no information
     *     used in {@code equals} comparisons on the object is modified.
     *     This integer need not remain consistent from one execution of an
     *     application to another execution of the same application.
     * <li>If two objects are equal according to the {@code equals(Object)}
     *     method, then calling the {@code hashCode} method on each of
     *     the two objects must produce the same integer result.
     * <li>It is <em>not</em> required that if two objects are unequal
     *     according to the {@link java.lang.Object#equals(java.lang.Object)}
     *     method, then calling the {@code hashCode} method on each of the
     *     two objects must produce distinct integer results.  However, the
     *     programmer should be aware that producing distinct integer results
     *     for unequal objects may improve the performance of hash tables.
     * </ul>
     * <p>
     * As much as is reasonably practical, the hashCode method defined by
     * class {@code Object} does return distinct integers for distinct
     * objects. (This is typically implemented by converting the internal
     * address of the object into an integer, but this implementation
     * technique is not required by the
     * Java™ programming language.)
     *
     * @return  a hash code value for this object.
     * @see     java.lang.Object#equals(java.lang.Object)
     * @see     java.lang.System#identityHashCode
     */
    public native int hashCode();

簡單的翻譯一下就是，hashCode方法一般的規定是：
1.在 Java 應用程式執行期間，在對同一物件多次呼叫 hashCode 方法時，必須一致地返回相同的整數，前提是將物件進行 equals 比較時所用的資訊沒有被修改。從某一應用程式的一次執行到同一應用程式的另一次執行，該整數無需保持一致。
2.如果根據 equals(Object) 方法，兩個物件是相等的，那麼對這兩個物件中的每個物件呼叫 hashCode 方法都必須生成相同的整數結果。
3.如果根據 equals(java.lang.Object) 方法，兩個物件不相等，那麼對這兩個物件中的任一物件上呼叫 hashCode 方法不要求一定生成不同的整數結果。但是，程式設計師應該意識到，為不相等的物件生成不同整數結果可以提高雜湊表的效能。

再簡單的翻譯一下第二三點就是：hashCode()和equals()保持一致，如果equals方法返回true，那麼兩個物件的hasCode()返回值必須一樣。如果equals方法返回false，hashcode可以不一樣，但是這樣不利於雜湊表的效能，一般我們也不要這樣做。重寫equals()方法就必須重寫hashCode()方法的原因也就顯而易見了。

假設兩個物件，重寫了其equals方法，其相等條件是屬性相等，就返回true。如果不重寫hashcode方法，其返回的依然是兩個物件的記憶體地址值，必然不相等。這就出現了equals方法相等，但是hashcode不相等的情況。這不符合hashcode的規則。下邊，會介紹在集合框架中，這種情況會導致的嚴重問題。

    重寫的作用：
        如果重寫（用於需求，比如建立一個Person類，比較相等我只比較其屬性身份證相等就可不管其他屬性，這時候重寫）equals，就得重寫hashCode，和其物件相等保持一致。如果不重寫，那麼呼叫的Object中的方法一定保持一致。
       1. 重寫equals()方法就必須重寫hashCode()方法，主要是針對HashSet和Map集合型別。集合框架只能存入物件（物件的引用（基本型別資料：自動裝箱））。
        在向HashSet集合中存入一個元素時，HashSet會呼叫該物件（存入物件）的hashCode()方法來得到該物件的hashCode()值，然後根據該hashCode值決定該物件在HashSet中儲存的位置。簡單的說：HashSet集合判斷兩個元素相等的標準是：兩個物件通過equals()方法比較相等，並且兩個物件的HashCode()方法返回值也相等。如果兩個元素通過equals()方法比較返回true，但是它們的hashCode()方法返回值不同，HashSet會把它們儲存在不同的位置，依然可以新增成功。同樣：在Map集合中，例如其子類Hashtable（jdk1.0錯誤的命名規範），HashMap，儲存的資料是<key,value>對，key，value都是物件，被封裝在Map.Entry，即：每個集合元素都是Map.Entry物件。在Map集合中，判斷key相等標準也是：兩個key通過equals()方法比較返回true，兩個key的hashCode的值也必須相等。判斷valude是否相等equal()相等即可。
      稍微提一句：（1）兩個物件，用==比較比較的是地址，需採用equals方法（可根據需求重寫）比較。
                              （2）重寫equals()方法就重寫hashCode()方法。
                               （3）一般相等的物件都規定有相同的hashCode。
                                hash：雜湊，Map關聯陣列，字典

2. 集合類都重寫了toString方法。String類重寫了equal和hashCode方法，比較的是值。

重寫equals方法時需要重寫hashCode方法，主要是針對Map、Set等集合型別的使用；

a: Map、Set等集合型別存放的物件必須是唯一的；

b: 集合類判斷兩個物件是否相等，是先判斷equals是否相等，如果equals返回TRUE，還要再判斷HashCode返回值是否ture,只有兩者都返回ture,才認為該兩個物件是相等的。

2、由於Object的hashCode返回的是物件的hash值，所以即使equals返回TRUE，集合也可能判定兩個物件不等，所以必須重寫hashCode方法，以保證當equals返回TRUE時，hashCode也返回Ture，這樣才能使得集合中存放的物件唯一。

重寫hashcode的時候會用31這個數一般寫法：

    @Override  
    public int hashCode() {  
        int result = 17;  
        result = result * 31 + name.hashCode();  
        result = result * 31 + age;  
         
        return result;  
    }

我的理解是:

首先為了儘量讓產生hashcode保持唯一，所以一定使用一個素數來做係數（這裡的31）。

但為什麼是31而不是別的素數呢，因為：
31可以由i*31== (i<<5)-1來表示，現在很多虛擬機器裡面都有做相關優化，使用31的原因可能是為了更好的分配hash地址，並且31只佔用5bits！
所以從效率上它是2的5次減1，對計算機來說2的乘除操作只需要做位移操作，例如*32就是左移5位。
也就是說31對計算機的角度來說運算更快、切佔記憶體不多不少，而且形成慣例，虛擬機器甚至都專門對他做了優化。所以常用31做係數算hashcode

Java中的hashCode() 和 equals()

一、 equals() 的作用

第2部分 equals() 與 == 的區別

第3部分 hashCode() 的作用

第4部分 hashCode() 和 equals() 的關係

重寫equals()方法就必須重寫hashCode()方法的原因

java中hashCode和equals什麽關系，hashCode到底怎麽用的

Java 中hashCode()和equals()方法

從語言設計的角度探究Java中hashCode()和equals()的關係

面試點：Java 中 hashCode() 和 equals() 的關係

Java中的==和equals

Java中hashCode￥equals￥==的區別

Java重寫hashCode()和equals()方法

java對hashCode()和equals()方法的探討

java中hashcode與equals詳解（集合中的用法）

Object類中hashCode()和equals()方法詳解（附圖）

hashset中hashcode和equals方法

Java中hashCode與equals方法的約定及重寫原則

聽說你還搞不定java中的==和equals？

理解Java中的hashCode和equals 方法

java中正確使用hashCode和equals方法

Java中的hashcode和equals

Java中的hashCode() 和 equals()

java中單引號與雙引號的區別？hashcode()和equals()

java中為什麽要重寫hashCode和equals?

java中String的equals（）和 ==

Java中的hashCode() 和 equals()

一、 equals() 的作用

第2部分 equals() 與 == 的區別

第3部分 hashCode() 的作用

第4部分 hashCode() 和 equals() 的關係

重寫equals()方法就必須重寫hashCode()方法的原因

相關推薦