1. 程式人生 > >說說hashCode() 和 equals() 之間的關係?

說說hashCode() 和 equals() 之間的關係?

上一篇關於介紹Object類下的幾種方法時面試題時,提到equals()和hashCode()方法可能引出關於“hashCode() 和 equals() 之間的關係?”的面試題,本篇來解析一下這道基礎面試題。

先祭一張圖,可以思考一下為什麼?

介紹

equals() 的作用是用來判斷兩個物件是否相等。

hashCode() 的作用是獲取雜湊碼,也稱為雜湊碼;它實際上是返回一個int整數。這個雜湊碼的作用是確定該物件在雜湊表中的索引位置。

關係

我們以“類的用途”來將“hashCode() 和 equals()的關係”分2種情況來說明。

1、不會建立“類對應的散列表”

這裡所說的“不會建立類對應的散列表”是說:我們不會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中,用到該類。例如,不會建立該類的HashSet集合。

在這種情況下,該類的“hashCode() 和 equals() ”沒有半毛錢關係的!equals() 用來比較該類的兩個物件是否相等。而hashCode() 則根本沒有任何作用。

下面,我們通過示例檢視類的兩個物件相等 以及 不等時hashCode()的取值。

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時, hashCode()的值。
 *
 */
public class NormalHashCodeTest{

    public static void main(String[] args) {
        // 新建2個相同內容的Person物件,
        // 再用equals比較它們是否相等
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        System.out.printf("p1.equals(p3) : %s; p1(%d) p3(%d)n", p1.equals(p3), p1.hashCode(), p3.hashCode());
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  

            //如果是同一個物件返回true,反之返回false  
            if(this == obj){  
                return true;  
            }  

            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  

            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

 

執行結果:

p1.equals(p2) : true; p1(1169863946) p2(1901116749)
p1.equals(p3) : false; p1(1169863946) p3(2131949076)

從結果也可以看出:p1和p2相等的情況下,hashCode()也不一定相等。

2、會建立“類對應的散列表”

這裡所說的“會建立類對應的散列表”是說:我們會在HashSet, Hashtable, HashMap等等這些本質是散列表的資料結構中,用到該類。例如,會建立該類的HashSet集合。

在這種情況下,該類的“hashCode() 和 equals() ”是有關係的:

  • 如果兩個物件相等,那麼它們的hashCode()值一定相同。這裡的相等是指,通過equals()比較兩個物件時返回true。

  • 如果兩個物件hashCode()相等,它們並不一定相等。因為在散列表中,hashCode()相等,即兩個鍵值對的雜湊值相等。然而雜湊值相等,並不一定能得出鍵值對相等。補充說一句:“兩個不同的鍵值對,雜湊值相等”,這就是雜湊衝突。

此外,在這種情況下。若要判斷兩個物件是否相等,除了要覆蓋equals()之外,也要覆蓋hashCode()函式。否則,equals()無效。

舉例,建立Person類的HashSet集合,必須同時覆蓋Person類的equals() 和 hashCode()方法。 

如果單單只是覆蓋equals()方法。我們會發現,equals()方法沒有達到我們想要的效果。

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時, hashCode()的值。
 *
 */
public class ConflictHashCodeTest1{

    public static void main(String[] args) {
        // 新建Person物件,
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);

        // 新建HashSet物件 
        HashSet set = new HashSet();
        set.add(p1);
        set.add(p2);
        set.add(p3);

        // 比較p1 和 p2, 並列印它們的hashCode()
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        // 列印set
        System.out.printf("set:%sn", set);
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return "("+name + ", " +age+")";
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  

            //如果是同一個物件返回true,反之返回false  
            if(this == obj){  
                return true;  
            }  

            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  

            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

 

執行結果:

p1.equals(p2) : true; p1(1169863946) p2(1690552137)
set:[(eee, 100), (eee, 100), (aaa, 200)]

結果分析:

我們重寫了Person的equals()。但是,很奇怪的發現:HashSet中仍然有重複元素:p1 和 p2。為什麼會出現這種情況呢?

這是因為雖然p1 和 p2的內容相等,但是它們的hashCode()不等;所以,HashSet在新增p1和p2的時候,認為它們不相等。

那同時覆蓋equals() 和 hashCode()方法呢?

import java.util.*;
import java.lang.Comparable;

/**
 * @desc 比較equals() 返回true 以及 返回false時, hashCode()的值。
 *
 */
public class ConflictHashCodeTest2{

    public static void main(String[] args) {
        // 新建Person物件,
        Person p1 = new Person("eee", 100);
        Person p2 = new Person("eee", 100);
        Person p3 = new Person("aaa", 200);
        Person p4 = new Person("EEE", 100);

        // 新建HashSet物件 
        HashSet set = new HashSet();
        set.add(p1);
        set.add(p2);
        set.add(p3);

        // 比較p1 和 p2, 並列印它們的hashCode()
        System.out.printf("p1.equals(p2) : %s; p1(%d) p2(%d)n", p1.equals(p2), p1.hashCode(), p2.hashCode());
        // 比較p1 和 p4, 並列印它們的hashCode()
        System.out.printf("p1.equals(p4) : %s; p1(%d) p4(%d)n", p1.equals(p4), p1.hashCode(), p4.hashCode());
        // 列印set
        System.out.printf("set:%sn", set);
    }

    /**
     * @desc Person類。
     */
    private static class Person {
        int age;
        String name;

        public Person(String name, int age) {
            this.name = name;
            this.age = age;
        }

        public String toString() {
            return name + " - " +age;
        }

        /** 
         * @desc重寫hashCode 
         */  
        @Override
        public int hashCode(){  
            int nameHash =  name.toUpperCase().hashCode();
            return nameHash ^ age;
        }

        /** 
         * @desc 覆蓋equals方法 
         */  
        @Override
        public boolean equals(Object obj){  
            if(obj == null){  
                return false;  
            }  

            //如果是同一個物件返回true,反之返回false  
            if(this == obj){  
                return true;  
            }  

            //判斷是否型別相同  
            if(this.getClass() != obj.getClass()){  
                return false;  
            }  

            Person person = (Person)obj;  
            return name.equals(person.name) && age==person.age;  
        } 
    }
}

 

執行結果:

p1.equals(p2) : true; p1(68545) p2(68545)
p1.equals(p4) : false; p1(68545) p4(68545)
set:[aaa - 200, eee - 100]

結果分析:

這下,equals()生效了,HashSet中沒有重複元素。

比較p1和p2,我們發現:它們的hashCode()相等,通過equals()比較它們也返回true。所以,p1和p2被視為相等。

比較p1和p4,我們發現:雖然它們的hashCode()相等;但是,通過equals()比較它們返回false。所以,p1和p4被視為不相等。

原則

1.同一個物件(沒有發生過修改)無論何時呼叫hashCode()得到的返回值必須一樣。
如果一個key物件在put的時候呼叫hashCode()決定了存放的位置,而在get的時候呼叫hashCode()得到了不一樣的返回值,這個值對映到了一個和原來不一樣的地方,那麼肯定就找不到原來那個鍵值對了。

2.hashCode()的返回值相等的物件不一定相等,通過hashCode()和equals()必須能唯一確定一個物件。不相等的物件的hashCode()的結果可以相等。hashCode()在注意關注碰撞問題的時候,也要關注生成速度問題,完美hash不現實。

3.一旦重寫了equals()函式(重寫equals的時候還要注意要滿足自反性、對稱性、傳遞性、一致性),就必須重寫hashCode()函式。而且hashCode()的生成雜湊值的依據應該是equals()中用來比較是否相等的欄位。

如果兩個由equals()規定相等的物件生成的hashCode不等,對於hashMap來說,他們很可能分別對映到不同位置,沒有呼叫equals()比較是否相等的機會,兩個實際上相等的物件可能被插入不同位置,出現錯誤。其他一些基於雜湊方法的集合類可能也會有這個