String 源碼探究

阿新 • • 發佈：2018-02-25

i++ 字符特殊 length read java編譯無符號意思 stat

起因：忽然想到平時用的HashMap 當key是字符串的時候為什麽總可以覆蓋，然後看了String的源碼發現：

private final char value[];

private int hash; // Default to 0

hashCode方法：

public int hashCode() {
        int h = hash;
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h  
= 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

equals方法：

public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
             
int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i 
++;
                }
                return true;
            }
        }
        return false;
    }

很顯然hashCode和eques方法都是根據char[]數組中的char判斷的，但是hashCode函數裏面為什麽是

h = 31 * h + val[i];這個數字為什麽選擇31吶，引起了我的興趣。

下面是知乎上的回答：

The value 31 was chosen because it is an odd prime. If it were even and the multiplication overflowed, information would be lost, as multiplication by 2 is equivalent to shifting. The advantage of using a prime is less clear, but it is traditional. A nice property of 31 is that the multiplication can be replaced by a shift and a subtraction for better performance: 31 * i == (i << 5) - i. Modern VMs do this sort of optimization automatically.
設計者選擇 31 這個值是因為它是一個奇質數。如果它是一個偶數，在使用乘法當中產生數值溢出時，原有數字的信息將會丟失，因為乘以二相當於位移。
選擇質數的優勢不是那麽清晰，但是這是一個傳統。31 的一個優良的性質是：乘法可以被位移和減法替代： 31 * i == (i << 5) - i
現代的 VM 可以自行完成這個優化。

As Goodrich and Tamassia point out, If you take over 50,000 English words (formed as the union of the word lists
 provided in two variants of Unix), using the constants 31, 33, 37, 39, and 41 will produce less than 7 collisions 
in each case. Knowing this, it should come as no surprise that many Java implementations choose one of these constants.
Coincidentally, I was in the middle of reading the section "polynomial hash codes" when I saw this question.
正如 Goodrich 和 Tamassia 指出的那樣，如果你使用 31，33， 37，39 和 41 這幾個數值，將其應用於 hashCode 的算法中，每一個數字對超過 
50000 個英語單詞（由兩個 Unix 版本的字典的並集構成）產生的 hash 只會產生少於 7 個的沖突。知道了這個之後，Java 大多數的發行版均會使用這幾個
數值之一的事實對你也不會顯得奇怪了。巧合的是，我是在閱讀『多項式哈希值』這一個章節的時候看到這個問題的。

可是為什麽java可以s="abcd"這樣直接賦值吶？難道和c語言裏面的重載一樣嗎？

但是否定的：

因為從語言一級來看，java不支持運算符重載，這點是肯定的。

String類的”=”,”+”,”+=”，看似運算符重載，實際不是，只是在java編譯器裏做了一點手腳。
java編譯器對String的運算符做了特殊處理。

例如：
String s = “a”;
s += “b”;
編譯器轉換成了：
String s = “a”;
s = (new StringBuilder()).append(s).append(“b”).toString();

HashSet: 繼承的AbstractSet內

public int hashCode() {
        int h = 0;
        Iterator<E> i = iterator();
        while (i.hasNext()) {
            E obj = i.next();
            if (obj != null)
                h += obj.hashCode();
        }
        return h;
    }

Integer：

public int hashCode() {
    return hashCode(this.value);
  }

  public static int hashCode(int var0) {
    return var0;
  }

Double:

public int hashCode() {
    return hashCode(this.value);
  }

  public static int hashCode(double var0) {
    long var2 = doubleToLongBits(var0);
    return (int)(var2 ^ var2 >>> 32);
  }

>>：帶符號右移。正數右移高位補0，負數右移高位補1

>>>：無符號右移。無論是正數還是負數，高位通通補0。

下面是關於hashCode的一些解釋：

Hash是散列的意思，就是把任意長度的輸入，通過散列算法變換成固定長度的輸出，該輸出就是散列值。關於散列值，有以下幾個關鍵結論：

1、如果散列表中存在和散列原始輸入K相等的記錄，那麽K必定在f(K)的存儲位置上

2、不同關鍵字經過散列算法變換後可能得到同一個散列地址，這種現象稱為碰撞

3、如果兩個Hash值不同（前提是同一Hash算法），那麽這兩個Hash值對應的原始輸入必定不同

HashCode

然後講下什麽是HashCode，總結幾個關鍵點：

1、HashCode的存在主要是為了查找的快捷性，HashCode是用來在散列存儲結構中確定對象的存儲地址的

2、如果兩個對象equals相等，那麽這兩個對象的HashCode一定也相同

3、如果對象的equals方法被重寫，那麽對象的HashCode方法也盡量重寫

4、如果兩個對象的HashCode相同，不代表兩個對象就相同，只能說明這兩個對象在散列存儲結構中，存放於同一個位置

String 源碼探究

i++ 字符特殊 length read java編譯無符號意思 stat 起因：忽然想到平時用的HashMap 當key是字符串的時候為什麽總可以覆蓋，然後看了String的源碼發現： private final char value[]; private int

String源碼j簡單分析

other -1 bytes pub point bool unicode編碼方法 matches 分析： 1、 private final char value[]; String內部由這個char數組維護String的字符。首先String類用final修飾，不

Java中String、StringBuilder、StringBuffer常用源碼分析及比較（一）：String源碼分析

array string類都是 epo sys 匹配字符串 bound 地址簡單 String：一、成員變量： /** The value is used for character storage. */ private final char value[

String源碼理解之indexOf（JDK1.7）

static img nta from 來看 png val 四種 targe String的indexOf共有四種參數，分別如下圖：其中，第一種內部實現如下： public int indexOf(int ch) { return indexOf(c

String源碼分析

長度 null 分析 nta 完成 bounds pty per 字節數組一、類定義 public final class String implements java.io.Serializable, Comparable<String>, CharSequ

mybatis源碼探究（-）MapperProxyFactory&MapperProxy

rap 最終 version 應該 cati strong 代理類 osc 添加在MyBatis中MapperProxyFactory,MapperProxy,MapperMethod是三個很重要的類。弄懂了這3個類你就大概清楚Mapper接口與SQL的映射，為什麽是

關於String源碼分析

長度 boolean indexof valueof replace 源碼分析拼接方法 inter 關於String的類定義：　　public final class String implements java.io.Serializable, Comparable&

RocketMQ專題2：三種常用生產消費方式(順序、廣播、定時)以及順序消費源碼探究

channel quest 再次指定 conf 默認廣播 body tag 順序、廣播、定時任務前插 ? 在進行常用的三種消息類型例子展示的時候，我們先來說一說RocketMQ的幾個重要概念： PullConsumer與PushConsumer：主要區別在於Pul

源碼探究Java_HashMap

dfa lan style actor urn 節點 pre rac != 1. HashMap 定義，抽取HashMap類中主要變量，如下 public class HashMap<K,V> extends AbstractMap<K,V>

Vue源碼探究-事件系統

註冊事件正則 ref ignore 格式 see 鏈接 click 函數返回 Vue源碼探究-事件系統本篇代碼位於vue/src/core/instance/events.js 緊跟著生命周期之後的就是繼續初始化事件相關的屬性和方法。整個事件系統的代碼相對其他模塊來說非

SpringCloud從入門到進階（三）——源碼探究Eureka集群之replicas的unavailable故障

過多 1.5 微服務 nodes 設置 != des url gets 內容　　本節從源碼的角度探討了Eureka控制臺中為何replicas（副本）顯示unavailable（不可用）的原因。在源碼層級解讀了Eureka Server的replicas是如何解析，以及r

java String源碼淺出

圖片 rust hotspot exc byte isl gin sla lse 1、public char charAt(int index) 返回指定索引處的 char 值。源碼： =====================String.class

從源碼分析java.lang.String.isEmpty()

分析 ise sin html only 幫助 storage dem enc 今天在寫代碼的時候用到了java.lang.String.isEmpty()的這個方法，之前也用過，今天突發奇想，就看了看源碼，了解了解它的實現方法，總結出來，大家可以交流交流。

Java中String、StringBuilder、StringBuffer常用源碼分析及比較（二）：StringBuilder、StringBuffer源碼分析

string類型 character private 字符代碼 less pri des over StringBuilder：一、構造方法： /** * Constructs a string builder with no characters in i

Java中String、StringBuilder、StringBuffer常用源碼分析及比較（三）：String、StringBuilder、StringBuffer比較

val str 成員變量相同 += let .get end art 看這篇隨筆之前請務必先看前面兩章： Java中String、StringBuilder、StringBuffer常用源碼分析及比較（一）：String源碼分析 Java中String、StringBui

Java源碼之String

http協議 water isempty indexof() replace iss 數據 gate builder 本文出自：http://blog.csdn.net/dt235201314/article/details/78330377 一丶概述還記得那會的&l

JDK 1.8 源碼解析 String、StringBuilder和StringBuffer的異同

sta his 獲取對象鎖創建實現 buffer enc 字符串　　JDK提供了String、StringBuilder和StringBuffer這三個類來處理字符串，其中StringBuilder類是在JDK 1.5中新增的。　　不同點如下：　　1 是否有父類

虛擬幣交易系統開發，探究虛擬幣交易平臺源碼中的功能和技術特色

虛擬幣交易系統虛擬幣交易平臺開發虛擬幣交易平臺源碼過去的一周，對於“幣圈”的朋友來說，好消息是比特幣價格的上漲回溫。同時，多國的央行陸續推出了數字貨幣，讓我們對數字貨幣的未來有了更多地期待。如果要進行虛擬幣交易系統開發，應重點關註虛擬幣交易平臺源碼。虛擬幣交易平臺源碼是搭建虛擬幣交易系統的基

java源碼解析之String類(二)

nta sequence objects 常量解析字節整體 require sync 上一節主要介紹了String類的一些構造方法，主要分為四類無參構造器：String()，創建一個空字符串""，區別於null字符串，""已經初始化，null並未初始化副本構造器

jdk1.8源碼閱讀（第2篇）java.lang.String

重要 tin () 分享 nds char cti 存儲構造方法重要屬性 /** The value is used for character storage. */ private final char value[]; *****存儲字符串的字符數組。該數組為

String 源碼探究

相關推薦