小師妹學JavaIO之:NIO中那些奇怪的Buffer
阿新 • • 發佈:2020-06-13
[toc]
# 簡介
妖魔鬼怪快快顯形,今天F師兄幫助小師妹來斬妖除魔啦,什麼BufferB,BufferL,BufferRB,BufferRL,BufferS,BufferU,BufferRS,BufferRU統統給你剖析個清清楚楚明明白白。
# Buffer的分類
小師妹:F師兄不都說JDK原始碼是最好的java老師嗎?為程不識原始碼,就稱牛人也枉然。但是我最近在學習NIO的時候竟然發現有些Buffer類居然沒有註釋,就那麼突兀的寫在哪裡,讓人好生心煩。
> 更多內容請訪問[www.flydean.com](www.flydean.com)
居然還有這樣的事情?快帶F師兄去看看。
小師妹:F師兄你看,以ShortBuffer為例,它的子類怎麼後面都帶一些奇奇怪怪的字元:
![](https://img-blog.csdnimg.cn/20200521231233790.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_0,text_aHR0cDovL3d3dy5mbHlkZWFuLmNvbQ==,size_35,color_8F8F8F,t_70)
什麼什麼BufferB,BufferL,BufferRB,BufferRL,BufferS,BufferU,BufferRS,BufferRU都來了,點進去看他們的原始碼也沒有說明這些類到底是做什麼的。
還真有這種事情,給我一個小時,讓我仔細研究研究。
一個小時後,小師妹,經過我一個小時的辛苦勘察,結果發現,確實沒有官方文件介紹這幾個類到底是什麼含義,但是師兄我掐指一算,好像發現了這些類之間的小祕密,且聽為兄娓娓道來。
之前的文章,我們講到Buffer根據型別可以分為ShortBuffer,LongBuffer,DoubleBuffer等等。
但是根據本質和使用習慣,我們又可以分為三類,分別是:ByteBufferAsXXXBuffer,DirectXXXBuffer和HeapXXXBuffer。
ByteBufferAsXXXBuffer主要將ByteBuffer轉換成為特定型別的Buffer,比如CharBuffer,IntBuffer等等。
而DirectXXXBuffer則是和虛擬記憶體對映打交道的Buffer。
最後HeapXXXBuffer是在堆空間上面建立的Buffer。
# Big Endian 和 Little Endian
小師妹,F師兄,你剛剛講的都不重要,我就想知道類後面的B,L,R,S,U是做什麼的。
好吧,在給你講解這些內容之前,師兄我給你講一個故事。
話說在明末浙江才女吳絳雪寫過一首詩:《春 景 詩》
>鶯啼岸柳弄春晴,
>柳弄春晴夜月明。
>明月夜晴春弄柳,
>晴春弄柳岸啼鶯。
小師妹,可有看出什麼特異之處?最好是多讀幾遍,讀出聲來。
小師妹:哇,F師兄,這首詩從頭到尾和從尾到頭讀起來是一樣的呀,又對稱又有意境!
不錯,這就是中文的魅力啦,根據讀的方式不同,得出的結果也不同,其實在計算機世界也存在這樣的問題。
我們知道在java中底層的最小儲存單元是Byte,一個Byte是8bits,用16進製表示就是Ox00-OxFF。
java中除了byte,boolean是佔一個位元組以外,好像其他的型別都會佔用多個位元組。
如果以int來舉例,int佔用4個位元組,其範圍是從Ox00000000-OxFFFFFFFF,假如我們有一個int=Ox12345678,存到記憶體地址裡面就有這樣兩種方式。
第一種Big Endian將高位的位元組儲存在起始地址
![](https://img-blog.csdnimg.cn/20200522145311810.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_0,text_aHR0cDovL3d3dy5mbHlkZWFuLmNvbQ==,size_35,color_8F8F8F,t_70)
第二種Little Endian將地位的位元組儲存在起始地址
![](https://img-blog.csdnimg.cn/20200522145506661.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_0,text_aHR0cDovL3d3dy5mbHlkZWFuLmNvbQ==,size_35,color_8F8F8F,t_70)
其實Big Endian更加符合人類的讀寫習慣,而Little Endian更加符合機器的讀寫習慣。
目前主流的兩大CPU陣營中,PowerPC系列採用big endian方式儲存資料,而x86系列則採用little endian方式儲存資料。
如果不同的CPU架構直接進行通訊,就由可能因為讀取順序的不同而產生問題。
java的設計初衷就是一次編寫處處執行,所以自然也做了設計。
所以BufferB表示的是Big Endian的buffer,BufferL表示的是Little endian的Buffer。
而BufferRB,BufferRL表示的是兩種只讀Buffer。
# aligned記憶體對齊
小師妹:F師兄,那這幾個又是做什麼用的呢? BufferS,BufferU,BufferRS,BufferRU。
在講解這幾個類之前,我們先要回顧一下JVM中物件的儲存方式。
還記得我們是怎麼使用JOL來分析JVM的資訊的嗎?程式碼非常非常簡單:
~~~java
log.info("{}", VM.current().details());
~~~
輸出結果:
~~~java
# Running 64-bit HotSpot VM.
# Using compressed oop with 3-bit shift.
# Using compressed klass with 3-bit shift.
# WARNING | Compressed references base/shifts are guessed by the experiment!
# WARNING | Therefore, computed addresses are just guesses, and ARE NOT RELIABLE.
# WARNING | Make sure to attach Serviceability Agent to get the reliable addresses.
# Objects are 8 bytes aligned.
# Field sizes by type: 4, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]
# Array element sizes: 4, 1, 1, 2, 2, 4, 4, 8, 8 [bytes]
~~~
上面的輸出中,我們可以看到:Objects are 8 bytes aligned,這意味著所有的物件分配的位元組都是8的整數倍。
再注意上面輸出的一個關鍵字aligned,確認過眼神,是對的那個人。
aligned對齊的意思,表示JVM中的物件都是以8位元組對齊的,如果物件本身佔用的空間不足8位元組或者不是8位元組的倍數,則補齊。
還是用JOL來分析String物件:
~~~java
[main] INFO com.flydean.JolUsage - java.lang.String object internals:
OFFSET SIZE TYPE DESCRIPTION VALUE
0 12 (object header) N/A
12 4 byte[] String.value N/A
16 4 int String.hash N/A
20 1 byte String.coder N/A
21 1 boolean String.hashIsZero N/A
22 2 (loss due to the next object alignment)
Instance size: 24 bytes
Space losses: 0 bytes internal + 2 bytes external = 2 bytes total
~~~
可以看到一個String物件佔用24位元組,但是真正有意義的是22位元組,有兩個2位元組是補齊用的。
對齊的好處顯而易見,就是CPU在讀取資料的時候更加方便和快捷,因為CPU設定是一次讀取多少位元組來的,如果你儲存是沒有對齊的,則CPU讀取起來效率會比較低。
現在可以回答部分問題:BufferU表示是unaligned,BufferRU表示是隻讀的unaligned。
小師妹:那BufferS和BufferRS呢?
這個問題其實還是很難回答的,但是經過師兄我的不斷研究和探索,終於找到了答案:
先看下DirectShortBufferRU和DirectShortBufferRS的區別,兩者的區別在兩個地方,先看第一個Order:
~~~java
DirectShortBufferRU:
public ByteOrder order() {
return ((ByteOrder.nativeOrder() != ByteOrder.BIG_ENDIAN)
? ByteOrder.LITTLE_ENDIAN : ByteOrder.BIG_ENDIAN);
}
~~~
~~~java
DirectShortBufferRS:
public ByteOrder order() {
return ((ByteOrder.nativeOrder() == ByteOrder.BIG_ENDIAN)
? ByteOrder.LITTLE_ENDIAN : ByteOrder.BIG_ENDIAN);
}
~~~
可以看到DirectShortBufferRU的Order是跟nativeOrder是一致的。而DirectShortBufferRS的Order跟nativeOrder是相反的。
為什麼相反?再看兩者get方法的不同:
~~~java
DirectShortBufferU:
public short get() {
try {
checkSegment();
return ((UNSAFE.getShort(ix(nextGetIndex()))));
} finally {
Reference.reachabilityFence(this);
}
}
~~~
~~~java
DirectShortBufferS:
public short get() {
try {
checkSegment();
return (Bits.swap(UNSAFE.getShort(ix(nextGetIndex()))));
} finally {
Reference.reachabilityFence(this);
}
}
~~~
區別出來了,DirectShortBufferS在返回的時候做了一個bits的swap操作。
所以BufferS表示的是swap過後的Buffer,和BufferRS表示的是隻讀的swap過後的Buffer。
# 總結
不寫註釋實在是害死人啊!尤其是JDK自己也不寫註釋的情況下!
更多精彩內容且看:
* [區塊鏈從入門到放棄系列教程-涵蓋密碼學,超級賬本,以太坊,Libra,比特幣等持續更新](http://www.flydean.com/blockchain/)
* [Spring Boot 2.X系列教程:七天從無到有掌握Spring Boot-持續更新](http://www.flydean.com/learn-spring-boot/)
* [Spring 5.X系列教程:滿足你對Spring5的一切想象-持續更新](http://www.flydean.com/spring5/)
* [java程式設計師從小工到專家成神之路(2020版)-持續更新中,附詳細文章教程](https://blog.csdn.net/superfjj/article/details/105482751)
> 本文作者:flydean程式那些事
>
> 本文連結:[http://www.flydean.com/java-io-nio-kinds-of-buffer/](http://www.flydean.com/java-io-nio-kinds-of-buffer/)
>
> 本文來源:flydean的部落格
>
> 歡迎關注我的公眾號:程式那些事,更多精彩等著您!