Buffer源碼深入分析
本機環境:Linux 4.4.0-21-generic #37-Ubuntu SMP Mon Apr 18 18:33:37 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
Buffer
Buffer的類圖如下:
除了Boolean,其他基本數據類型都有對應的Buffer,但是只有ByteBuffer才能和Channel交互。只有ByteBuffer才能產生Direct的buffer
Direct和Heap類型Buffer的本質
首選說說JVM是怎麽進行IO操作的。
JVM在需要通過操作系統調用完成IO操作,比如可以通過read系統調用完成文件的讀取。read的原型是:ssize_t read(int fd,void *buf,size_t nbytes)
,和其他的IO系統調用類似,一般需要緩沖區作為其中一個參數,該緩沖區要求是連續的。
Buffer分為Direct和Heap兩類,下面分別說明這兩類buffer。
Heap
Heap類型的Buffer存在於JVM的堆上,這部分內存的回收與整理和普通的對象一樣。Heap類型的Buffer對象都包含一個對應基本數據類型的數組屬性(比如:final **[] hb),數組才是Heap類型Buffer的底層緩沖區。
但是Heap類型的Buffer不能作為緩沖區參數直接進行系統調用,主要因為下面兩個原因。
JVM在GC時可能會移動緩沖區(復制-整理),緩沖區的地址不固定。
系統調用時,緩沖區需要是連續的,但是數組可能不是連續的(JVM的實現沒要求連續)。
所以使用Heap類型的Buffer進行IO時,JVM需要產生一個臨時Direct類型的Buffer,然後進行數據復制,再使用臨時Direct的Buffer作為參數進行操作系統調用。這造成很低的效率,主要是因為兩個原因:
需要把數據從Heap類型的Buffer裏面復制到臨時創建的Direct的Buffer裏面。
可能產生大量的Buffer對象,從而提高GC的頻率。所以在IO操作時,可以通過重復利用Buffer進行優化。
Direct
Direct類型的buffer,不存在於堆上,而是JVM通過malloc直接分配的一段連續的內存,這部分內存成為直接內存,JVM進行IO系統調用時使用的是直接內存作為緩沖區。-XX:MaxDirectMemorySize
,通過這個配置可以設置允許分配的最大直接內存的大小(MappedByteBuffer分配的內存不受此配置影響)。
直接內存的回收和堆內存的回收不同,如果直接內存使用不當,很容易造成OutOfMemoryError。JAVA沒有提供顯示的方法去主動釋放直接內存,sun.misc.Unsafe類可以進行直接的底層內存操作,通過該類可以主動釋放和管理直接內存。同理,也應該重復利用直接內存以提高效率。
MappedByteBuffer和DirectByteBuffer之間的關系
This is a little bit backwards: By rights MappedByteBuffer should be a subclass of DirectByteBuffer, but to keep the spec clear and simple, and for optimization purposes, it‘s easier to do it the other way around.This works because DirectByteBuffer is a package-private class.(本段話摘自MappedByteBuffer的源碼)
實際上,MappedByteBuffer屬於映射buffer(自己看看虛擬內存),但是DirectByteBuffer只是說明該部分內存是JVM在直接內存區分配的連續緩沖區,並不一是映射的。也就是說MappedByteBuffer應該是DirectByteBuffer的子類,但是為了方便和優化,把MappedByteBuffer作為了DirectByteBuffer的父類。另外,雖然MappedByteBuffer在邏輯上應該是DirectByteBuffer的子類,而且MappedByteBuffer的內存的GC和直接內存的GC類似(和堆GC不同),但是分配的MappedByteBuffer的大小不受-XX:MaxDirectMemorySize參數影響。
MappedByteBuffer封裝的是內存映射文件操作,也就是只能進行文件IO操作。MappedByteBuffer是根據mmap產生的映射緩沖區,這部分緩沖區被映射到對應的文件頁上,屬於直接內存在用戶態,通過MappedByteBuffer可以直接操作映射緩沖區,而這部分緩沖區又被映射到文件頁上,操作系統通過對應內存頁的調入和調出完成文件的寫入和寫出。
MappedByteBuffer
通過FileChannel.map(MapMode mode,long position, long size)
得到MappedByteBuffer,下面結合源碼說明MappedByteBuffer的產生過程。
FileChannel.map
的源碼:
public MappedByteBuffer map(MapMode mode, long position, long size) throws IOException { ensureOpen(); if (position < 0L) throw new IllegalArgumentException("Negative position"); if (size < 0L) throw new IllegalArgumentException("Negative size"); if (position + size < 0) throw new IllegalArgumentException("Position + size overflow"); //最大2G if (size > Integer.MAX_VALUE) throw new IllegalArgumentException("Size exceeds Integer.MAX_VALUE"); int imode = -1; if (mode == MapMode.READ_ONLY) imode = MAP_RO; else if (mode == MapMode.READ_WRITE) imode = MAP_RW; else if (mode == MapMode.PRIVATE) imode = MAP_PV; assert (imode >= 0); if ((mode != MapMode.READ_ONLY) && !writable) throw new NonWritableChannelException(); if (!readable) throw new NonReadableChannelException(); long addr = -1; int ti = -1; try { begin(); ti = threads.add(); if (!isOpen()) return null; //size()返回實際的文件大小 //如果實際文件大小不符合,則增大文件的大小,文件的大小被改變,文件增大的部分默認設置為0。 if (size() < position + size) { // Extend file size if (!writable) { throw new IOException("Channel not open for writing " + "- cannot extend file to required size"); } int rv; do { //增大文件的大小 rv = nd.truncate(fd, position + size); } while ((rv == IOStatus.INTERRUPTED) && isOpen()); } //如果要求映射的文件大小為0,則不調用操作系統的mmap調用,只是生成一個空間容量為0的DirectByteBuffer //並返回 if (size == 0) { addr = 0; // a valid file descriptor is not required FileDescriptor dummy = new FileDescriptor(); if ((!writable) || (imode == MAP_RO)) return Util.newMappedByteBufferR(0, 0, dummy, null); else return Util.newMappedByteBuffer(0, 0, dummy, null); } //allocationGranularity的大小在我的系統上是4K //頁對齊,pagePosition為第多少頁 int pagePosition = (int)(position % allocationGranularity); //從頁的最開始映射 long mapPosition = position - pagePosition; //因為從頁的最開始映射,增大映射空間 long mapSize = size + pagePosition; try { // If no exception was thrown from map0, the address is valid //native方法,源代碼在openjdk/jdk/src/solaris/native/sun/nio/ch/FileChannelImpl.c, //參見下面的說明 addr = map0(imode, mapPosition, mapSize); } catch (OutOfMemoryError x) { // An OutOfMemoryError may indicate that we‘ve exhausted memory // so force gc and re-attempt map System.gc(); try { Thread.sleep(100); } catch (InterruptedException y) { Thread.currentThread().interrupt(); } try { addr = map0(imode, mapPosition, mapSize); } catch (OutOfMemoryError y) { // After a second OOME, fail throw new IOException("Map failed", y); } } // On Windows, and potentially other platforms, we need an open // file descriptor for some mapping operations. FileDescriptor mfd; try { mfd = nd.duplicateForMapping(fd); } catch (IOException ioe) { unmap0(addr, mapSize); throw ioe; } assert (IOStatus.checkAll(addr)); assert (addr % allocationGranularity == 0); int isize = (int)size; Unmapper um = new Unmapper(addr, mapSize, isize, mfd); if ((!writable) || (imode == MAP_RO)) { return Util.newMappedByteBufferR(isize, addr + pagePosition, mfd, um); } else { return Util.newMappedByteBuffer(isize, addr + pagePosition, mfd, um); } } finally { threads.remove(ti); end(IOStatus.checkAll(addr)); } }
map0
的源碼實現:
JNIEXPORT jlong JNICALLJava_sun_nio_ch_FileChannelImpl_map0(JNIEnv *env, jobject this, jint prot, jlong off, jlong len){ void *mapAddress = 0; jobject fdo = (*env)->GetObjectField(env, this, chan_fd); //linux系統調用是通過整型的文件id引用文件的,這裏得到文件id jint fd = fdval(env, fdo); int protections = 0; int flags = 0; if (prot == sun_nio_ch_FileChannelImpl_MAP_RO) { protections = PROT_READ; flags = MAP_SHARED; } else if (prot == sun_nio_ch_FileChannelImpl_MAP_RW) { protections = PROT_WRITE | PROT_READ; flags = MAP_SHARED; } else if (prot == sun_nio_ch_FileChannelImpl_MAP_PV) { protections = PROT_WRITE | PROT_READ; flags = MAP_PRIVATE; } //這裏就是操作系統調用了,mmap64是宏定義,實際最後調用的是mmap mapAddress = mmap64( 0, /* Let OS decide location */ len, /* Number of bytes to map */ protections, /* File permissions */ flags, /* Changes are shared */ fd, /* File descriptor of mapped file */ off); /* Offset into file */ if (mapAddress == MAP_FAILED) { if (errno == ENOMEM) { //如果沒有映射成功,直接拋出OutOfMemoryError JNU_ThrowOutOfMemoryError(env, "Map failed"); return IOS_THROWN; } return handle(env, -1, "Map failed"); } return ((jlong) (unsigned long) mapAddress); }
雖然FileChannel.map()
的zise參數是long,但是size的大小最大為Integer.MAX_VALUE,也就是最大只能映射最大2G大小的空間。實際上操作系統提供的MMAP可以分配更大的空間,但是JAVA限制在2G,ByteBuffer等Buffer也最大只能分配2G大小的緩沖區。
MappedByteBuffer是通過mmap產生得到的緩沖區,這部分緩沖區是由操作系統直接創建和管理的,最後JVM通過unmmap讓操作系統直接釋放這部分內存。
Haep****Buffer
下面以ByteBuffer為例,說明Heap類型Buffer的細節。
該類型的Buffer可以通過下面方式產生:
ByteBuffer.allocate(int capacity)
ByteBuffer.wrap(byte[] array)
使用傳入的數組作為底層緩沖區,變更數組會影響緩沖區,變更緩沖區也會影響數組。ByteBuffer.wrap(byte[] array,int offset, int length)
使用傳入的數組的一部分作為底層緩沖區,變更數組的對應部分會影響緩沖區,變更緩沖區也會影響數組。
DirectByteBuffer
DirectByteBuffer只能通過ByteBuffer.allocateDirect(int capacity)
產生。ByteBuffer.allocateDirect()
源碼如下:
public static ByteBuffer allocateDirect(int capacity) { return new DirectByteBuffer(capacity); }
DirectByteBuffer()
源碼如下:
DirectByteBuffer(int cap) { // package-private super(-1, 0, cap, cap); //直接內存是否要頁對齊,我本機測試的不用 boolean pa = VM.isDirectMemoryPageAligned(); //頁的大小,本機測試的是4K int ps = Bits.pageSize(); //如果頁對齊,則size的大小是ps+cap,ps是一頁,cap也是從新的一頁開始,也就是頁對齊了 long size = Math.max(1L, (long)cap + (pa ? ps : 0)); //JVM維護所有直接內存的大小,如果已分配的直接內存加上本次要分配的大小超過允許分配的直接內存的最大值會 //引起GC,否則允許分配並把已分配的直接內存總量加上本次分配的大小。如果GC之後,還是超過所允許的最大值, //則throw new OutOfMemoryError("Direct buffer memory"); Bits.reserveMemory(size, cap); long base = 0; try { //是吧,unsafe可以直接操作底層內存 base = unsafe.allocateMemory(size); } catch (OutOfMemoryError x) {、 //沒有分配成功,把剛剛加上的已分配的直接內存的大小減去。 Bits.unreserveMemory(size, cap); throw x; } unsafe.setMemory(base, size, (byte) 0); if (pa && (base % ps != 0)) { // Round up to page boundary address = base + ps - (base & (ps - 1)); } else { address = base; } cleaner = Cleaner.create(this, new Deallocator(base, size, cap)); att = null; }
unsafe.allocateMemory()
的源碼在openjdk/src/openjdk/hotspot/src/share/vm/prims/unsafe.cpp中。具體的源碼如下:
UNSAFE_ENTRY(jlong, Unsafe_AllocateMemory(JNIEnv *env, jobject unsafe, jlong size)) UnsafeWrapper("Unsafe_AllocateMemory"); size_t sz = (size_t)size; if (sz != (julong)size || size < 0) { THROW_0(vmSymbols::java_lang_IllegalArgumentException()); } if (sz == 0) { return 0; } sz = round_to(sz, HeapWordSize); //最後調用的是 u_char* ptr = (u_char*)::malloc(size + space_before + space_after),也就是malloc。 void* x = os::malloc(sz, mtInternal); if (x == NULL) { THROW_0(vmSymbols::java_lang_OutOfMemoryError()); } //Copy::fill_to_words((HeapWord*)x, sz / HeapWordSize); return addr_to_java(x); UNSAFE_END
JVM通過malloc分配得到連續的緩沖區,這部分緩沖區可以直接作為緩沖區參數進行操作系統調用。
Buffer源碼深入分析