『Numpy』內存分析_利用共享內存創建數組

阿新 • • 發佈：2018-05-12

highlight block 標識查看空間 types length PE 獲取

引、內存探究常用函數

id()，查詢對象標識，通常返回的是對象的地址

sys.getsizeof()，返回的是 這個對象所占用的空間大小，對於數組來說，除了數組中每個值占用空間外，數組對象還會存儲數組長度、數組類型等其他信息

numpy.ndarray.ctypes.data屬性，返回numpy數組的內存位置

array.array.buffer_info()，數組對象的內存信息，返回元素起始地址和元素個數

help(array.buffer_info)
‘‘‘
buffer_info(self, /)
Return a tuple (address, length) giving the current memory address and the length in items of the buffer

used to hold array‘s contents.
‘‘‘

numpy.ndarray.nbytes，獲取數組中存儲的值的占用空間大小

numpy.ndarray.items，獲取數組中每個值的占用空間大小

部分函數試用如下，有意思的是對numpy數組中元素的叠代，它們的id是兩個循環出現的地址，原因不明，

a = np.array([1,2,3,4,5])

 a.ctypes.data
# 2199487215904

id(a)
# 2199565580288

sys.getsizeof(a)
# 116

a.nbytes
# 20

a.itemsize
# 4

for i in a:
    print(id(i), type(i), i)
# 2199565034888 <class ‘numpy.int32‘> 1
# 2199565034912 <class ‘numpy.int32‘> 2
# 2199565034888 <class ‘numpy.int32‘> 3
# 2199565034912 <class ‘numpy.int32‘> 4
# 2199565034888 <class ‘numpy.int32‘> 5

一、使用array.array和numpy.frombuffer實現動態數組

利用array.array數組對象的內存是確定連續的特性(這也是list為什麽不行的原因，實際上array的buffer_info方法就可以查看內存占用情況，返回)，使用np訪問這塊內存，並指定解析方式，從內存創建數組，

從內存創建數組

此時兩個對象共用內存，修改數據會影響兩者，

import numpy as np
from array import array

a = array(‘d‘, [1,2,3,4])
na = np.frombuffer(a, dtype=np.float)

print(a, na)
na[1] = 20
print(a, na)

array(‘d‘, [1.0, 2.0, 3.0, 4.0]) [ 1. 2. 3. 4.]

array(‘d‘, [1.0, 20.0, 3.0, 4.0]) [ 1. 20. 3. 4.]

多維數組創建以及動態添加元素演示

多維就是一維np.array創建後reshape就行了，

import math
buf = array(‘d‘)
for i in range(5):
    buf.append(math.sin(i*0.1))
    buf.append(math.cos(i*0.1))
data = np.frombuffer(buf, dtype=np.float).reshape(-1,2)
print(data)

[[ 0.          1.        ]
 [ 0.09983342  0.99500417]
 [ 0.19866933  0.98006658]
 [ 0.29552021  0.95533649]
 [ 0.38941834  0.92106099]]

array內存分配機制以及動態數組構建的註意項

import sys

a = array("d")
for i in range(10):
    a.append(i)
    if i == 2:
        na = np.frombuffer(a, dtype=float)
    print(a.buffer_info(), sys.getsizeof(a))
    if i == 4:
        print()

(140269607002576, 1) 96
(140269607002576, 2) 96
(140269607002576, 3) 96
(140269607002576, 4) 96
(140269607286768, 5) 128

(140269607286768, 6) 128
(140269607286768, 7) 128
(140269607286768, 8) 128
(140269607021360, 9) 192
(140269607021360, 10) 192

可以看到初始化後會初始化一段空間，當不夠時會繼續分配一段新的空間。

numpy數組指針初始化於i=2時，所以並未更新到最新數據，可以看到數據解析的並非我們想要的，

print(na.ctypes.data, ‘\n‘, na)

140269607002576

[ 6.93023941e-310 1.01768729e-316 0.00000000e+000]

二、利用struct結構體實現動態結構數組

利用struct結構體接收行，利用bytearray存儲二進制數據，利用frombuffer讀取數據，其中使用需要註意數據解析格式的設定要符合struct接收格式設定

import struct

buf = bytearray()
for i in range(5):
    buf += struct.pack(‘=hdd‘,i,math.sin(i*0.1),math.cos(i*0.1))  # ’=‘表示不進行數據內存占用對齊(整形和浮點型占用內存不同)
dtype = np.dtype({‘names‘:[‘id‘,‘sin‘,‘cos‘],‘formats‘:[‘h‘,‘d‘,‘d‘]},align=False)  # align表示是否數據已經進行了對齊
data = np.frombuffer(buf,dtype=dtype)
print(data)
print(data[‘id‘],‘\n‘,data[‘sin‘],‘\n‘,data[‘cos‘])

[(0,  0.        ,  1.        )
 (1,  0.09983342,  0.99500417)
 (2,  0.19866933,  0.98006658)
 (3,  0.29552021,  0.95533649)
 (4,  0.38941834,  0.92106099)]

[0 1 2 3 4] 
 [ 0.          0.09983342  0.19866933  0.29552021  0.38941834] 
 [ 1.          0.99500417  0.98006658  0.95533649  0.92106099]

此時保存出來的數組類似表格，和pd的DataFrame格式類似，行索引是0~n，列索引既可以是0~m也可以使用names的字段，見下篇。

『Numpy』內存分析_利用共享內存創建數組

highlight block 標識查看空間 types length PE 獲取引、內存探究常用函數 id()，查詢對象標識，通常返回的是對象的地址 sys.getsizeof()，返回的是這個對象所占用的空間大小，對於數組來說，除了數組中每個值占用空間外，數

『Numpy』內存分析_利用共享內存創建數組

引、內存探究常用函數

一、使用array.array和numpy.frombuffer實現動態數組

從內存創建數組

多維數組創建以及動態添加元素演示

二、利用struct結構體實現動態結構數組

『Numpy』內存分析_利用共享內存創建數組

『PyTorch』第五彈_深入理解autograd_下：函數擴展&高階導數

numpy創建數組元素的獲取

『Numpy』numpy.ndarray.view_數組視圖_內存數據切割方式指導

『Numpy』內存分析_numpy.dtype內存數據解析方式指導

『Numpy』內存分析_numpy結構化數組

『Python』內存分析_List對象內存占用分析

『PyTorch』第五彈_深入理解Tensor對象_中下：數學計算以及numpy比較

『TensorFlow』徒手裝高達_初號機_添加訓練模組並整合為可用分類網絡

『TensorFlow』徒手裝高達_戰鬥數據收集模塊原型_save&restore

『python』科學計算專項_科學繪圖庫matplotlib學習之繪制動畫（待續）

『python』科學計算專項_科學繪圖庫matplotlib學習(下)

『理論』科學計算專項_線性代數幾何原理剖析

『TensorFlow』測試項目_對評論分類

『Re』知識工程作業_主體識別

『PyTorch』第五彈_深入理解Tensor對象_中上：索引

『PyTorch』第五彈_深入理解autograd_上：Variable

『PyTorch』第五彈_深入理解autograd_下：Variable梯度探究

『PyTorch』第六彈_最小二乘法的不同實現手段(待續)

『PyTorch』第十彈_循環神經網絡

『Numpy』內存分析_利用共享內存創建數組

引、內存探究常用函數

一、使用array.array和numpy.frombuffer實現動態數組

從內存創建數組

多維數組創建以及動態添加元素演示

二、利用struct結構體實現動態結構數組

相關推薦