1. 程式人生 > >數據分析基礎教程Numpy指南筆記

數據分析基礎教程Numpy指南筆記

rgs sign font 功能 hang ptime indices import ges

Numpy指南筆記

第2章:Numpy基礎

創建多維數組
# coding:utf-8
import numpy as np
m=np.array([np.arange(2),np.arange(2)])
print m
print m.shape

技術分享

一維數組切片和索引
# coding:utf-8
import numpy as np
a=np.arange(9)
print a
print a[3:7]
print a[:7:2] #用下標0-7,以2為步長選取元素

技術分享

多維數組切片和索引
# coding:utf-8
import numpy as np
b=np.arange(24).reshape(2,3,4)
print b
print ‘-------------‘
print ‘b[0,0,0]‘,b[0,0,0]
print ‘-------------‘
print ‘b[:,0,0]‘,b[:,0,0]
print ‘-------------‘
print ‘b[0]‘,b[0]
print ‘-------------‘
print ‘b[0,1]‘,b[0,1]
print ‘-------------‘
print ‘b[0,1,::2]‘,b[0,1,::2] #上面數組間隔選取元素
print ‘-------------‘
print ‘b[:,1]‘,b[:,1]
print ‘-------------‘
print ‘b[0,:,1]‘,b[0,:,1]
print ‘-------------‘
print ‘b[0,:,-1]‘,b[0,:,-1] #第一層樓最後一列
print ‘-------------‘
print ‘b[0,::-1,-1]‘,b[0,::-1,-1] #反向選取第一層樓的最後一列的所有房間
print ‘-------------‘
print ‘b[0,::2,-1]‘,b[0,::2,-1] #數組切片中間隔的選定元素
print ‘-------------‘
print ‘b[::-1]‘,b[::-1] #第一層和第二層交換位置
技術分享

技術分享

改變數組的維度
ravel函數可以完成展平操作 shape 改變維度
# coding:utf-8
import numpy as np
b=np.arange(24).reshape(2,3,4)
print b
a= b.ravel()
print a
a.shape=(6,4) #設置數組維度
print a

技術分享

數組的組合 np.hstack水平組合 np.vstack 垂直組合
# coding:utf-8
import numpy as np
a=np.arange(9).reshape(3,3)
print a
b=2*a
print b
print ‘--------------------‘
print np.hstack((a,b)) #數組水平組合
print ‘--------------------‘
print np.vstack((a,b)) #垂直組合

技術分享

第3章:常用函數
import numpy as np
i2=np.eye(2) #2*2數組
np.savetxt(‘eye.txt’,i2) #存儲文件

AAPL,28-01-2011, ,344.17,344.4,333.53,336.1,21144800 #很多數據其中一行
...
技術分享


c,v=np.loadtxt(‘data.csv’,delimiter=’,’,usecols=(6,7),unpack=True) #設置分隔符號為,usecols的參數為一個元組,以獲取第7字段和第8字段的數據。upack參數設置為True,意思是拆分存儲不同列的數據
vwap=np.average(c,weights=v) #以v列的數據作為權重計算c的平均權重值
np.mean(c) #計算c的平均值

時間加權平均價格
t=np.arange(len(c)) #求出行數
np.average(c,weights=t)

h,l=np.loadtxt(‘data.csv’,delimiter=’,’,usecols=(4,5),unpack=True) #將每日最高價和最低價的數據載入數組
np.max(h) #獲取該行最大值
np.min(l) #獲取該行最小值
ptp計算數組的取值範圍=max(array)-min(array)
np.ptp(h) np.ptp(l)
np.median(c) 找到中位數
np.msort(c) 將數組從小到大排序
np.var(c) 計算數組的方差
np.diff(c) 返回由相鄰數組元素的插值構成的數組
np.std() 返回數組的標準差
np.where(數組>0) where函數可以根據指定的條件返回所有滿足條件的數組元素的索引值
strptime() 函數根據指定的格式把一個時間字符串解析為時間元組。
converters:數據列和轉換函數之間進行映射的字典
np.take(數組,索引) 獲取數組索引值的元素值

x = np.array([[1, 2], [3, 4]])
>>> x.ravel()
array([1, 2, 3, 4])
p52沒有完
第3章:便捷函數
技術分享

技術分享

技術分享

np.corrcoef(bhp_returns,vale_returns) 計算兩個矩陣的相關系數
[[1. 0.67841747
0.67841747 1.]] 右對角線是相關系數

poly=np.polyfi(長度,差值, )擬合一系列數據點 實際就是一個函數
np.polyval(poly,長度+1) 推斷下一個值
vals=np.ployval(poly,t)
np.argmax(vals) 函數最大值
np.argmin(vals) 函數最小值
np.sign(change) change是數據列表 返回對應數據正負號對應列表
hanning函數是一個加權余弦的窗函數

第5章:矩陣和通用函數
a=np.mat(‘1 2 3;4 5 6;7 8 9‘) #創建矩陣 有空格
a.T 矩陣轉置
a.I 矩陣求逆
A = np.mat(np.arange(9).reshape(3,3))

技術分享

A = np.eye(2)

技術分享

B=2*A

技術分享

np.bmat(‘A B;A B‘)

技術分享

a=np.arange(9)
print np.add.reduce(a) 求和結果36

a=np.array([2,6,5])
b=np.array([1,2,3])
print np.true_divide(a,b)

技術分享


數組相除

a=np.arange(-4,4)
print a%2

技術分享

[1,1,2,3,5,8,13,21]
a=np.matrix([[1,1],[1,0]]) 創建斐波那契數列矩陣
print (a**4)[0,0] 為5 該數列第5個數


第6章:深入學習NumPy模塊
numpy.linalg模塊包含線性代數的函數,使用這個模塊可以計算逆矩陣,求特征值,解線性方程組以及求解行列式。
求逆矩陣
import numpy as np
A=np.mat(‘0 1 2;1 0 3;4 -3 8‘)
print A
inverse=np.linalg.inv(A)
print inverse

技術分享

求解線性方程組的解
# coding:utf-8
import numpy as np
A=np.mat(‘1 -2 1;0 2 -8;-4 5 9‘)
print A
b=np.array([0,8,-9]) #數組y
print b
x=np.linalg.solve(A,b)
print x

技術分享

numpy.linalg模塊中,eigvals函數可以計算矩陣的特征值
# coding:utf-8
import numpy as np
A=np.mat(‘3 -2;1 0‘)
print A
B=np.linalg.eigvals(A)
print B

技術分享

eig函數求解特征值和特征向量
# coding:utf-8
import numpy as np
A=np.mat(‘3 -2;1 0‘)
print A
B=np.linalg.eig(A)
print B

技術分享

奇異值分解
# coding:utf-8
import numpy as np
A=np.mat(‘4 11 14;8 7 -2‘)
print A
U,Sigma,V=np.linalg.svd(A,full_matrices=False)
print‘U‘
print U
print ‘Sigma‘
print Sigma
print ‘V‘
print V
技術分享


並非得到中間的奇異值矩陣,得到的是對角線上的值

矩陣行列式
# coding:utf-8
import numpy as np
A=np.mat(‘3 4;5 6‘)
print A
B=np.linalg.det(A)
print B
技術分享


第七章:專用函數
sort函數返回排序後的數組
lexsort 函數根據鍵值的字典序進行排序
argsort 函數返回輸入數組排序後的下標
ndarray類的sort方法可對數組進行原地排序
msort函數沿著第一個軸排序
sort_complex函數對復數按照先實部後虛部的順序進行排序

argmax函數返回數組中最大值對應下標 argmin類似
# coding:utf-8
import numpy as np
a = np.array([2,4,8])
print np.argmax(a)

技術分享

searchsorted函數為指定的插入值返回一個在有序數組中的索引位置
# coding:utf-8
import numpy as np
a = np.arange(5)
print a
indices=np.searchsorted(a,[-2,7])
print indices

技術分享

numpy的extract函數可以根據某個條件從數組中抽取元素。
使用nonzero函數抽取數組中的非零元素
# coding:utf-8
import numpy as np
a = np.arange(7)
print a
condition=(a%2)==0
print ‘even numbers‘,np.extract(condition,a)
print ‘Non zero‘,np.nonzero(a)
技術分享


第9章:使用Matplotlib繪圖
matplotlib.pyplot包中包含了簡單繪圖功能
使用show函數顯示

繪制多項式函數
# coding:utf-8
import numpy as np
import matplotlib.pyplot as plt
func=np.poly1d(np.array([1,2,3,4]).astype(float)) #創建多項式
print func
x=np.linspace(-10,10,30) #在-10和10之間產生30個均勻分布的值
y=func(x) #創建多項式的值
plt.plot(x,y) #調用plot函數
plt.xlabel(‘x‘) #使用xlabel函數添加x軸標簽
plt.ylabel(‘y(x)‘)
plt.show()

技術分享

數據分析基礎教程Numpy指南筆記