1. 程式人生 > 其它 >視覺化繪圖前提,Numpy和Pandas

視覺化繪圖前提,Numpy和Pandas

# 生成numpy陣列的方法array() array()生成的是二維陣列,非常方便統計

 1 import csv
 2 
 3 import numpy
 4 
 5 # arr1 = numpy.zeros(5)
 6 #
 7 # arr2 = numpy.zeros([5,3],dtype=int)
 8 #
 9 # print(arr1)
10 # print(arr1)
11 
12 # 生成numpy陣列的方法array() array()生成的是二維陣列,非常方便統計
13 import pandas as pandas
14 
15 arr6 = numpy.array([['
zhang',22,172],['li','23',175],['xi',25,173]]) #輸出一個三行三列的陣列 16 17 print(arr6)


1 [['zhang' '22' '172']
2  ['li' '23' '175']
3  ['xi' '25' '173']]


# 生成numpy陣列的方法arange() 引數為開始位置,結束位置,步長

1 # 生成numpy陣列的方法arange()  引數為開始位置,結束位置,步長
2 
3 arr3 = numpy.arange(6)
4 
5 arr4 = numpy.arange(2,8.1,0.5)      #
arange的操作物件不包括結束位置 6 7 print(arr3) 8 9 print(arr4)
1 [0 1 2 3 4 5]
2 [2.  2.5 3.  3.5 4.  4.5 5.  5.5 6.  6.5 7.  7.5 8. ]

# 生成numpy陣列的方法linspace() 引數為開始位置,結束位置,輸出元素個數 endpoint=False表示不包括結束值本身

1 # 生成numpy陣列的方法linspace()        引數為開始位置,結束位置,輸出元素個數 endpoint=False表示不包括結束值本身
2 arr5= numpy.linspace(0,10,11,endpoint=False)
3 4 print(arr5)
1 [0.         0.90909091 1.81818182 2.72727273 3.63636364 4.54545455
2  5.45454545 6.36363636 7.27272727 8.18181818 9.09090909]

# pandas使用,根據二維陣列,DataFrame()輸出dataframe

1 arr6 = numpy.array([['zhang',22,172],['li','23',175],['xi',25,173]])        #輸出一個三行三列的陣列

2 df = pandas.DataFrame(arr6,index=[1,2,3],columns=['name','old','height'])       #引數分別為輸入二維陣列,index設定行編號,預設為1,2,3.。。column設定列名
1 arr7 = {'name':['zhang','li','xi'],'old':[22,23,25],'height':[172,174,173]}     #也能根據字典型別資料建立dataframe

2
df2 = pandas.DataFrame(arr7,index=[1,2,3],columns=['name','old','height']) #引數分別為輸入二維陣列,index設定行編號,預設為1,2,3.。。column設定列名


# 第三種方法是直接從CSV檔案建立

 1 # 第三種方法是直接從CSV檔案建立
 2 with open('test_dataframe.csv','w',encoding="utf-8",newline='') as wd:
 3     wcsv = csv.writer(wd)
 4 
 5     wcsv.writerow(['name','old','height'])
 6     i = 3
 7     for x in range(i):
 8         wcsv.writerow(["zhang",'22','172'])
 9     wd.close()
10 
11 
12 df3 = pandas.read_csv('test_dataframe.csv')         #直接從CSV檔案scdataframe

按指定格式輸出dataframe

1 df3.index = [1,2,3] #指定index輸出
2 
3 df3['address'] = ['shengzhen','nanjing','shanghai']     #新增一列輸出
4 
5 print(df3.loc[1])   #read_csv物件可以只輸出某一行的值
6 
7 print(df3.name)     #單獨輸出某一列的值