Pandas 基本資料結構
阿新 • • 發佈:2020-12-10
目錄
基本資料結構
- Series: 具有軸標籤(包括時間序列)的一維陣列
- DataFrame: 具有軸標籤, 二維,大小可變, 異構的表格資料。可以視作Series的容器,是pandas主要的資料結構
1. 初識Series
建立一個Series
import pandas as pd import numpy as np s = pd.Series(np.random.randint(1,18,size=3),index=['a','b','c'],name='Random int64 Series',dtype='int64') print(s)
a 17
b 7
c 6
Name: Random int64 Series, dtype: int64
簡單訪問Series的屬性方法
# dir(s) 檢視所有屬性和方法 print("索引:") print(s.index) print("\n取值,根據索引取值:") print(s['b']) print("\nvalues: ") print(s.values) # 平均值,注意這裡Series是random出來的,所以你執行得到的平均值可能不一樣 print("\n平均值") print(s.mean())
索引:
Index(['a', 'b', 'c'], dtype='object')
取值,根據索引取值:
7
values:
[17 7 6]
平均值
10.0
2. 初識DataFrame
建立一個DataFrame
df = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
... columns=['a', 'b', 'c'])
print(df)
a b c
0 1 2 3
1 4 5 6
2 7 8 9
簡單訪問DataFrame的屬性方法
# dir(df) 檢視所有屬性和方法
print("索引:")
print(df.index)
print("\n取值,根據索引取值:")
print(df['a'])
print("\nvalues: ")
print(df.values)
# 平均值,注意這裡Series是random出來的,所以你執行得到的平均值可能不一樣
print("\n平均值")
print(df.mean())
索引:
RangeIndex(start=0, stop=3, step=1)
取值,根據索引取值:
0 1
1 4
2 7
Name: a, dtype: int32
values:
[[1 2 3]
[4 5 6]
[7 8 9]]
平均值
a 4.0
b 5.0
c 6.0
dtype: float64
我是總結
- 認識了pandas兩個基本資料結構: Series和DataFrame
- 學習了Series和DataFrame的基本用法
掃碼關注公眾號: 風起帆揚了
來一起學習,成長,分享
航行在測試的大道上
喜歡就點贊吧