Pandas的應用
pandas:是一個數據分析的類庫
dataframe數據讀入
read_json
html
csv
excel
sql
數據寫出 to_json
html
csv
excel
sql
數據結構
第一個 series :是一個一維的ndarray , 帶有標簽 可以通過標簽作為索引
尺度不能改變,裏面的數據可以改變
series
import pandas as pd
s=pd.Series([1,2,3,45],index=[‘a‘,‘b‘,‘c‘,‘d‘,‘e‘])
print(s[2])
print(s[‘c‘])
可以通過標簽獲取數據,也可以通過索引下標來獲取(前提需要導入包)
第二個 dataframe :是一個二維的ndarray ,帶有標簽(行 ,列) 可以通過行列標簽索引,
尺度可變,數據可變
創建csv文件,esc shift +zz 保存
查看文件 cat +文件名
在pandas裏讀取 df = pd.read_csv(‘students.csv‘)
df.head() #顯示數據
a = df[["name","score"]] #取得名稱和分數 sclect
a.head()
b = df[df["sex"] == ‘男‘] #取得男生信息 where
b.head()
c = df.iloc[:3] limit # loc 以標簽索引 顯示三條數據 iloc 以下標索引 顯示四條數據
c.head()
遍歷只能得到列 得不到元素
for c in df: df.iteritems(): #得到元素
print(c)
name
age
sex
score
數據訪問和變換,統計
select
where
limit
loc 以標簽索引
iloc 以下標索引
數據展示
保存文件 單獨保存付費的文件
import pandas as pd
df = pd.read_csv("kgc.csv")
df1 = df[df[‘price‘]!=‘免費‘]
df1.to_csv(‘付費.csv‘,encoding=‘utf-8‘)
Pandas的應用