1. 程式人生 > >資料分析----pandas的使用

資料分析----pandas的使用

學習使用每件三方庫, 都需要先下載
pip install pandas
下載完成後,匯入pandas
import pandas as pd
在這裡將pandas匯入, 用pd代替使用,方便我們書寫
1, Series的使用:

s = pd.Series([3,-5,7,4],index=['a','b','c','d'])
2, DataFrame
使用字典建立一個DataFrame,字典的Key會自動成為索引,一個Key預設對應一列資料
data= {'Country':['Belgium','India','Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasília'], 'Population': [11190846, 1303171035, 207847528]}


df = pd.DataFrame(data,columns=['Country', 'Capital', 'Population'])
df.head(2) 提取頭兩行
df.tail(2)提取結尾資料,引數制定從結尾開始多少行
DataFrame儲存資料庫,示例:pandas與資料庫操作

date_range
# 生成從20180101開始的時間序列預設增加單位是天 dates = pd.date_range('20180101',periods=10)表示從20180101增加10天
pandas支援所有的切片操作

pandas 可以載入很多資料結構
df=pd.read_csv('xxx.csv')
df=pd.read_json('xxx.json')


df=pd.read_excel('xxxx.xlsx')等等,
df.info()檢視資料的基本資訊
選其中的一列,可以使用df.列名 or df['列名']的方式
將缺失資料(NaN)填充為0,也可以自己根據專案需求指定其他資料,使用df.fillna(0)
將缺失資料的行移除(預設操作,可以使用df_score.dropna(axis=1),0:按行,1:按列
df.dropna()

pandas的內外連結
示例: 內外連結示例