python之Pandas庫的基本操作
阿新 • • 發佈:2019-02-03
Pandas的安裝比較容易,安裝好Numpy之後,可以通過pip install pandas直接或者下載原始碼之後安裝,但是預設的Pandas還不能讀寫Excel檔案,需要安裝xlrd(讀),xlwt(寫)庫才能支援Excel的讀寫,方法如下:
pip install xlrd 為python新增讀入Excel的功能
pip install xlwt 為python新增寫入Excel的功能
簡單操作程式碼如下:
#Pandas的簡單例子,使用操作 import pandas as pd #通常用pd做pandas別名 s = pd.Series([1,2,3],index = ['a','b','c']) #建立一個序列s d = pd.DataFrame([[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[4,5,6],[1,2,3],[4,5,6]],columns = ['a','b','c']) #建立一個表格 d2 = pd.DataFrame(s) #也可以用已有序列建立表格 print(d.head()) #預覽前五行資料 print(d.describe()) #資料基本統計量 #讀取檔案,注意檔案的儲存路徑不能帶有中文,否則讀取可能出錯 print(pd.read_excel('F:\data.xls')) #讀取Excel檔案,建立DataFrame #執行出錯,不知原因 #print(pd.read_csv('F:\data.csv',encoding = 'utf-8')) #讀取文字格式資料,一般用encoding指定編碼
pandas的基本資料結構是series和DataFrame