python pandas模組簡單使用(讀取excel為例)
第一步:模組安裝
pip install pandas
第二步:使用(單個工作表為例)
說明:如果有多個工作表,那麼只要指定sheetname=索引,(第一個工作表為0,第二個工作表為1,以此類推)
pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,arse_cols=None,date_parser=None,na_values=None,thousands=None, convert_float=True,has_index_names=None,converters=None,dtype=None,true_values=None,false_values=None,engine=None,squeeze=False,**kwds)
第三步:匯入與讀取資料
import pandas as pd #映入模組 df = pd.read_excel('python0109.xlsx') #讀取excel
第四步:讀取表格資料(iloc[]與loc[]區別)
loc[]:基於行標籤和列標籤(x_label、y_label)進行索引
列標籤:從0開始
行標籤:預設第一行為行標籤
例如:df.loc[0,"case_id"]
結果:1
例如:df.loc[0,"title"]
結果:兩個零相加
iloc[]:基於行索引和列索引(index,columns) 都是從 0 開始
注意:他的行索引預設從第二行開始
例如:df.iloc[0,0]
結果:1
例如:df.iloc[0,1]
結果:兩個零相加
第四步:reindex()使用
df.reindex(['case_id','title','a','b','expected']) 預設指行
例如:df.reindex(columns=['case_id','title','a','b','expected']) 指明之後是列
結果:
第四步:存入列表
1 import pandas as pd 2 df = pd.read_excel('python0109.xlsx') 3 test_data = []4 for i in df.index.values:#獲取行號的索引,並對其進行遍歷: 5 #根據i來獲取每一行指定的資料 並存入到列表中 6 row_data = df.loc[i].reindex(['case_id','title','a','b','expected']) #loc[i]這裡就是行,reindex(['case_id','title','a','b','expected'])這裡就是列
7 test_data.append(row_data) 8 print(test_data)
備註:學習記錄知識