Pandas Dataframe的一些操作
阿新 • • 發佈:2020-08-29
讀取txt
# ' 和 " 沒區別,路徑為 \ ,./ 表示為當前目錄下路徑 df = pd.read_csv("./input/"+year+"ha.txt",skiprows =13,skipfooter=2,header=None,sep=" ") #skiprows=[0,2,5]跳過指定行 skiprows=[i for i in range(1,3)]跳過除首行外前n行 #skipfooter=2 跳過末尾n行 #skiprows= lambda x: logic(x) 跳過符合條件的行 其中logic為設定的篩選函式,可參照如下設定 def logic(index): if index % 3 == 0: return True return False
#刪除列 del df[0] del df[5] df=df.iloc[0:221]#選擇前221行 df.columns = ['location_code','Hub','Autho']#給列重新命名
df3.columns=['Eigenvec'] df3=df3['Eigenvec'].str.split(' ', expand=True)#在某列內部以空格進行分割 df3['new'] = df3.index#建立新列 和索引列相同 loca = df3['new'].str.split(' ', expand=True)
result = pd.merge(df1, df2, how='inner', on=['location_code'])#公共列為'location_code' 取交集 result = pd.merge(result, df3, how='inner', on=['location_code'])
result.to_excel('./output/worldtrade_'+year+'_all.xlsx',sheet_name='Sheet')#匯出