1. 程式人生 > 實用技巧 >Pandas Dataframe的一些操作

Pandas Dataframe的一些操作

讀取txt

# ' 和 " 沒區別,路徑為 \ ,./ 表示為當前目錄下路徑
df = pd.read_csv("./input/"+year+"ha.txt",skiprows =13,skipfooter=2,header=None,sep=" ")
#skiprows=[0,2,5]跳過指定行 skiprows=[i for i in range(1,3)]跳過除首行外前n行
#skipfooter=2 跳過末尾n行
#skiprows= lambda x: logic(x) 跳過符合條件的行 其中logic為設定的篩選函式,可參照如下設定
def logic(index):
    if index % 3 == 0:
       return True
    return False

#刪除列
del df[0]
del df[5]
df=df.iloc[0:221]#選擇前221行
df.columns = ['location_code','Hub','Autho']#給列重新命名

df3.columns=['Eigenvec']
df3=df3['Eigenvec'].str.split('  ', expand=True)#在某列內部以空格進行分割
df3['new'] = df3.index#建立新列 和索引列相同
loca = df3['new'].str.split(' ', expand=True)

result = pd.merge(df1, df2, how='inner', on=['location_code'])#公共列為'location_code' 取交集
result = pd.merge(result, df3, how='inner', on=['location_code'])

result.to_excel('./output/worldtrade_'+year+'_all.xlsx',sheet_name='Sheet')#匯出