1. 程式人生 > >【Python學習系列十二】Python庫pandas之CSV匯入

【Python學習系列十二】Python庫pandas之CSV匯入

Python Data Analysis Library 或 pandas 是基於NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。

場景:匯入csv並關聯處理,參考和深入:http://pandas.pydata.org/pandas-docs/stable/api.html#dataframe,掌握dataframe操作。

程式碼:

# -*- coding: utf-8 -*-

import pandas as pd
#import numpy as np

dTxn = pd.read_csv(r"D:\train_txn_info.csv", header=0, encoding='utf-8')#交易表
dUse = pd.read_csv(r"D:\test.csv", header=0, encoding='utf-8') #用券表
train_dataset = pd.merge(dTxn, dUse, on= 'phone')#依據欄位'phone'將dTxn和dUse兩張表拼接在一起 
print  train_dataset.head(10)
#train_dataset.to_csv('D:\train_dataset.csv',index=False,sep='')#輸出