【Python學習系列十二】Python庫pandas之CSV匯入
阿新 • • 發佈:2019-01-04
Python Data Analysis Library 或 pandas 是基於NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。
場景:匯入csv並關聯處理,參考和深入:http://pandas.pydata.org/pandas-docs/stable/api.html#dataframe,掌握dataframe操作。
程式碼:
# -*- coding: utf-8 -*- import pandas as pd #import numpy as np dTxn = pd.read_csv(r"D:\train_txn_info.csv", header=0, encoding='utf-8')#交易表 dUse = pd.read_csv(r"D:\test.csv", header=0, encoding='utf-8') #用券表 train_dataset = pd.merge(dTxn, dUse, on= 'phone')#依據欄位'phone'將dTxn和dUse兩張表拼接在一起 print train_dataset.head(10) #train_dataset.to_csv('D:\train_dataset.csv',index=False,sep='')#輸出