python pandas模塊,nba數據處理(1)
阿新 • • 發佈:2017-06-03
excel inpu con num 表結構 固定 sql 面向列 lines
pandas提供了使我們能夠快速便捷地處理結構化數據的大量數據結構和函數。pandas兼具Numpy高性能的數組計算功能以及電子表格和關系型數據(如SQL)靈活的數據處理能力。它提供了復雜精細的索引功能,以便更為便捷地完成重塑、切片和切塊、聚合以及選取數據子集等操作。
對於金融行業的用戶,pandas提供了大量適用於金融數據的高性能時間序列功能和工具。
DataFrame是pandas的一個對象,它是一個面向列的二維表結構,且含有行標和列標。
在指定的錄目下打開ipython notebook
1,pandas 打開並讀取csv文件
import pandas as pd df=pd.read_csv(‘d:/fff.csv‘)
2.pandas打開excel文件
import pandas as pd df=pd.read_excel(‘d:/aaa.xlsx‘)
3,pandas 保存數據到csv文件
df.to_csv(‘d:/aaa.csv‘, encoding=‘utf-8‘,index=‘False‘)
若沒有該文件,則自動生成
在當前錄目下保存nba數據為csv
頭部信息的處理
import pandas as pd
dataset=pd.read_csv(‘nba.csv‘,parse_dates=["Date"],skiprows=[1,]) 尋找表頭
dataset.columns=["","Date","Score Type","Visitor Team","VisitorPts","Home Team","HomePts","OT?","Notes"]替換表頭
pandas讀取處理:
-
skiprows:跳過?定的?數
-
nrows:僅讀取?定的?數
-
skipfooter:尾部有固定的?數永不讀取
-
skip_blank_lines:空?跳過
python pandas模塊,nba數據處理(1)