1. 程式人生 > >python的pandas庫讀取csv

python的pandas庫讀取csv

port 內存 九月 導出 正式 表頭 根據 字符 上海

首先建立test.csv原始數據,內容如下

時間,地點
一月,北京
二月,上海
三月,廣東
四月,深圳
五月,河南
六月,鄭州
七月,新密
八月,大連
九月,盤錦
十月,沈陽
十一月,武漢
十二月,南京

導出pandas

import pandas as pd
csv=pd.read_csv(test.csv)
print(len(csv))  #結果是12,證明length是csv的列數

參數sep:str, default ‘,’ 指定分隔符。如果不指定參數,默認使用逗號分隔。

usecols : array-like, default None 返回一個數據子集,該列表中的值必須可以對應到文件中的位置(數字可以對應到指定的列)或者是字符傳為文件中的列名。例如:usecols有效參數可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用這個參數可以加快加載速度並降低內存消耗。

csv1=pd.read_csv(test.csv,sep=,,usecols=[0,1])

上述代碼輸出結果

     時間  地點
0    一月  北京
1    二月  上海
2    三月  廣東
3    四月  深圳
4    五月  河南
5    六月  鄭州
6    七月  新密
7    八月  大連
8    九月  盤錦
9    十月  沈陽
10  十一月  武漢
11  十二月  南京
csv2=pd.read_csv(test.csv,sep=,,usecols=[0])

上述代碼輸出結果

     時間
0    一月
1    二月
2 三月 3 四月 4 五月 5 六月 6 七月 7 八月 8 九月 9 十月 10 十一月 11 十二月

csv=pd.read_csv(‘test.csv‘,sep=‘,‘,usecols=[0,1])
print(csv[0:1])
print(‘--------------‘)
print(csv[1:3])

上述代碼輸出結果

時間 地點
0 一月 北京
--------------
時間 地點
1 二月 上海
2 三月 廣東

可見pandas將第一行數據當作表頭,不算做正式數據裏。方括號裏的兩個數字表示從第幾行到第幾行

print
(csv[0:2][時間])

上述代碼運行結果

0    一月
1    二月
Name: 時間, dtype: object
print(csv[0:2][時間].values[0])

上述代碼運行結果

一月

可以看出從方括號裏引用的某幾行數據可以根據表頭單獨輸出,並可以選擇特定一行的值輸出

python的pandas庫讀取csv