python讀取csv檔案指定行的2種方法詳解
csv是Comma-Separated Values的縮寫,是用文字檔案形式儲存的表格資料,比如如下的表格
就可以儲存為csv檔案,檔案內容是:
No.,Name,Age,Score
1,Apple,12,98
2,Ben,13,97
3,Celia,14,96
4,Dave,15,95
假設上述csv檔案儲存為"A.csv",如何用Python像操作Excel一樣提取其中的一行,也就是一條記錄,利用Python自帶的csv模組,有2種方法可以實現:
方法一:reader
第一種方法使用reader函式,接收一個可迭代的物件(比如csv檔案),能返回一個生成器,就可以從其中解析出csv的內容:比如下面的程式碼可以讀取csv的全部內容,以行為單位:
import csv with open('A.csv','rb') as csvfile: reader = csv.reader(csvfile) rows = [row for row in reader] print rows
得到:
[['No.','Name','Age','Score'],
['1','Apple','12','98'],
['2','Ben','13','97'],
['3','Celia','14','96'],
['4','Dave','15','95']]
要提取其中第二行,可以用下面的程式碼:
import csv with open('A.csv','rb') as csvfile: reader = csv.reader(csvfile) for i,rows in enumerate(reader): if i == 2: row = rows print row
得到:
['2','97']
這種方法是通用的方法,要事先知道行號,比如Ben的記錄在第2行,而不能根據'Ben'這個名字查詢。這時可以採用第二種方法:
方法二:DictReader
第二種方法是使用DictReader,和reader函式類似,接收一個可迭代的物件,能返回一個生成器,但是返回的每一個單元格都放在一個字典的值內,而這個字典的鍵則是這個單元格的標題(即列頭)。用下面的程式碼可以看到DictReader的結構:
import csv with open('A.csv','rb') as csvfile: reader = csv.DictReader(csvfile) rows = [row for row in reader] print rows
得到:
[{'Age': '12','No.': '1','Score': '98','Name': 'Apple'},
{'Age': '13','No.': '2','Score': '97','Name': 'Ben'},
{'Age': '14','No.': '3','Score': '96','Name': 'Celia'},
{'Age': '15','No.': '4','Score': '95','Name': 'Dave'}]
如果我們想用DictReader讀取csv的某一列,就可以用列的標題查詢:
import csv with open('A.csv','rb') as csvfile: reader = csv.DictReader(csvfile) for row in reader: if row['Name']=='Ben': print row
就得到:
{'Age': '13','Name': 'Ben'}
可見,DictReader很適合讀取csv的的行(記錄)。