1. 程式人生 > >Python 讀取csv的某列

Python 讀取csv的某列

csv是Comma-Separated Values的縮寫,是用文字檔案形式儲存的表格資料,比如如下的表格:

就可以儲存為csv檔案,檔案內容是:
No.,Name,Age,Score
1,Apple,12,98
2,Ben,13,97
3,Celia,14,96
4,Dave,15,95


假設上述csv檔案儲存為"A.csv",如何用Python像操作Excel一樣提取其中的一列,即一個欄位,利用Python自帶的csv模組,有兩種方法可以實現:

第一種方法使用reader函式,接收一個可迭代的物件(比如csv檔案),能返回一個生成器,就可以從其中解析出csv的內容:比如下面的程式碼可以讀取csv的全部內容,以行為單位:import csv
with open('A.csv','rb') as csvfile:
    reader = csv.reader(csvfile)
    rows= [row for row in reader]
print rows

得到:[['No.', 'Name', 'Age', 'Score'],
['1', 'Apple', '12', '98'],
['2', 'Ben', '13', '97'],
['3', 'Celia', '14', '96'],
['4', 'Dave', '15', '95']]


要提取其中某一列,可以用下面的程式碼:
import csv
with open('A.csv','rb') as csvfile:
    reader = csv.reader(csvfile)
    column = [row[2] for row in reader]
print column
得到:['Age', '12', '13', '14', '15']

注意從csv讀出的都是str型別。這種方法要事先知道列的序號,比如Age在第2列,而不能根據'Age'這個標題查詢。這時可以採用第二種方法:

第二種方法是使用DictReader,和reader函式類似,接收一個可迭代的物件,能返回一個生成器,但是返回的每一個單元格都放在一個字典的值內,而這個字典的鍵則是這個單元格的標題(即列頭)。用下面的程式碼可以看到DictReader的結構:
import csv
with open('A.csv','rb') as csvfile:
    reader = csv.DictReader(csvfile)
    column = [row for row in reader]
print column
得到:[{'Age': '12', 'No.': '1', 'Score': '98', 'Name': 'Apple'},
{'Age': '13', 'No.': '2', 'Score': '97', 'Name': 'Ben'},
{'Age': '14', 'No.': '3', 'Score': '96', 'Name': 'Celia'},
{'Age': '15', 'No.': '4', 'Score': '95', 'Name': 'Dave'}]


如果我們想用DictReader讀取csv的某一列,就可以用列的標題查詢:
import csv
with open('A.csv','rb') as csvfile:
    reader = csv.DictReader(csvfile)
    column = [row['Age'] for row in reader]
print column

就得到:
['12', '13', '14', '15']