Python 操作CSV格式檔案(九)
阿新 • • 發佈:2019-01-06
(一)CSV格式檔案
1.說明
CSV是一種以逗號分隔數值的檔案型別,在資料庫或電子表格中,常見的匯入匯出檔案格式就是CSV格式,CSV格式儲存資料通常以純文字的方式存數資料表。
(二)CSV庫操作csv格式文字
操作一下表格資料:
1.讀取表頭的2中方式
#方式一
import csv
with open("D:\\test.csv") as f:
reader = csv.reader(f)
rows=[row for row in reader]
print(rows[0])
----------
#方式二
import csv
with open("D:\\test.csv") as f:
#1.建立閱讀器物件
reader = csv.reader(f)
#2.讀取檔案第一行資料
head_row=next(reader)
print(head_row)
結果演示:['姓名', '年齡', '職業', '家庭地址', '工資']
2.讀取檔案某一列資料
#1.獲取檔案某一列資料
import csv
with open("D:\\test.csv") as f:
reader = csv.reader(f)
column=[row[0] for row in reader]
print(column)
結果演示:['姓名', '張三', '李四', '王五', 'Kaina']
3.向csv檔案中寫入資料
#1.向csv檔案中寫入資料
import csv
with open("D:\\test.csv",'a') as f:
row=['曹操','23','學生','黑龍江','5000']
write=csv.writer(f)
write.writerow(row)
print("寫入完畢!")
結果演示:
4.獲取檔案頭及其索引
import csv
with open("D:\\test.csv" ) as f:
#1.建立閱讀器物件
reader = csv.reader(f)
#2.讀取檔案第一行資料
head_row=next(reader)
print(head_row)
#4.獲取檔案頭及其索引
for index,column_header in enumerate(head_row):
print(index,column_header)
結果演示:
['姓名', '年齡', '職業', '家庭地址', '工資']
0 姓名
1 年齡
2 職業
3 家庭地址
4 工資
5.獲取某列的最大值
# ['姓名', '年齡', '職業', '家庭地址', '工資']
import csv
with open("D:\\test.csv") as f:
reader = csv.reader(f)
header_row=next(reader)
# print(header_row)
salary=[]
for row in reader:
#把第五列資料儲存到列表salary中
salary.append(int(row[4]))
print(salary)
print("員工最高工資為:"+str(max(salary)))
結果演示:員工最高工資為:10000
6.複製CSV格式檔案
原檔案test.csv
import csv
f=open('test.csv')
#1.newline=''消除空格行
aim_file=open('Aim.csv','w',newline='')
write=csv.writer(aim_file)
reader=csv.reader(f)
rows=[row for row in reader]
#2.遍歷rows列表
for row in rows:
#3.把每一行寫到Aim.csv中
write.writerow(row)
01.未新增關鍵字引數newline=’ ‘的結果:
02新增關鍵字引數newline=’ ‘的Aim.csv檔案的內容:
(三)pandas庫操作CSV檔案
csv檔案內容:
1.安裝pandas庫:pip install pandas
2.讀取csv檔案所有資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
print(data)
結果演示:
姓名 年齡 職業 家庭地址 工資
0 張三 22 廚師 北京市 6000
1 李四 26 攝影師 湖南長沙 8000
2 王五 28 程式設計師 深圳 10000
3 Kaina 22 學生 黑龍江 2000
4 曹操 28 銷售 上海 6000
3.describe()方法資料統計
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#瞭解更多describe()知識,ctr+滑鼠左鍵
print(data.describe())
結果演示:
年齡 工資
count 5.00000 5.000000
mean 25.20000 6400.000000
std 3.03315 2966.479395
min 22.00000 2000.000000
25% 22.00000 6000.000000
50% 26.00000 6000.000000
75% 28.00000 8000.000000
max 28.00000 10000.000000
4.讀取檔案前幾行資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#讀取前2行資料
# head_datas = data.head(0)
head_datas=data.head(2)
print(head_datas)
結果演示:
姓名 年齡 職業 家庭地址 工資
0 張三 22 廚師 北京市 6000
1 李四 26 攝影師 湖南長沙 8000
5.讀取某一行所有資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#讀取第一行所有資料
print(data.ix[0,])
結果演示:
姓名 張三
年齡 22
職業 廚師
家庭地址 北京市
工資 6000
6.讀取某幾行的資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#讀取第一行、第二行、第四行的所有資料
print(data.ix[[0,1,3],:])
結果演示:
姓名 年齡 職業 家庭地址 工資
0 張三 22 廚師 北京市 6000
1 李四 26 攝影師 湖南長沙 8000
3 Kaina 22 學生 黑龍江 2000
7.讀取所有行和列資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#讀取所有行和列資料
print(data.ix[:,:])
結果演示:
姓名 年齡 職業 家庭地址 工資
0 張三 22 廚師 北京市 6000
1 李四 26 攝影師 湖南長沙 8000
2 王五 28 程式設計師 深圳 10000
3 Kaina 22 學生 黑龍江 2000
4 曹操 28 銷售 上海 6000
8.讀取某一列的所有行資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
# print(data.ix[:, 4])
print(data.ix[:,'工資'])
結果演示:
0 6000
1 8000
2 10000
3 2000
4 6000
Name: 工資, dtype: int64
9.讀取某幾列的某幾行
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
print(data.ix[[0,1,3],['姓名','職業','工資']])
結果演示:
姓名 職業 工資
0 張三 廚師 6000
1 李四 攝影師 8000
3 Kaina 學生 2000
10.讀取某一行和某一列對應的資料
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#讀取第三行的第三列
print("職業---"+data.ix[2,2])
結果演示:職業---程式設計師
11.CSV資料的匯入匯出(複製CSV檔案)
讀方式01:
import pandas as pd
#1.讀入資料
data=pd.read_csv(file)
寫出資料02:
import pandas as pd
#1.寫出資料,目標檔案是Aim.csv
data.to_csv('Aim.csv')
其他:
01.讀取網路資料:
import pandas as pd
data_url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv"
#填寫url讀取
df = pd.read_csv(data_url)
----------
02.讀取excel檔案資料
import pandas as pd
data = pd.read_excel(filepath)
例項演示:
1.test.csv原檔案內容
2.現在把test.csv中的內容複製到Aim.csv中
import pandas as pd
file=open('test.csv')
#1.讀取file中的資料
data=pd.read_csv(file)
#2.把data寫到目標檔案Aim.csv中
data.to_csv('Aim.csv')
print(data)
結果演示:
注:pandas模組處理Excel檔案和處理CSV檔案差不多!