1. 程式人生 > >Python 操作CSV格式檔案(九)

Python 操作CSV格式檔案(九)

(一)CSV格式檔案

1.說明

CSV是一種以逗號分隔數值的檔案型別,在資料庫或電子表格中,常見的匯入匯出檔案格式就是CSV格式,CSV格式儲存資料通常以純文字的方式存數資料表。

(二)CSV庫操作csv格式文字

操作一下表格資料:
這裡寫圖片描述

1.讀取表頭的2中方式

#方式一
import csv
with open("D:\\test.csv") as f:
    reader = csv.reader(f)
    rows=[row for row in  reader]
    print(rows[0])


----------
#方式二
import csv
with
open("D:\\test.csv") as f: #1.建立閱讀器物件 reader = csv.reader(f) #2.讀取檔案第一行資料 head_row=next(reader) print(head_row)
結果演示:['姓名', '年齡', '職業', '家庭地址', '工資']

2.讀取檔案某一列資料

#1.獲取檔案某一列資料
import csv
with open("D:\\test.csv") as f:
    reader = csv.reader(f)
    column=[row[0] for row in
reader] print(column)
結果演示:['姓名', '張三', '李四', '王五', 'Kaina']

3.向csv檔案中寫入資料

#1.向csv檔案中寫入資料
import csv
with open("D:\\test.csv",'a') as f:
     row=['曹操','23','學生','黑龍江','5000']
     write=csv.writer(f)
     write.writerow(row)
     print("寫入完畢!")

結果演示:
這裡寫圖片描述

4.獲取檔案頭及其索引

import csv
with open("D:\\test.csv"
) as f: #1.建立閱讀器物件 reader = csv.reader(f) #2.讀取檔案第一行資料 head_row=next(reader) print(head_row) #4.獲取檔案頭及其索引 for index,column_header in enumerate(head_row): print(index,column_header)
結果演示:
['姓名', '年齡', '職業', '家庭地址', '工資']
0 姓名
1 年齡
2 職業
3 家庭地址
4 工資

5.獲取某列的最大值

# ['姓名', '年齡', '職業', '家庭地址', '工資']
import csv
with open("D:\\test.csv") as f:
    reader = csv.reader(f)
    header_row=next(reader)
    # print(header_row)
    salary=[]
    for row in reader:
        #把第五列資料儲存到列表salary中
         salary.append(int(row[4]))
    print(salary)
    print("員工最高工資為:"+str(max(salary)))
結果演示:員工最高工資為:10000

6.複製CSV格式檔案

原檔案test.csv
這裡寫圖片描述

import csv
f=open('test.csv')
#1.newline=''消除空格行
aim_file=open('Aim.csv','w',newline='')
write=csv.writer(aim_file)
reader=csv.reader(f)
rows=[row for row in reader]
#2.遍歷rows列表
for row in rows:
    #3.把每一行寫到Aim.csv中
    write.writerow(row)

01.未新增關鍵字引數newline=’ ‘的結果:
這裡寫圖片描述

02新增關鍵字引數newline=’ ‘的Aim.csv檔案的內容:
這裡寫圖片描述

(三)pandas庫操作CSV檔案

csv檔案內容:
這裡寫圖片描述

1.安裝pandas庫:pip install pandas

2.讀取csv檔案所有資料

 import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    print(data)
結果演示:
      姓名  年齡   職業  家庭地址     工資
0     張三  22   廚師   北京市   6000
1     李四  26  攝影師  湖南長沙   8000
2     王五  28  程式設計師    深圳  10000
3  Kaina  22   學生   黑龍江   2000
4     曹操  28   銷售    上海   6000

3.describe()方法資料統計

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    #瞭解更多describe()知識,ctr+滑鼠左鍵
    print(data.describe())
結果演示:
             年齡            工資
count   5.00000      5.000000
mean   25.20000   6400.000000
std     3.03315   2966.479395
min    22.00000   2000.000000
25%    22.00000   6000.000000
50%    26.00000   6000.000000
75%    28.00000   8000.000000
max    28.00000  10000.000000

4.讀取檔案前幾行資料

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    #讀取前2行資料
    # head_datas = data.head(0)
    head_datas=data.head(2)
    print(head_datas)

結果演示:
   姓名  年齡   職業  家庭地址    工資
0  張三  22   廚師   北京市  6000
1  李四  26  攝影師  湖南長沙  8000

5.讀取某一行所有資料

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    #讀取第一行所有資料
    print(data.ix[0,])

結果演示:
姓名        張三
年齡        22
職業        廚師
家庭地址     北京市
工資      6000

6.讀取某幾行的資料

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    #讀取第一行、第二行、第四行的所有資料
    print(data.ix[[0,1,3],:])

結果演示:
      姓名  年齡   職業  家庭地址    工資
0     張三  22   廚師   北京市  6000
1     李四  26  攝影師  湖南長沙  8000
3  Kaina  22   學生   黑龍江  2000

7.讀取所有行和列資料

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    #讀取所有行和列資料
    print(data.ix[:,:])
結果演示:
      姓名  年齡   職業  家庭地址     工資
0     張三  22   廚師   北京市   6000
1     李四  26  攝影師  湖南長沙   8000
2     王五  28  程式設計師    深圳  10000
3  Kaina  22   學生   黑龍江   2000
4     曹操  28   銷售    上海   6000

8.讀取某一列的所有行資料

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    # print(data.ix[:, 4])
    print(data.ix[:,'工資'])
結果演示:
0     6000
1     8000
2    10000
3     2000
4     6000
Name: 工資, dtype: int64

9.讀取某幾列的某幾行

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    print(data.ix[[0,1,3],['姓名','職業','工資']])
結果演示:
      姓名   職業    工資
0     張三   廚師  6000
1     李四  攝影師  8000
3  Kaina   學生  2000

10.讀取某一行和某一列對應的資料

import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
    data=pd.read_csv(file)
    #讀取第三行的第三列
    print("職業---"+data.ix[2,2])
結果演示:職業---程式設計師

11.CSV資料的匯入匯出(複製CSV檔案)

讀方式01:

import pandas as pd
#1.讀入資料
data=pd.read_csv(file)

寫出資料02:

import pandas as pd
#1.寫出資料,目標檔案是Aim.csv
data.to_csv('Aim.csv')

其他:

01.讀取網路資料:
import pandas as pd 
data_url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv"
#填寫url讀取
df = pd.read_csv(data_url)


----------
02.讀取excel檔案資料
import pandas as pd 
data = pd.read_excel(filepath)

例項演示:

1.test.csv原檔案內容
這裡寫圖片描述

2.現在把test.csv中的內容複製到Aim.csv中

import pandas as pd
file=open('test.csv')
#1.讀取file中的資料
data=pd.read_csv(file)
#2.把data寫到目標檔案Aim.csv中
data.to_csv('Aim.csv')
print(data)

結果演示:
這裡寫圖片描述

注:pandas模組處理Excel檔案和處理CSV檔案差不多!