Python3 讀取和寫入excel xlsx檔案使用openpyxl

阿新 • • 發佈：2019-01-07

python處理excel已經有大量包，主流代表有：

•xlwings：簡單強大，可替代VBA

•openpyxl：簡單易用，功能廣泛

•pandas：使用需要結合其他庫，資料處理是pandas立身之本

•win32com：不僅僅是excel，可以處理office;不過它相當於是 windows COM 的封裝，新手使用起來略有些痛苦。

•Xlsxwriter：豐富多樣的特性，缺點是不能開啟/修改已有檔案，意味著使用 xlsxwriter 需要從零開始。

•DataNitro：作為外掛內嵌到excel中，可替代VBA，在excel中優雅的使用python

•xlutils：結合xlrd/xlwt，老牌python包，需要注意的是你必須同時安裝這三個庫

openpyxl的使用

openpyxl（可讀寫excel表）專門處理Excel2007及以上版本產生的xlsx檔案，xls和xlsx之間轉換容易

注意：如果文字編碼是“gb2312” 讀取後就會顯示亂碼，請先轉成Unicode

openpyxl定義多種資料格式

最重要的三種：

NULL空值：對應於python中的None，表示這個cell裡面沒有資料。

numberic： 數字型，統一按照浮點數來進行處理。對應於python中的float。

string： 字串型，對應於python中的unicode。

Excel檔案三個物件

workbook： 工作簿，一個excel檔案包含多個sheet。

sheet：工作表，一個workbook有多個，表名識別，如“sheet1”,“sheet2”等。

cell： 單元格，儲存資料物件

1建立一個workbook（工作簿）

wb = Workbook() # 一個工作簿(workbook)在建立的時候同時至少也新建了一張工作表(worksheet)。

2 開啟一個已有的workbook：

 wb = load_workbook('file_name.xlsx')

3 開啟sheet：

通過名字

    ws = wb["frequency"] 或ws2 = wb.get_sheet_by_name('frequency')

不知道名字用index

    sheet_names = wb.get_sheet_names()  #方法得到工作簿的所有工作表

    ws = wb.get_sheet_by_name(sheet_names[index])# index為0為第一張表

或者（呼叫得到正在執行的工作表）

    ws =wb.active或ws = wb.get_active_sheet() #通過_active_sheet_index設定讀取的表，預設0讀第一個表

    活動表表名wb.get_active_sheet().title

4 新建sheet（工作表）

ws1 = wb.create_sheet() #預設插在最後

ws2 = wb.create_sheet(0) #插在開頭 ，在建立工作表的時候系統自動命名，依次為Sheet, Sheet1, Sheet2 ...

ws.title = "New Title" #修改表名稱

簡化 ws2 = wb.create_sheet(title="Pi")

5 讀寫單元格

當一個工作表被建立時，其中是不包含單元格。只有當單元格被獲取時才被建立。這種方式下，我們不會建立我們使用不到的單元格，從而減少了記憶體消耗。

可以直接根據單元格的索引直接獲得

c = ws['A4']     #讀取單元格，如果不存在將在A4新建一個

可以通過cell()方法獲取單元格(行號列號從1開始)

d = ws.cell(row = 4, column = 2) #通過行列讀

d = ws.cell('A4')

寫入單元格（cell）值

ws['A4'] = 4      #寫單元格

ws.cell(row = 4, column = 2).value = 'test'

ws.cell(row = 4, column = 2, value = 'test')

6 訪問多個單元格

cell_range = ws['A1':'C2']    #使用切片獲取多個單元格

get_cell_collection()     #讀所有單元格資料

7 按行、按列操作

逐行讀

 ws.iter_rows(range_string=None, row_offset=0, column_offset=0) #返回一個生成器, 獲得多個單元格

 例如：

  for row in ws.iter_rows('A1:C2'):

      for cell in row:

          print cell

迭代檔案中所有的行或者列:

ws.rows         #迭代讀取行row

ws.columns      #迭代讀取列column

直接讀取行列資料

print rows[n]      #顯示第n行資料

print columns[n]   #顯示第n列資料

逐行寫，新增一行到當前sheet的最底部。

1,如果是list,將list從頭到尾順序新增。 2，如果是dict,按照相應的鍵新增相應的鍵值。

 append([‘This is A1’, ‘This is B1’, ‘This is C1’])

 append({‘A’ : ‘This is A1’, ‘C’ : ‘This is C1’})

 append({1 : ‘This is A1’, 3 : ‘This is C1’})

通過公式計算產生寫入的值

ws["A1"] = "=SUM(1, 1)"

ws["A1"] = "=SUM(B1:C1)"

8 顯示有多少張sheet表

wb.get_sheet_names()

#顯示錶名，錶行數，表列數

print ws.title

print ws.max_row

print ws.max_column

9 獲得列號的字母

from openpyxl.utils import get_column_letter

for  x  in  range( 1, len(record)+ 1 ):

    col = get_column_letter(x)    # 預設x從1開始

    ws.cell( '%s%s' %(col, i)).value = x

通過列字母獲取多個excel資料塊

cell_range = "E3:{0}28".format(get_column_letter(bc_col))

ws["A1"] = "=SUM(%s)"%cell_range

10 excel檔案是gbk編碼，讀入時需要先編碼為gbk，再解碼為unicode，再編碼為utf8

cell_value.encode('gbk').decode('gbk').encode('utf8')

11儲存到檔案

wb = Workbook()

wb.save('balances.xlsx')

save（）會在不提示的情況下用現在寫的內容，覆蓋掉原檔案中的所有內容

寫入例子一

from openpyxl import Workbook

wb = Workbook()

# 啟用 worksheet

ws = wb.active

# 資料可以直接分配到單元格中

ws['A1'] = 42

# 可以附加行，從第一列開始附加

ws.append([1, 2, 3])

# Python 型別會被自動轉換

import datetime

ws['A3'] = datetime.datetime.now().strftime("%Y-%m-%d")

# 儲存檔案

wb.save("sample.xlsx")

寫入例子二

# workbook相關

from openpyxl import Workbook

from openpyxl.compat import range

from openpyxl.utils import get_column_letter

wb = Workbook()

dest_filename = 'empty_book.xlsx'

ws1 = wb.active

ws1.title = "range names"

for row in range(1, 40):

ws1.append(range(600))

ws2 = wb.create_sheet(title="Pi")

ws2['F5'] = 3.14

ws3 = wb.create_sheet(title="Data")

for row in range(10, 20):

for col in range(27, 54):

_ = ws3.cell(column=col, row=row, value="{0}".format(get_column_letter(col)))

print(ws3['AA10'].value)

wb.save(filename=dest_filename)

讀取例子一

from openpyxl.reader.excel import load_workbook
import json

# 讀取excel2007檔案
wb = load_workbook(filename=r'test_book.xlsx')

# 顯示有多少張表
print "Worksheet range(s):", wb.get_named_ranges()
print "Worksheet name(s):", wb.get_sheet_names()

# 取第一張表
sheetnames = wb.get_sheet_names()
ws = wb.get_sheet_by_name(sheetnames[0])

# 顯示錶名，錶行數，表列數
print "Work Sheet Titile:", ws.title
print "Work Sheet Rows:", ws.max_row
print "Work Sheet Cols:", ws.max_column

# 建立儲存資料的字典
data_dic = {}

# 把資料存到字典中
for rx in range(1, ws.max_row + 1):
    temp_list = []
    pid = rx
    w1 = ws.cell(row=rx, column=1).value
    w2 = ws.cell(row=rx, column=2).value
    w3 = ws.cell(row=rx, column=3).value
    w4 = ws.cell(row=rx, column=4).value
    temp_list = [w1, w2, w3, w4]

    data_dic[pid] = temp_list

# 列印字典資料個數
print 'Total:%d' % len(data_dic)
print json.dumps(data_dic, encoding="UTF-8", ensure_ascii=False)

讀取結果：

Worksheet range(s): []

Worksheet name(s): [u'\u6d3b\u52a8\u8868', u'\u7528\u6237\u4fe1\u606f', u'Sheet3']

Work Sheet Titile: 活動表

Work Sheet Rows: 3

Work Sheet Cols: 5

Total:3

{"1": ["張三", 18, "男", "廣州"], "2": ["李四", 20, "女", "湖北"], "3": ["王五", 25, "女", "北京"]}

例項

from openpyxl import Workbook

from openpyxl.compat import range

from openpyxl.cell import get_column_letter

dest_filename = 'empty_book.xlsx'

wb = Workbook()

ws1 = wb.active

ws1.title = "range names"

for row in range(1, 40):

   ws1.append(range(600))

ws3 = wb.create_sheet(title="Data")

for row in range(10, 20):

for col in range(27, 54):

       _ = ws3.cell(column=col, row=row, value="%s" % get_column_letter(col))

print(ws3['AA10'].value)

wb.save(filename = dest_filename)

sheet_ranges = wb['range names']

print(sheet_ranges['D18'].value)

ws['A1'] = datetime.datetime(2010, 7, 21)

ws['A1'].number_format #輸出'yyyy-mm-dd h:mm:ss'

rows = [

    ['Number', 'Batch 1', 'Batch 2'],

    [2, 40, 30],

    [3, 40, 25],

    [4, 50, 30],

    [5, 30, 10],

    [6, 25, 5],

    [7, 50, 10],

rows = [

    ['Date', 'Batch 1', 'Batch 2', 'Batch 3'],

    [date(2015,9, 1), 40, 30, 25],

    [date(2015,9, 2), 40, 25, 30],

    [date(2015,9, 3), 50, 30, 45],

    [date(2015,9, 4), 30, 25, 40],

    [date(2015,9, 5), 25, 35, 30],

    [date(2015,9, 6), 20, 40, 35],

for row in rows:

    ws.append(row)

excel中圖片的處理，PIL模組

try:

from openpyxl.drawing import image

import PIL

except ImportError, e:

print"[ERROR]",e

    report_file = self.excel_path + "/frquency_report_%d.xlsx" %id

    shutil.copyfile(configs.PATTEN_FILE, report_file)

ifnot os.path.exists(report_file):

print"generate file failed: ", report_file

       sys.exit(1)

    wb = load_workbook(report_file)

    ws = wb.get_sheet_by_name('frequency')

    img_f = configs.IMAGE_LOGO

if os.path.exists(img_f):

try:

            img = image.Image(img_f)

            ws.add_image(img, 'A1')

except Exception, e:

print"[ERROR]%s:%s" % (type(e), e)

            ws['A1'] = "程式化營銷平臺"

else:

            ws['A1'] = "程式化營銷平臺"

        font1 = Font(size=22)

        ws['A1'].font = font1

        ws['B4'] = ad_plan #等同ws.cell('B4') = ad_plan

        ws['B5'] = ad_names

        ws['B6'] = str(start_d) + '  to  ' + str(end_d)

        wb.save(report_file)

try:

        wb = load_workbook(report_file)

        ws = wb.get_sheet_by_name('frequency')

        row = 9

for it in query_result:

            one_row = it.split('\t')

print one_row

if'10' == one_row[0]:

                one_row[0] = '10+'

            col = 1

for one_cell in one_row:

                ws.cell(row = row, column = col).value = one_cell

                col = col + 1

            row = row + 1

except Thrift.TException, tx:

print'[ERROR] %s' % (tx.message)

else:

        wb.save(report_file)

finally:

pass

Python3 讀取和寫入excel xlsx檔案使用openpyxl

openpyxl的使用

openpyxl定義多種資料格式

Excel檔案三個物件

1建立一個workbook（工作簿）

2 開啟一個已有的workbook：

3 開啟sheet：

4 新建sheet（工作表）

5 讀寫單元格

6 訪問多個單元格

7 按行、按列操作

8 顯示有多少張sheet表

9 獲得列號的字母

10 excel檔案是gbk編碼，讀入時需要先編碼為gbk，再解碼為unicode，再編碼為utf8

11儲存到檔案

寫入例子一

寫入例子二

讀取例子一

例項

excel中圖片的處理，PIL模組

Python3 讀取和寫入excel xlsx檔案使用openpyxl

Python讀取和寫入Excel檔案

使用JAVA讀取和寫入EXCEL檔案

Python讀取和寫入Excel檔案[整]

Python讀取和寫入Excel文件

C#中NPOI操作excel之讀取和寫入excel數

Unity Excel 檔案讀取和寫入

python模組：xlsxwriter和xlrd相結合讀取、寫入excel檔案

MATLAB讀取和寫入文字檔案、excel檔案

Python3讀取、寫入、追加寫入Excel檔案

C++之讀取和寫入檔案

java操作excel需要的配置以及讀取和寫入方法

macOS python3 opencv 讀取和寫入影象

c++檔案的讀取和寫入

python讀取和寫入csv檔案

Excel：使用java進行對excel的讀取和寫入

java中對txt和excel的讀取和寫入

python讀取和生成excel檔案

Python中檔案的讀取和寫入

讀取檔案全部內容---C++ 和寫入資料到檔案

Python3 讀取和寫入excel xlsx檔案 使用openpyxl

openpyxl的使用

openpyxl定義多種資料格式

Excel檔案三個物件

1建立一個workbook（工作簿）

2 開啟一個已有的workbook：

3 開啟sheet：

4 新建sheet（工作表）

5 讀寫單元格

6 訪問多個單元格

7 按行、按列操作

8 顯示有多少張sheet表

9 獲得列號的字母

10 excel檔案是gbk編碼，讀入時需要先編碼為gbk，再解碼為unicode，再編碼為utf8

11儲存到檔案

寫入例子一

寫入例子二

讀取例子一

例項

excel中圖片的處理，PIL模組

相關推薦

Python3 讀取和寫入excel xlsx檔案使用openpyxl