1. 程式人生 > 其它 >python處理excel檔案(xls和xlsx)

python處理excel檔案(xls和xlsx)

轉載 https://www.cnblogs.com/Forever77/p/11135124.html

一、xlrd和xlwt

使用之前需要先安裝,windows上如果直接在cmd中執行python則需要先執行pip3 install xlrd和pip3 install xlwt,如果使用pycharm則需要在專案的直譯器中安裝這兩個模組,File-Settings-Project:layout-Project Interpreter,點選右側介面的+號,然後搜尋xlrd和xlwt,然後點選Install Package進行安裝。

對於excel來說,整個excel檔案稱為工作簿,工作簿中的每個頁稱為工作表,工作表又由單元格組成。

對於xlrd和xlwt,行數和列數從0開始,單元格的行和列也從0開始,例如sheet.row_values(2)表示第三行的內容,sheet.cell(1,2).value表示第二行第三列單元格的內容。

1.xlrd模組讀取excel檔案

使用xlrd模組之前需要先匯入import xlrd,xlrd模組既可讀取xls檔案也可讀取xlsx檔案。

獲取工作簿物件:book = xlrd.open_workbook('excel檔名稱')

獲取所有工作表名稱:names = book.sheet_names(),結果為列表

根據索引獲取工作表物件:sheet = book.sheet_by_index(i)

根據名稱獲取工作表物件:sheet = book.sheet_by_name('工作表名稱')

獲取工作表行數:rows = sheet.nrows

獲取工作表列數:cols = sheet.ncols

獲取工作表某一行的內容:row =sheet.row_values(i) ,結果為列表 【sheet.row(i),列表】

獲取工作表某一列的內容:col =sheet.col_values(i) 結果為列表 【sheet.col(i),列表】

獲取工作表某一單元格的內容:cell = sheet.cell_value(m,n)、 sheet.cell(m,n).value、sheet.row(m)[n].value,sheet.col(n)[m].value,結果為字串或數值 【sheet.cell(0,0),xlrd.sheet.Cell物件】

示例:假設在py執行檔案同層目錄下有一fruit.xls檔案,有三個sheet頁Sheet1、Sheet2、Sheet3,其中Sheet1內容如下:

xlrd讀取excel示例

可以看出通過sheet.row(i)、sheet.col(i)也可獲取行或列的內容,並且結果也是一個列表,但是列表中的每一項類似字典的鍵值對,形式為資料型別:值。

而sheet.cell(0,0)獲取單元格內容,結果是一個鍵值對,並且是一個xlrd.sheet.Cell物件。

2.xlwt寫入excel檔案

使用xlwt模組之前需要先匯入import xlwt,xlwt模組只能寫xls檔案,不能寫xlsx檔案(寫xlsx程式不會報錯,但最後檔案無法直接開啟,會報錯)。

建立工作簿:book = xlwt.Workbook(),如果寫入中文為亂碼,可新增引數encoding = 'utf-8'

建立工作表:sheet = book.add_sheet('Sheet1')

向單元格寫入內容:sheet.write(m,n,'內容1')、sheet.write(x,y,'內容2')

儲存工作簿:book.save('excel檔名稱'),預設儲存在py檔案相同路徑下,如果該路徑下有相同檔案,會被新建立的檔案覆蓋,即xlwt不能修改檔案。

xlwt建立並寫入excel示例

逐個單元格寫入excel比較麻煩,可以按行或者列寫入。

xlwt逐行或列寫入excel

二、openpyxl模組

openpyxl模組可實現對excel檔案的讀、寫和修改,只能處理xlsx檔案,不能處理xls檔案,使用之前同樣需要先安裝該模組,再匯入 import openpyxl。

對於openpyxl,行數和列數都從1開始,單元格的行和列也從1開始。例如sheet.cell(1,2).value表示第一行第二列單元格的內容

1.openpyxl讀取excel檔案

獲取工作簿物件:book = openpyxl.load_workbook('excel檔名稱')

獲取所有工作表名稱:names = book.sheetnames

獲取工作表物件:sheet1 = book.worksheets[n]、sheet2 = book['工作表名稱']、sheet3 = book[book.sheetnames[n]]

獲取工作表名稱:title = sheet1.title

獲取工作表行數:rows = sheet1.max_row

獲取工作表列數:cols = sheet1.max_column

獲取某一單元格內容:cell =sheet.cell(1,2).value、sheet['單元格'].value例如sheet['B1'].value

假設有一fruit2.xlsx,除字尾名其他與上述fruit.xls完全一樣

openpyxl讀取excel示例

2.行和列生成器

對於xlrd模組來說,可直接通過sheet.row[i]和sheet.col[i]獲取行和列的內容,但是對於openpyxl模組來說,無法直接獲取某一行或列的內容,openpyxl模組的sheet.rows和sheet.columns表示行和列的生成器,即generator object,需要通過迴圈或轉換成列表、元組的形式得到行或列的值。

openpyxl的行和列生成器

如果要獲取某一行或者列的內容,可將行、列生成器物件轉換成列表或者元組,再迴圈列表或者元組得到內容。

前面說過openpyxl模組的行和列都從1開始,但是由於將生成器轉化成了列表list(sheet.rows),而列表的索引從0開始,因此list(sheet.rows)[1]還是表示第二行的內容,不是第一行的內容。

獲取某一行或者列的內容

獲取單元格的內容

print(sheet.cell(1,2).value)  #第一行第二列單元格的內容
print(sheet['a2'].value)  #使用excel單元格的表示法,字母不區分大小寫

3.openpyxl寫excel檔案

建立工作簿:book = openpyxl.Workbook(),如果寫入中文為亂碼,可新增引數encoding = 'utf-8'

建立工作表:sheet = book.create_sheet('工作表名稱',0),0表示建立的工作表在工作薄最前面

向單元格寫入內容:sheet.cell(m,n,'內容1')、sheet.cell(x,y,'內容2')

儲存工作簿:book.save('excel檔名稱'),預設儲存在py檔案相同路徑下,如果該路徑下有相同檔案,會被新建立的檔案覆蓋。

openpyxl建立和寫excel示例

4.openpyxl修改excel檔案

sheet.insert_rows(m)和sheet.insert_cols(n)分別表示在第m行、第n列前面插入行、列

sheet.delete_rows(m)和sheet.delete_cols(n)分別表示刪除第m行、第n列

openpyxl在指定位置增加行

修改單元格內容:sheet.cell(m,n) = '內容1'或者sheet['B3'] = '內容2'

openpyxl修改單元格的內容

在最後追加行:sheet.append(可迭代物件)

append在最後追加行

xlrd、xlwt和openpyxl處理excel檔案,在寫入檔案的時候不如pandas簡單,pandas處理excel檔案見另外一篇部落格https://www.cnblogs.com/Forever77/p/11298173.html