1. 程式人生 > 程式設計 >python excel多行合併的方法

python excel多行合併的方法

一、概述
現有一個wenda1.xlsx檔案,內容如下:

python excel多行合併的方法

需要將faq記錄合併為一行,效果如下:

python excel多行合併的方法

注意:faq記錄,每一行用||來拼接。

二、多行轉換一行
新建test1.py,內容如下:

# !/usr/bin/python3
# -*- coding: utf-8 -*-
import xlrd

# 開啟excel檔案,建立一個workbook物件
rbook = xlrd.open_workbook('wenda1.xlsx')
# sheets方法返回物件列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
rbook.sheets()
# xls預設有3個工作簿,Sheet1,Sheet2,Sheet3
rsheet = rbook.sheet_by_index(0) # 取第一個工作簿

faq_tmp_dict = {} # FAQ臨時字典
faq_formal_list = [] # FAQ正式列表
first_category_tag = "" # 一級分類標識
index = 0 # 索引

#迴圈工作簿的所有行
for row in rsheet.get_rows():
  index +=1

  first_category_row = row[0] # 1級分類所在的列
  first_category_value = first_category_row.value # 1級分類的值
  if first_category_value != '1級分類': # 排除第一行,這些都是列名
    if first_category_value: # 當1級分類的值不為空時
      # 更新一級分類標識,用#連線
      first_category_tag = "%s#%s"%(first_category_value,index)
      faq_like_column = row[1] # FAQ相似句所在的列
      faq_like_value = faq_like_column.value # FAQ相似句的值
      # 更新臨時字典,不存在預設值為空字典,否則追加到列表中
      faq_tmp_dict.setdefault(first_category_tag,[]).append(faq_like_value)
    else:
      # 當1級分類的值為空時
      faq_like_column = row[1] # FAQ相似句所在的列
      faq_like_value = faq_like_column.value
      faq_tmp_dict.setdefault(first_category_tag,[]).append(faq_like_value)


print(faq_tmp_dict)
# 處理臨時字典
for i in faq_tmp_dict:
  tmp_dict = {}
  # 一級分類,切割#號,取第一個
  first_category = i.split('#')[0]
  # print("first_category",first_category)
  # faq所有記錄,將faq列表轉換為一行,用逗號拼接
  faq_like_all = "||".join(faq_tmp_dict[i])
  # print("faq_merge",faq_all)
  tmp_dict['first_category'] = first_category
  tmp_dict['faq_like_all'] = faq_like_all
  faq_formal_list.append(tmp_dict)

print(faq_formal_list)

執行輸出:

{'閒聊#2': ['不在嗎?','你好在嗎?','你在不在','有人在麼。','你好?','在麼?說話啊','客戶在不在?'],'閒聊#9': ['你好','客服你好','你好,客服']}
[{'first_category': '閒聊','faq_like_all': '不在嗎?||你好在嗎?||你在不在||有人在麼。||你好?||在麼?說話啊||客戶在不在?'},{'first_category': '閒聊','faq_like_all': '你好||客服你好||你好,客服'}]

從上面輸出內容,可以看出。將多行合併為一行,並且將faq記錄寫入到一個字典裡面了。接下來就可以寫入到新表格了。

三、寫入新表格
完整程式碼如下:

# !/usr/bin/python3
# -*- coding: utf-8 -*-
import xlrd

# 開啟excel檔案,建立一個workbook物件
rbook = xlrd.open_workbook('wenda1.xlsx')
# sheets方法返回物件列表,faq_all)
  tmp_dict['first_category'] = first_category
  tmp_dict['faq_like_all'] = faq_like_all
  faq_formal_list.append(tmp_dict)

print(faq_formal_list)

import xlwt
import json
f = xlwt.Workbook()
sheet1 = f.add_sheet('Sheet1',cell_overwrite_ok=True)
row0 = ["1級分類","faq記錄"]

# 寫第一行
for i in range(0,len(row0)):
  sheet1.write(0,i,row0[i])

# # 載入json檔案
# with open("tj.json",'r') as load_f:
#   load_dict = json.load(load_f) # 反序列化檔案
#
num = 0 # 計數器
max_length = 0 # 最大長度
for i in faq_formal_list:
  num+=1 # 自增1

  faq_col = sheet1.col(1) # faq記錄所在的列
  length = len(i['faq_like_all']) # 計算長度
  # print("長度",length)
  # 更新最大長度
  if max_length < length:
    max_length = length

  # 設定表格寬度
  faq_col.width = max_length * 20* 20
  # 寫入庫名
  sheet1.write(num,i['first_category'])
  # faq_like_str = "||".join(i['faq_like_all'])
  sheet1.write(num,1,i['faq_like_all'])

# 儲存到表格
f.save('test1.xls')

執行程式碼,它會生成一個test1.xlsx。

開啟檔案,效果如下:

python excel多行合併的方法

以上就是python excel多行合併的方法的詳細內容,更多關於python excel多行合併的資料請關注我們其它相關文章!