word文檔（選擇題）轉換為excl表格

阿新 • • 發佈：2018-12-25

exc 編寫之前 nag work Coding 實例固定格式 save

Word轉excl表格

同事在做一個批量性的工作，就是將word文檔中的題目和選項，轉移到xml文檔中。
實例：
技術分享圖片
轉：

再網上有很多將各種文檔轉化的工具和例子，但是很少有將固定格式進行轉化的。

因為在這之前也是不明所以，老大直接讓寫個腳本，本能的感覺這個腳本不是很好寫，有危險。但是哪有害怕就不做的道理，不會也要幹。

首先確定好轉化思路

1、查了很多資料，轉excl的都是用的json文件轉字典再轉excl或者將字典、元組、列表轉為json再轉excl。歸根結底就是將字典轉excl。比較欣喜的是正好可以將題目當做key，選項和答案當做values。這樣非常符合轉換過程。
2、那麽接下來的問題變成了如何將word文檔內容轉換為字典的形式。其實也一樣很簡單，接下來一點一點的分析就OK了。

環境問題：
python3：在編寫過程中，因為出現中文，會遇到編碼問題，而python3又將編碼優化的很好，所以選擇python3。(如果你出現亂碼，或編碼不正確，請考慮編碼轉化對錯問題)
操作系統：linux（deepin）

困難又簡單的編寫歷程

1、將word文檔轉換為字典形式

（1）讀取word文檔內容，python中給出了模塊，python-docx
下載模塊:

sudo pip3 install python-docx

我們需要用到的這個模塊方法很簡單，只需要讀取和輸出就可以了

import docx
file = docx.Document("./密碼學競賽習題.docx")

Document() 用來打開一個文檔

（2）循環輸出文檔內容，將內容添加到字典當中

從word文檔中我發現從第六行開始，沒六行為一個題目加上答案。所以我想出先將每個題目循環輸出出來，然後在將每個題目的內容循環加入的字典當中。又因為每個鍵對用多個值，所以，我將選項創建一個列表。

a={}
file = docx.Document("./密碼學競賽習題.docx")
for l in range(1,61):
    b=[]
    for idx,para in enumerate(file.paragraphs[6*l:6+6*l]):
        if idx==0:
            key=para.text
        elif idx==1:
            v1=para.text
            b.append(v1)
        elif idx==2:
            v2=para.text
            b.append(v2)
        elif idx==3:
            v3=para.text
            b.append(v3)
        elif idx==4:
            v4=para.text
            b.append(v4)
        elif idx==5:
            v5=para.text
            b.append(v5)
    a.update({key:b})

enumerate() 函數用於將一個可遍歷的數據對象(如列表、元組或字符串)組合為一個索引序列，同時列出數據和數據下標，一般用在 for 循環當中。（百度得到，說白了就是給每行起個行號）

2、將字典轉化為excl文件

（1）首先創建excl文件
python也給出了處理表格的模塊xlwt，可以直接去下載

sudo pip3 install xlwt
創建一個表格

book = xlwt.Workbook(）        #創建excl文件
sheet = book.add_sheet(‘sheet1‘)       #創建一個表
title = [‘題目‘,‘A‘,‘B‘,‘C‘,‘D‘,‘答案‘]           #每一列標題
for col in range(len(title)):                    #將標題逐個添加到表格當中
    sheet.write(0,col,title[col])
row=1                                     #設置行號

（2）正兒八經轉excl

一切準備就緒，接下來就是將字典中的內容逐個加入到創建的excl中就OK

for k in a:
    data=a[k]
    data.insert(0,k)               #第一列加入序號
    for index in range(len(data)):             #依次寫入每一行
        sheet.write(row,index,data[index])
    row += 1
book.save(‘TimuTest.xls‘)                     #保存excl的文件名

3、執行命令得到想要的excl表格

python3 docxToexcl.py

4、整個腳本代碼

#!/usr/bin/python3
#coding:utf-8

import docx
import re
import json
import xlwt

a={}
file = docx.Document("./密碼學競賽習題.docx")
for l in range(1,61):
    b=[]
    for idx,para in enumerate(file.paragraphs[6*l:6+6*l]):
        if idx==0:
            key=para.text
        elif idx==1:
            v1=para.text
            b.append(v1)
        elif idx==2:
            v2=para.text
            b.append(v2)
        elif idx==3:
            v3=para.text
            b.append(v3)
        elif idx==4:
            v4=para.text
            b.append(v4)
        elif idx==5:
            v5=para.text
            b.append(v5)
    a.update({key:b})
book = xlwt.Workbook()
sheet = book.add_sheet(‘sheet1‘)
title = [‘題目‘,‘A‘,‘B‘,‘C‘,‘D‘,‘答案‘]
for col in range(len(title)):
    sheet.write(0,col,title[col])
row=1
for k in a:
    data=a[k]
    data.insert(0,k)
    for index in range(len(data)):
        sheet.write(row,index,data[index])
    row += 1
book.save(‘test.xls‘)

總結：

其實這個腳本寫出來並不滿意，因為我在寫的時候，只考慮到了正在測試的word文檔格式，既然是批量的，文檔的格式也不一定都是一樣的。所以很難做到將別的格式的文檔轉化為想要的excl表格。最大的問題就是如果文檔中出現來一個空行，腳本依然會計算進去，同時每六行循環依次的話，結果就會出來差別。腳本需要改進，如今感覺好一點的辦法是利用正則匹配選項。等有機會寫出來的話再貼上來吧！！！

word文檔（選擇題）轉換為excl表格

exc 編寫之前 nag work Coding 實例固定格式 save Word轉excl表格同事在做一個批量性的工作，就是將word文檔中的題目和選項，轉移到xml文檔中。實例：轉：再網上有很多將各種文檔轉化的工具和例子，但是很少有將固定格式進行轉化的。因為在

word文檔（選擇題）轉換為excl表格

1、將word文檔轉換為字典形式

2、將字典轉化為excl文件

3、執行命令得到想要的excl表格

4、整個腳本代碼

總結：

word文檔（選擇題）轉換為excl表格

word文件（選擇題）轉換為excl表格

將Latex tex文檔轉換成 word文檔（上）

Java 用Freemarker完美導出word文檔（帶圖片）

JAVA導出下載word文檔（導出帶富文本圖片word）

將Latex tex文件轉換成 word文件（上）

將Latex tex文件轉換成 word文件（下）

SQLAlchemy技術文檔（中文版）（上）

SQLAlchemy技術文檔（中文版）（中）

mybatis-3 最新版本（截止7.2）我們再來看看文檔（一）

OpenVPN2.4.3 安裝部署文檔（實戰）

幫助文檔（java）

phpdocumentor生成代碼註釋文檔（linux）

SQLAlchemy技術文檔（中文版）-下

小紅書App產品需求文檔（PRD）

SQL將用戶表中已存在的數據所有姓名（漢字）轉換為拼音首字母

OpenStack 安裝文檔（08）-- 塊存儲服務

OpenStack 安裝文檔（11）-- 編排服務

頂級產品經理是如何寫產品需求文檔（PRD）的

【c#】RabbitMQ學習文檔（七）C# API

word文檔（選擇題）轉換為excl表格

1、將word文檔轉換為字典形式

2、將字典轉化為excl文件

3、執行命令得到想要的excl表格

4、整個腳本代碼

總結：

相關推薦