python實現翻譯word表格小程式

阿新 • • 發佈：2020-02-27

背景

原是弱電整合的設計員，糾結很久後參加了python培訓機構轉職後的一員小白，由於一次工作中需要翻譯一份近100頁word表格，純手工翻譯大概三個小時，為了解決這種重複又耗時的勞動，並重溫python相關知識所以製作了該小程式。

指令碼詳情

import re
import docx
import time
import pandas as pd
from selenium import webdriver
from selenium.webdriver.chrome.options import Options # 匯入chrome選項
from selenium.webdriver.common.keys import Keys
from os import system
'''
seleium爬蟲效率很低但勝在不用考慮反爬問題，由於想加快翻譯速度並實現轉換為exe檔案後可在其他無python環境中執行，
新增excel表格充當資料庫，excel檔案中，一列命名漏洞英文列表，一列命名漏洞翻譯列表，由於使用seleeium需在python目
錄下新增對應瀏覽器driver，由於我使用的是chrome所以需下載chromedriver。
'''
def mydoc(doc,table,huan,expath):
 table_contents = []
 table_content_trans = []
 for i in range(0,len(table.rows)):#設定i值極限 行
  data = pd.DataFrame(pd.read_excel(expath))
  datalist_d = data['漏洞英文列表']
  datalist_t = data['漏洞翻譯列表']
  i_text = table.cell(i,0).text#表格內i行j列單元格內容賦值給i_text
  zhPattern = re.compile(u'[\u4e00-\u9fa5]+') # 中文字元範圍
  szPattern = re.compile(u'[0-9]') # 數字範圍
  # spPattern = re.compile(u'[/]+')
  contents = u'{}'.format(i_text) # 表格內單元格文字
  # search整個字串內查詢模式匹配，找到第一個匹配然後返回一個包含匹配資訊的物件，無則NONE
  # match匹配字串第一位，開頭位置是否匹配，匹配成功才會返回結果，否則返回None
  #'[^?\\/]'返回指定標點符號
  match_zh = zhPattern.search(contents)
  match_sz = szPattern.match(contents)
  if match_zh or match_sz:
   pass

  else:
   if len(datalist_d) != 0:
    flag_excel = False
    for j in range(len(datalist_d)):
     if datalist_d[j] == i_text:
      table.cell(i,0).text = str(datalist_t[j])
      flag_excel = True
      break
    if flag_excel == False:
     print('漏洞庫中未搜尋到...')
     table_contents.append(i_text) # 表格內內容
     trans_result = myspider(i_text) # 翻譯表格內容
     print('翻譯中...')
     if huan == 1:
      trans_result_n = trans_result.replace("\n","") # 內容去除換行
      table.cell(i,0).text = trans_result_n # 替換表格內容
      table_content_trans.append(trans_result_n) # 翻譯和排版後內容加入表格
      data_t = pd.Series({"漏洞英文列表": i_text,"漏洞翻譯列表": trans_result_n},name='漏洞庫') # 新增資料
      data_add_t = data.append(data_t) # 新增資料
      data_add_t.to_excel(expath,index=False) # 存入excel中
      print('存入漏洞庫...')
     else:
      table.cell(i,0).text = trans_result # 替換表格內容
      table_content_trans.append(trans_result) # 翻譯和排版後內容加入表格
      data_t = pd.Series({"漏洞英文列表": i_text,"漏洞翻譯列表": trans_result},index=False) # 存入excel中
      print('存入漏洞庫...')

   else:
    print('漏洞庫為空')
    table_contents.append(i_text) # 表格內內容
    trans_result = myspider(i_text) # 翻譯表格內容
    print('翻譯中...')
    if huan == 1:
     trans_result_n = trans_result.replace("\n","") # 內容去除換行
     table.cell(i,0).text = trans_result_n # 替換表格內容
     table_content_trans.append(trans_result_n) # 翻譯和排版後內容加入表格
     data_t = pd.Series({"漏洞英文列表": i_text,name='漏洞庫') # 新增資料
     data_add_t = data.append(data_t) # 新增資料
     data_add_t.to_excel(expath,index=False) # 存入excel中
     print('存入漏洞庫...')
    else:
     table.cell(i,0).text = trans_result # 替換表格內容
     table_content_trans.append(trans_result) # 翻譯和排版後內容加入表格
     data_t = pd.Series({"漏洞英文列表": i_text,index=False) # 存入excel中
     print('存入漏洞庫...')

 #判斷列表中是否都是空字串
 flag = False
 for i in table_contents:
  if i.strip() != '':
   flag = True
 # 空列表或者列表中都是空字串不翻譯
 if len(table_contents) == 0 or flag == False:
  return print("此表格無需翻譯或漏洞庫中已儲存")
 else:
  print('表格待翻譯內容:',table_contents)
  print('表格翻譯後內容:',table_content_trans)

def myspider(text):
 # 設定chrome瀏覽器無頭模式
 chrome_options = Options()
 chrome_options.add_argument('--headless')
 driver = webdriver.Chrome(chrome_options=chrome_options)
 # driver.fullscreen_window() #全屏
 driver.maximize_window() # 螢幕最大化
 # 開啟有道翻譯頁面
 driver.get("http://fanyi.youdao.com/")
 time.sleep(0.5)
 # 獲取頁面名為inputOriginal的id標籤的文字內容
 inputwd = driver.find_element_by_id("inputOriginal") # 搜尋輸入文字框的id屬性值    .text #id="wrapper"的所有文字
 but = driver.find_element_by_id('transMachine') # 搜尋提交按鈕//*[@id="transMachine"]
 outputwd = driver.find_element_by_xpath('//*[@id="transTarget"]') # 翻譯後文本框
 inputwd.clear() # 清除文字框裡的內容
 # outputwd.clear() # 清除文字框裡的內容
 inputwd.send_keys(text) # 輸入翻譯內容
 but.send_keys(Keys.RETURN) # 輸入回車鍵 but.click() #點選按鈕s
 time.sleep(0.5)
 result = outputwd.text
 # 關閉瀏覽器
 driver.quit()
 return result

def mymain():
 # urlname = input('輸入路徑:')
 docname = input('輸入檔案全名：')
 huan = int(input('翻譯內容是否需刪除換行(1.是2.否):'))
 # urlname_t = urlname.replace('\\','\\\\')
 # print('轉義後路徑:',f'{urlname}//{docname}')
 path = f'.\\{docname}' #檔案路徑
 expath = '.\\漏洞庫.xlsx'
 doc = docx.Document(path)
 tables = doc.tables # 獲取檔案中的表格集
 e1 = time.time()
 print(f'共{len(tables)}個表格')
 n = 1
 try:
  for i in range(0,len(tables)):
   table = tables[i]
   mydoc(doc,expath)
   print(f'\n剩餘{len(tables)-n}個表格待翻譯')
   time.sleep(0.3)
   n += 1
   doc.save(f".\\trans{docname}")
 except Exception as e:
  print('報錯:',e)
 e2 = time.time()
 print('耗時:',float(e2 - e1))
 print('轉換完畢')
 system('pause')

mymain()

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

python實現翻譯word表格小程式

背景原是弱電整合的設計員，糾結很久後參加了python培訓機構轉職後的一員小白，由於一次工作中需要翻譯一份近100頁word表格，純手工翻譯大概三個小時，為了解決這種重複又耗時的勞動，並重溫python相關知識所以製作

從0到1使用python開發一個半自動答題小程式的實現

前言最近每天都有玩微信讀書上面的每日一答的答題遊戲，完全答對12題後，可以瓜分無限閱讀卡。但是從小就不太愛看書的我，很難連續答對12道題，由此，產生了寫一個半自動答題小程式的想法。我們先看一張效果圖吧(ps

Python爬取微信小程式Charles實現過程圖解

一、前言最近需要獲取微信小程式上的資料進行分析處理，第一時間想到的方式就是採用python爬蟲爬取資料，嘗試後發現諸多問題，比如無法獲取目標網址、解析網址中存在指定引數的不確定性、加密問題等等，經過一番嘗試

python 基於opencv 實現一個滑鼠繪圖小程式

需求在畫布上用滑鼠畫圖，可以畫圓或矩形，按m鍵在兩種模式下切換。左鍵按下時開始畫圖，移動到哪兒畫到哪兒，左鍵釋放時結束畫圖。

java控制檯實現視覺化日曆小程式

本文例項為大家分享了java視覺化日曆小程式的具體程式碼，供大家參考，具體內容如下

Python實現剪刀石頭布小遊戲(與電腦對戰)

具體程式碼如下所述： srpgame.py #!/urs/bin/env python import random all_choice = [\'石頭\',\'剪刀\',\'布\']

python實現生成Word、docx檔案的方法分析

本文例項講述了python實現生成Word、docx檔案的方法。分享給大家供大家參考，具體如下：

python實現替換word中的關鍵文字(使用萬用字元)

環境：Python3.6 本文主要是通過win32com操作word，對word中進行常用的操作。本文以替換為例，講解一下如何使用Python在word中使用“萬用字元模式”（類似於正則表示式）替換文字內容。

Python 實現向word(docx)中輸出

安裝python-docx pip install python-docx 如果python2安裝後不能使用（找不到包），建議直接使用python3，安裝程式碼如下

python實現井字棋小遊戲

本文為大家分享了python實現井字棋小遊戲，供大家參考，具體內容如下週五晚上上了python的選修課，本來以為老師是從python的基礎語法開始的，沒想到是從turtle畫圖開始，正好補上了我以前一些不懂的地方，有人講一下

Java實現簡單的掃雷小程式

前兩天看了個掃雷的視訊，於是自己跟著做了下，感覺還不是很難。初學Java的同學可以嘗試自己操作下Java小程式

python實現PDF中表格轉化為Excel的方法

這幾天想統計一下《中國人文社會科學期刊 AMI 綜合評價報告（2018 年）：A 刊評價報告》中的期刊，但是隻找到了該報告的PDF版，對於表格的編輯不太方便，於是想到用Python將表格轉成Excel格式。

使用java實現雲端資源共享小程式的程式碼

雲端共享小程式：首先介紹一些程式功能：多使用者共享資源，建立一個共享伺服器，伺服器儲存器可以存放資源，使用者可以向伺服器上傳檔案，也可以從伺服器下載檔案，實現了多使用者分享資源的功能。

Python實現201909-2（小明種蘋果（續））滿分程式碼，帶註釋

題目連結 http://118.190.20.162/view.page?gpid=T93 (需要註冊才能訪問) 思路獲取數字n 迴圈n次

Python爬取微信小程式通用方法程式碼例項詳解

背景介紹最近遇到一個需求，大致就是要獲取某個小程式上的資料。心想小程式本質上就是移動端加殼的瀏覽器，所以想到用Python去獲取資料。在網上學習了一下如何實現後，記錄一下我的實現過程以及所踩過的小坑。本文關

Python 實現翻譯功能，用tkinter實現gui【2】

#!/usr/bin/env python # -*- coding: utf-8 -*- from tkinter import * import hashlib import time import json

python實現對Excle表格的讀寫

1、使用xlrd模組讀取資料 # 將excel表格內容匯入到tables列表中 def import_excel(tab): # 建立一個空列表，儲存Excel的資料

java實現撲克牌牌面小程式

本文例項為大家分享了java實現撲克牌牌面小程式的具體程式碼，供大家參考，具體內容如下

uni-app 開發一套程式碼實現公眾號和小程式總結

最近剛結束一個專案，接到需求的的時候要求寫一個小程式和公眾號，當時感覺沒啥問題，但是後面告訴我一個個很坑的要求客戶週期只有一個月！！！小程式沒問題，再加個公眾號就有點心慌了，然後只能去找解決方案了，

python 寫一個檔案分發小程式

一、概述該小程式實現從源端到目標端的檔案一鍵拷貝，源端和目標段都在一臺電腦上面，只是目錄不同而已

python實現翻譯word表格小程式

相關推薦