Linux下讀取doc,docx檔案
docx檔案
利用python-docx包,好像暫時不支援python3。
# -*- coding:utf-8 -*-
import sys
import docx
path = sys.argv[1]
file = docx.Document(path)
for para in file.paragraphs:
print para.text
使用命令列傳引數
python test.py filename
例子
doc檔案
python-docx不支援doc檔案的
我們可以使用antiword,下載完,解壓,進入該檔案,分別使用make
和make install
。安裝完後,主目錄會出現bin資料夾
pwd
檢視該目錄的路徑。
使用su
,輸入密碼,然後設定環境變數
PATH=$PATH:your's bin path(輸入上面pwd出現的路徑)
在echo $PATH
檢視PATH是否成功匯入。
成功匯入後,我們就可以在任何的shell
和路徑使用antiword
了。
EX
相關推薦
Linux下讀取doc,docx檔案
docx檔案 利用python-docx包,好像暫時不支援python3。 # -*- coding:utf-8 -*- import sys import docx path = sys.argv[1] file = docx.Document(path
windows和linux下讀取檔案換行符的一個坑——\r\n和\n
拿同事的一個windows下的C程式,在Linux下跑,結果不正確。定位為讀取.ini配置檔案錯誤。該配置檔案是在windows下編輯的,網上查到資料,說是windows和linux下對換行符處理不同導致的。
Linux下讀取Ini檔案類
#include "Ini.h" /****************************************************************************** * 功 能:建構函式 * 參 數:無 * 返回值:無 * 備 注: *********************
Linux下讀取RFID卡號(C串口編程)
start itl star tor 卡號 字節數 同時 描述符 lag 由於項目需要用到RFID、GPRS、攝像頭等模塊所以便看了一下,整理了一下學習思路,本篇先是整理一下串口讀取RFID卡號的程序思路,後面還會更其他的 RFID模塊: 本次采用的是125K的RF
Linux下讀取位圖需要註意什麽
Linux 位圖 在Linux下讀取位圖遇到的問題,很好地體現了linux與Windows操作系統的不同。按理說位圖格式與操作系統無關,讀取也應該無關,實際上在位圖讀到內存中時已經不同。下面主要介紹自己在Linux下操作位圖遇到的問題。 (一)、位圖結構 位圖一開始是兩個結構體,包括位圖的詳細
linux下常用標頭檔案
#include <linux/***.h> 是在linux-2.6.29/include/linux下面尋找原始檔。 #include <asm/***.h> 是在linux-2.6.29/arch/arm/include/asm下面尋找原始檔。 #in
Linux下Java執行.class檔案,報錯找不到或無法載入主類
classpath配置的錯誤,所以找不到.class檔案。 原先的etc/profile中的classpath配置 export CLASSPATH=$JAVA_HOME/lib/tools.jar 更改後的: export CLASSPATH=.:$JAVA_HOME
linux下批量重新命名檔案
假設資料夾Data裡有幾個資料資料夾, 每個資料資料夾內有多個數據檔案,該檔名稱格式為: 2014.143.20.49.21.0000.YN.BAS.00.BHE.M.SAC 現想要將這些檔名稱改為BAS.E.SAC, 即取原檔名的幾列重新命名,方法如下: #!/bin/bash #將資料檔
解決Linux 下 root使用者刪除檔案提示:Operation not permitted
問題描述 用最高許可權rm檔案,居然報錯Operation not permitted。檢視許可權也沒有問題。可想而知有可能檔案被保護了。用命令lsattr檢查一下就知道。 [[email protected] root]# lsattr a.txt ---i---------- a.
PHP讀取doc docx xls pdf txt內容
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!  
Linux下,grep獲取檔案中的最後一次匹配項
如題:使用grep獲取檔案中的最後一次匹配項 grep '查詢的內容' -A 100 檔名 | tail -n 101 grep獲取檔案中的最後一次匹配項,以及後面100行, 注意是tail -n 101而不是tail -n 100,因為tail -n 100將不會顯示匹配內
Linux下校驗下載檔案的完整性(MD5,SHA1,PGP)
原文:https://www.cnblogs.com/Alight/p/4104070.html 檢視: Linux下校驗下載檔案的完整性(MD5,SHA1,PGP) http://blog.useasp.net/archive/2014/03/29/use-md5-sha1-or-pg
Linux下帶空格的檔案刪除方法
實驗模擬: [[email protected] hbk]# touch a" ".txt [[email protected] hbk]# touch a.txt [[email protected] hbk]# ll 總用量 0 -rw-r--r--.
Linux下的使用者和檔案許可權管理
一、管理使用者賬號和組帳號 1.使用者帳號和組帳號概述 1.1使用者帳號 使用者賬號 特點 超級使用者 root使用者,負責系統管理和維護 普通使用者 由roo
linux下使用者管理及檔案許可權管理
本篇部落格主要講解linux的使用者管理以及檔案的許可權管理,主要是一些命令例子,以實際操作為主。該部落格的命令是在centos6.4上執行的。 一、使用者管理 1 新增使用者 2 刪除使用者
Linux下passwd和shadow檔案內容詳解
一、/etc/passwd /etc/passwd 檔案是一個純文字檔案,每行採用了相同的格式: name:password:uid:gid:comment:home:shell name 使用者登入名 password 使用者口令。此域中的口令是加密的,常用x表示。當用戶登入系統時,系統對輸入的口令採
linux下實現doc轉html
1. 概述 windows下藉助.net好解決這個問題. 嘗試python java php 都被坑了,尤其是docx之前的word版本。 最終解決辦法:libreoffice 2. 安裝 yum install libreoffice libreoffice-he
Linux下如何開啟appimage檔案
linux下筆記類軟體的首選是為知note了,然而官網提供的安裝包不是tar.gz的,是一個沒有見過的APPIMAGE格式,看起來一頭霧水,看了官網發現很簡單,簡單來說就是可以在linux使用任何一個其他平臺的軟體。 用法:1直接開啟屬性,選擇:作為可執行檔案開啟(接著就像
Linux下安裝tar.gz檔案
參考: https://blog.csdn.net/langb2014/article/details/50573656/ https://blog.csdn.net/qq_21383435/article/details/79540117 https://blog.csdn.net/cm_
軟體素材---linux C語言:linux下獲取可執行檔案的絕對路徑--getcwd函式
//標頭檔案:#include <unistd.h> //定義函式:char * getcwd(char * buf, size_t size);