使用python獲取pptx檔案的文字內容範例

阿新 • • 發佈：2020-11-26

get_text_from_pptx_pptm.py

#!/bin/python
# -*- coding: utf-8 -*-

from pptx import Presentation
import sys
import base64

reload(sys)
sys.setdefaultencoding('utf8')

fileName = sys.argv[1]
# print(fileName)

def tripSpace( str ):
    return str.replace("　", "").replace(" ", "").replace("\t", "").replace(" 
\r\n", "").replace("\r", "").replace("\n", "").replace("\v", "")

prs = Presentation(fileName)

# ファイル概要(1スライド目のノート)
file_summary = ""
# ファイル注釈(2スライド目以降のノート)
file_note = ""
# ファイル內容(オブジェクトのテキスト全文)
file_content = ""
for i, sld in enumerate(prs.slides, start=1):
    for shp in sld.shapes:
        if shp.has_text_frame:
            file_content  
+= shp.text
    if ( i == 1 ) :
        file_summary = sld.notes_slide.notes_text_frame.text
    else :
        file_note += tripSpace(sld.notes_slide.notes_text_frame.text)
    
print(base64.b64encode(file_summary))
print(tripSpace(file_note))
print(tripSpace(file_content))

使用python獲取pptx檔案的文字內容範例

get_text_from_pptx_pptm.py #!/bin/python # -*- coding: utf-8 -*- from pptx import Presentation import sys

Python 獲取命令列引數內容及引數個數的例項

執行python指令碼的時候，有時需要獲取命令列引數的相關資訊。C語言通過argc和argv來獲取引數的個數和引數的內容，python中通過sys模組的argv來獲取引數的內容，使用len(sys.argv)獲取引數的個數。

Javaweb 獲取properties檔案的內容,模擬spring如何建立實列

/** * 模擬spring容器如何建立例項 * (1) 提供一個config.properties配置檔案,在這個檔案中配置介面和實現類對應關係

python 獲取剪下板內容的兩種方法

第一種 # -*- coding: utf-8 -*- # @Time : 2020/3/16 21:26 # @File : get_text_from_cupboard_13.py # @Author: Hero Liu

Python Selenium XPath根據文字內容查詢元素的方法

問題現象元素的屬性中沒有id、name；雖然有class，但比較大眾化，且位置也不固定；例如：頁碼中的下一頁；那該如何找到該元素？

用python獲取txt檔案中關鍵字的數量

緣起：　　開發人員需要tomcat中一個專案在一個月的訪問請求量，因其他原因只剩下查詢tomcat請求日誌的方法獲取，剛好最近在學習python，於是就用python摸索了下；

python 獲取共享檔案

smbclient方法 def check_smb_img(): smbclient.register_session(\"1.1.1.1\", username=\"name\", password=\"password\")

你知道怎麼從jar包裡獲取一個檔案的內容嗎

需要獲取一個檔案的內容，本地測試沒有問題，但是使用jar包執行後就會報檔案不存在，原來想要獲取jar包裡的內容，不是獲取File，而是獲取它的inputstream。

如何基於python操作json檔案獲取內容

這篇文章主要介紹瞭如何基於python操作json檔案獲取內容,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

基於Python獲取docx/doc檔案內容程式碼解析

這篇文章主要介紹了基於Python獲取docx/doc檔案內容程式碼解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

【Python 基礎]】將文字檔案內容讀入到陣列的例子（改進版） Python基礎索引頁Python基礎索引頁

返回： Python基礎索引頁假如檔案的內容如下： ### [Action --1] RDMA support IPOIB support

Python獲取Redis所有Key以及內容的方法

一、獲取所有Key # -*- encoding: UTF-8 -*- __author__ = \"Sky\" import redis pool=redis.ConnectionPool(host=\'127.0.0.1\',port=6379,db=0)

python 實現批量替換文字中的某部分內容

一、介紹在做YOLOv3專案時，會需要將文字檔案中的某部分內容進行批量替換和修改，所以編寫了python程式批量替換所有文字檔案中特定部分的內容。

Python 獲取指定資料夾下的目錄和檔案的實現

經常有需要掃描目錄，對檔案做批量處理的需求，所以對目錄處理這塊做了下學習和總結。Python 中掃描目錄有兩種方法：os.listdir 和 os.walk。

python 獲取當前目錄下的檔案目錄和檔名例項程式碼詳解

os模組下有兩個函式：　os.walk() 　　os.listdir() # -*- coding: utf-8 -*- import os def file_name(file_dir):

Python利用PyPDF2庫獲取PDF檔案總頁碼例項

Python中可以利用PyPDF2庫來獲取該pdf檔案的總頁碼，可以根據下面的方法一步步進行下去：

Python 讀取Excel檔案內容【轉載】

import xlrd class ReadExcel: def __init__(self, file_path): try: self.book = xlrd.open_workbook(file_path)

SpringCloudConfig-手動重新獲取配置檔案內容（單個服務通知+通過訊息佇列廣播）

一、SpringCloudConfig定義 spring cloud config是一個基於http協議的遠端配置實現方式。通過統一的配置管理伺服器進行配置管理，客戶端通過https協議主動的拉取服務的的配置資訊，完成配置獲取。

如何使用python獲取電腦剪下板的文字？

如何使用python獲取電腦剪下板的文字？如何使用python操作電腦剪下板？我們平時的工作中可能需要頻繁的複製，貼上，去剪下等等。

Python+Selenium中級篇之4-封裝一個自己的類-瀏覽器引擎類/Python讀取配置檔案內容

封裝一個自己的類-瀏覽器引擎類前一篇文章我們知道了，如何去封裝幾個簡單的Selenium方法到我們自定義的類，這次我們編寫一個類，叫瀏覽器引擎類，通過更改一個字串的值，利用if語句去判斷和控制啟動那個瀏覽器。這

使用python獲取pptx檔案的文字內容範例

相關推薦