1. 程式人生 > >實用又好用,6 款 Python 特殊文字格式處理庫推薦

實用又好用,6 款 Python 特殊文字格式處理庫推薦

點選上方“程式設計師大咖”,選擇“置頂公眾號”

關鍵時刻,第一時間送達!

640?wxfrom=5&wx_lazy=1

640?wx_fmt=gif&wxfrom=5&wx_lazy=1

以下是一些 Python 編寫的用來解析和操作特殊文字格式的庫,希望對大家有所幫助。

01

Tablib

https://www.oschina.net/p/Tablib

Tablib 是一個用來處理與表格格式資料有關的 Python 庫,允許匯入、匯出、管理表格格式資料,並具備包括切片、動態列、標籤和過濾,以及格式化匯入和匯出等高階功能。

Tablib 支援匯出/匯入的格式包括:Excel 、JSON 、YAML 、HTML 、TSV 和 CSV ,暫不支援 XML 。

>>> data = tablib.Dataset(headers=['First Name', 'Last Name', 'Age'])

>>> for i in [('Kenneth', 'Reitz', 22), ('Bessie', 'Monke', 21)]:

...     data.append(i)

>>> print(data.export('json'))

[{"Last Name": "Reitz", "First Name": "Kenneth", "Age": 22}, {"Last Name": "Monke", "First Name": "Bessie", "Age": 21}]

>>> print(data.export('yaml'))

- {Age: 22, First Name: Kenneth, Last Name: Reitz}

- {Age: 21, First Name: Bessie, Last Name: Monke}

>>> data.export('xlsx')

<censored binary data>

>>> data.export('df')

  First Name Last Name  Age

0    Kenneth     Reitz   22

1     Bessie     Monke   21

02

Openpyxl

https://www.oschina.net/p/openpyxl

Openpyxl 是一個用於讀寫 Excel 2010 xlsx / xlsm / xltx / xltm 檔案的 Python 庫。

Openpyxl 為 Python 原生讀取/寫入 Office Open XML 格式而生,最初是基於 PHPExcel 而開發。

from openpyxl import Workbook

wb = Workbook()

# grab the active worksheet

ws = wb.active

# Data can be assigned directly to cells

ws['A1'] = 42

# Rows can also be appended

ws.append([1, 2, 3])

# Python types will automatically be converted

import datetime

ws['A2'] = datetime.datetime.now()

# Save the file

wb.save("sample.xlsx")

03

unoconv

https://www.oschina.net/p/unoconv

unoconv,全稱為 Universal Office Converter ,是一個命令列工具,可在 LibreOffice/OpenOffice 支援的任意檔案格式之間進行轉換。

unoconv 支援批量轉換文件,還可以結合 asciidoc和 docbook2odf / xhtml2odt 來建立 PDF 或 Word(.doc) 檔案。

[[email protected] cv]$ make odt pdf html doc

rm -f *.{odt,pdf,html,doc}

asciidoc -b docbook -d article -o resume.xml resume.txt

docbook2odf -f --params generate.meta=0 -o resume.tmp.odt resume.xml

Saved resume.tmp.odt

unoconv -f odt -t template.ott -o resume.odt resume.tmp.odt

unoconv -f pdf -t template.ott -o resume.pdf resume.odt

unoconv -f html -t template.ott -o resume.html resume.odt

unoconv -f doc -t template.ott -o resume.doc resume.odt

04

PyPDF2

https://www.oschina.net/p/pypdf

PyPDF2 是一個純 Python PDF 庫,能夠分割、合併、裁剪和轉換 PDF 檔案頁面。它還可以新增自定義資料、檢視選項和密碼到 PDF 檔案。

PyPDF2 可以從 PDF 中檢索文字和元資料,也可以將整個檔案合併在一起。

from PyPDF2 import PdfFileWriter, PdfFileReader

output = PdfFileWriter()

input1 = PdfFileReader(open("document1.pdf", "rb"))

# print how many pages input1 has:

print "document1.pdf has %d pages." % input1.getNumPages()

# add page 1 from input1 to output document, unchanged

output.addPage(input1.getPage(0))

# add page 2 from input1, but rotated clockwise 90 degrees

output.addPage(input1.getPage(1).rotateClockwise(90))

# add page 3 from input1, rotated the other way:

output.addPage(input1.getPage(2).rotateCounterClockwise(90))

# alt: output.addPage(input1.getPage(2).rotateClockwise(270))

# add page 4 from input1, but first add a watermark from another PDF:

page4 = input1.getPage(3)

watermark = PdfFileReader(open("watermark.pdf", "rb"))

page4.mergePage(watermark.getPage(0))

output.addPage(page4)

# add page 5 from input1, but crop it to half size:

page5 = input1.getPage(4)

page5.mediaBox.upperRight = (

    page5.mediaBox.getUpperRight_x() / 2,

    page5.mediaBox.getUpperRight_y() / 2

)

output.addPage(page5)

# add some Javascript to launch the print window on opening this PDF.

# the password dialog may prevent the print dialog from being shown,

# comment the the encription lines, if that's the case, to try this out

output.addJS("this.print({bUI:true,bSilent:false,bShrinkToFit:true});")

# encrypt your new PDF and add a password

password = "secret"

output.encrypt(password)

# finally, write "output" to document-output.pdf

outputStream = file("PyPDF2-output.pdf", "wb")

output.write(outputStream)

05

Mistune

http://mistune.readthedocs.io/

Mistune 是一個純 Python 實現的 Markdown 解析器,功能齊全,包括表格、註釋、程式碼塊等。

Mistune 據稱是所有純 Python markdown 解析器中速度最快的(基準測試結果)。它在設計時考慮了模組化,以提供一個清晰易用的可擴充套件的 API 。

import mistune

mistune.markdown('I am using **mistune markdown parser**')

# output: <p>I am using <strong>mistune markdown parser</strong></p>

06

csvkit

https://www.oschina.net/p/csvkit

csvkit 號稱是處理 csv 檔案的瑞士軍刀,集成了 csvlook , csvcut 和 csvsql 等實用工具,可以以表格形式顯示 CSV 檔案,輕鬆選取 CSV 指定列,以及在其上執行 SQL 操作。

csvkit 是一個命令列工具,靈感來自 pdftk 、gdal 和其它類似工具。

640.jpeg

  • 來自:開源中國

  • https://my.oschina.net/editorial-story/blog/1622205

  • 程式設計師大咖整理髮布,轉載請聯絡作者獲得授權

相關推薦

實用6 Python 特殊文字格式處理推薦

點選上方“程式設計師大咖”,選擇“置頂公眾號”關鍵時刻,第一時間送達!以下是一些 Python

實用6 Python 特殊文本格式處理推薦

ans final 不支持 phpe dialog from 編寫 print stun 以下是一些 Python 編寫的用來解析和操作特殊文本格式的庫,希望對大家有所幫助。 01.Tablib https://www.oschina.net/p/Tablib

特別實用6 Python 特殊文字格式處理推薦

    以下是一些 Python 編寫的用來解析和操作特殊文字格式的庫,希望對大家有所幫助。 01.Tablib https://www.oschina.net/p/Tablib Tablib 是一個用來處理與表格格式資料有關的 Python

特別實用6Python特殊文字格式處理推薦

  以下是一些 Python 編寫的用來解析和操作特殊文字格式的庫,希望對大家有所幫助。 01.Tablib https://www.oschina.net/p/Tablib Tablib 是一個用來處理與表格格式資料有關的 Python 庫,允許匯入、匯出、管理表格

前端利器6 開源 Web 效能優化輔助工具推薦

轉自:原文連結 Web 效能優化是一個老生常談的話題,也是前端頁面開發十分重要的部分。當頁面載入速度越慢,使用者流失的概率就越大,效能和互動直接影響使用者體驗。 下面推薦幾款 Web 效能優化輔助工具推薦,希望能對大家有所幫助。 1、Light

Python讀寫Excel表格就是這麼簡單粗暴

最近在做一些資料處理和計算的工作,因為資料是以.csv格式儲存的,因此剛開始直接用Excel來處理。但是做著做著發現重複的勞動其實並沒有多大的意義,於是就想著寫個小工具幫著處理。以前正好在一本書上看到過使用Python來處理Excel表格,可惜沒有仔細看。於是我到處查詢資料,基本解決了日常所需

開源中國上幾免費的OA協同辦公系統真心不錯!

隨著企業內部資訊化管理的重要程度越來越高,我國OA協同辦公產品近年來得以快速發展。其中開源辦公產品因為其開源免費的特性受到眾多中小企業的喜愛。下面就來說一說那些開源協同產品中的優秀代表們。 NO.1:然之協同(PHP) 開發語言:然之協同以ZPL協議開源發行,採用PHP+MYSQL語言開發。 功能模組:

這10個Python最新過幾個

對於碼農來說,關注的永遠是新近有什麼流行的、既能解決問題又好用的利器。本文就為你盤點十大新開源Python庫。 本文福利:加vx ;tanzhouyiwan 免費領取Python學習資料 1、Pipenv 第一名非它莫屬,這個工具2017年初才釋出,但它已經

推薦免費的報表工具

目前大多數人在日常工作中都離不開報表的製作,而使用的報表軟體大多數都是wps、office等辦公軟體,還有一些公司會採購一些專業的報表工具,例如FineReport、潤乾報表、思邁特等等,相對的來說採購專門的報表工具,花費的成本還是很高的。 最近百度上找了好長時間終於找

推薦5不為人知的網站!竟如此不收藏下來真的可惜了!

作者 關於 提升 all collect ESS 設計 image 程序 網站是每一個人必不可少的資源,如果你有了一份好的資源,你的效率也會大大提升,下面推薦的5款網站,希望你們能夠喜歡! 1.創造獅推薦5款不為人知的網站!竟如此好用,不收藏下來真的可惜了!這個網站一個以創

139郵箱註冊收費嗎什麽VIP的郵箱安全

要求 提醒 一個 proc size 了解 使用 每天 成熟 隨著時代的發展,對於企業及商務人士常用的郵箱市場進一步的走向成熟化,近年來,逐漸從pc端向手機端進行轉型。以往在郵箱使用中面臨的局限性已不復存在。而面對市場競爭化激烈的今天,商務人士不應忽視每一個專業的細節,使用

便宜的美國VPS推薦

說到美國VPS,有些站長可能聽說過但沒親自使用過。美國VPS主機不僅訪問速度快、穩定性好,它更是兼有美國虛擬主機和美國服務器的雙重特點。就是和美國服務器類似,美國VPS擁有獨立資源和完整Root權限,但價格和虛擬主機一樣,非常低廉。 在美國VPS的選擇上,除了訪問速度、穩定性之外,很多站長還

白鷺引擎和layabox哪個哪個技術更成熟 ?

大型項目 明顯 3d遊戲 屬於 as3 制作 理論 web 商業 選擇H5遊戲引擎的思考維度1、開發語言的支持2、2D、3D、VR的支持3、性能4、引擎的應用廣度5、設計理念6、工作流支持力度7、商業化成熟案例8、學習資源與技術支持能力 首先,我們要知道,當前主流的遊戲

實用高效27騰訊熱門開源項目推薦

-1 網絡 ram 一致性 spirit 排序規則 官方 開放平臺 業務 騰訊作為互聯網行業的一大巨頭,一直都不吝嗇將好的技術開放,與廣大開發者共享,未來也將推出VR開放平臺和AI技術。騰訊在全球合作夥伴大會披露了未來五年的發展思路,在技術共享方面,騰訊希望利用自己在新技術

便宜低價的香港服務器?真的便宜

中心 雙向 cn2 咨詢 租用 貴的 如果 選擇 穩定 在這裏主要說一下,為什麽有便宜低價的香港服務器,便宜低價的香港服務器真的好用嗎?有什麽內幕?香港服務器最貴的在於線路,帶寬,房租,電力,人員開支等幾個方面,而且還都是省不了錢的。這些方面都嚴重影響這香港服務器的運行,有

哪種工業PDA便宜?智谷聯為您推出ZKC3501

PDA 手持終端 智谷聯物聯網技術的日益進步,基於互聯網的信息數據傳輸,徹底顛覆了各行業的傳統運作方式。基層數據成為了企業運營管理和對未來市場把控的重要參考。如何利用物聯網、通訊技術,對數據信息進行管理和采集是企業的重中之重。 在這過程中不可缺少的就是手持終端。手持終端是將條碼掃描裝置與終端一體化,帶有電池

番外篇Python開源框架的優劣總結!

學習任何一門開發語言都離不開框架,一個框架就好比是一個毛坯房,只需要我們裝修就可以入住。如果沒有框架我們就只能一磚一瓦的去蓋樓房了。框架的種類很多,具體選擇要根據實際的業務情況。下面就簡單的介紹一下Python七款開源框架的優劣。   學習Python中有不明白推薦加入交流群 &nbs

手機賺錢軟體哪個手機什麼賺錢軟體?就搜狐新聞資訊版下載

您知道嗎? 手機賺錢軟體哪個好用? 搜狐新聞資訊版是網路巨頭搜狐公司推出的一個非常好用的手機賺錢軟體,新版搜狐新聞資訊版會定期推出各種送現金活動,獎勵非常豐厚,週期是15天,碰到大型節日比如中秋,元旦,雙11,情人節呀。比如這次的集卡尋寶贏IPHONE . 手機什麼賺錢軟體好? 搜狐新聞資訊版下載

聽說大牛封裝的Toast留下來吧

public class ToastUtils { private static Toast mToast; @SuppressLint("ShowToast") public static void showShortToast(String str) {