python如何匯出微信公眾號文章方法詳解

阿新 • • 發佈：2020-09-01

1.安裝wkhtmltopdf

下載地址:https://wkhtmltopdf.org/downloads.html

我測試用的是windows的，下載安裝後結果如下

python如何匯出微信公眾號文章方法詳解

2 編寫python 程式碼匯出微信公眾號文章

不能直接使用wkhtmltopdf 匯出微信公眾號文章，匯出的文章會缺失圖片，所以需要使用 wechatsogou 將微信公眾號文章頁面抓取，之後將html文字轉化為pdf

pip install wechatsogou --upgrade

pip install pdfkit

踩坑！！！，看了很多人的程式碼，都是一個模板，大家都是抄來抄去，結果還是執行不了，可能是因為依賴包更新的原因，也可能是因為我本地沒有配置wkhtmltopdf 的環境變數

import os
import pdfkit
import datetime
import wechatsogou
# 初始化API
ws_api = wechatsogou.WechatSogouAPI(captcha_break_time=3)
def url2pdf(url,title,targetPath):
 '''
 使用pdfkit生成pdf檔案
 :param url: 文章url
 :param title: 文章標題
 :param targetPath: 儲存pdf檔案的路徑
 '''
 try:
 content_info = ws_api.get_article_content(url)
 except:
 return False
 # 處理後的html
 html = f'''
{title}
 {content_info['content_html']}
 
 '''
 try:
 path_wk="E:/softwareAPP/wkhtmltopdf/bin/wkhtmltopdf.exe";
 config=pdfkit.configuration(wkhtmltopdf=path_wk)
 pdfkit.from_string(input=html,output_path=targetPath,configuration=config)
 except:
 # 部分文章標題含特殊字元，不能作為檔名
 filename = datetime.datetime.now().strftime('%Y%m%d%H%M%S') + '.pdf'
 pdfkit.from_string(html,targetPath + os.path.sep + filename)
 
if __name__ == '__main__':
 # 此處為要爬取公眾號的名稱
 url2pdf("https://mp.weixin.qq.com/s/wwT5n2JwEEAkrrmOhedziw","HBase的系統架構全視角解讀","G:/test/hbase文件.pdf" )
 # gzh_name = ''
 # # 如果不存在目標資料夾就進行建立
 # if not os.path.exists(targetPath):
 # os.makedirs(targetPath)
 # # 將該公眾號最近10篇文章資訊以字典形式返回
 # data = ws_api.get_gzh_article_by_history(gzh_name)
 # article_list = data['article']
 # for article in article_list:
 # url = article['content_url']
 # title = article['title']
 # url2pdf(url,targetPath)

到此這篇關於python如何匯出微信公眾號文章方法詳解的文章就介紹到這了,更多相關python匯出微信公眾號文章內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python如何匯出微信公眾號文章方法詳解

1.安裝wkhtmltopdf 下載地址:https://wkhtmltopdf.org/downloads.html 我測試用的是windows的，下載安裝後結果如下

Python selenium爬取微信公眾號文章程式碼詳解

參照資料：selenium webdriver新增cookie: https://www.jb51.net/article/193102.html 需求：想閱讀微信公眾號歷史文章，但是每次找回看得地方不方便。

java微信公眾號支付示例詳解

本文例項為大家分享了java微信公眾號支付示例程式碼，供大家參考，具體內容如下

python selenium 微信公眾號歷史文章隨手一點就返回首頁？鬱悶之下只好將他們都下載下來。

參照資料：selenium webdriver 如何新增cookie:https://www.cnblogs.com/sundahua/p/10202494.html

fiddle python抓取微信公眾號文章

分析 1，先進行準備工作：使用fiddle抓包（大家可以自行百度怎麼使用哦） 2，開啟電腦端微信，找到需要爬取的公眾號

python爬蟲：搜狗微信公眾號文章資訊的採集（https://weixin.sogou.com/），儲存csv檔案

1 import requests 2 from requests.exceptions import RequestException 3 from lxml import etree 4 import csv

Python 微信公眾號文章爬取

此文轉載自：https://blog.csdn.net/qq_36684855/article/details/110226009 Python 微信公眾號文章爬取

Python 微信公眾號文章爬取的示例程式碼

一.思路我們通過網頁版的微信公眾平臺的圖文訊息中的超連結獲取到我們需要的介面

Python爬取微信公眾號文章、標題、文章地址

前言本文的文字及圖片過濾網路，可以學習，交流使用，不具有任何商業用途，如有問題請及時聯絡我們以作處理。

使用python爬取微信公眾號文章

一、批量獲取公眾號往期推送url連結 1. 獲取微信公眾號文章的長期連結原因由於我們檢視的微信公眾號的文章連結都是隨機生成的，如果在前端想要獲取往期推送的所有文章，就需要手動點開一個個複製，非常麻煩，所以我

python編寫微信公眾號首圖思路詳解

前言之前一直在美圖秀秀調整自己的微信公眾號首圖，效果也不盡如人意，老是調來調去，最後發出來的圖片被裁剪了一大部分，丟失部分關鍵資訊，十分惱火，於是想著用python寫一個程式，把微信公眾號首圖的模式固定下來

基於Django專案的Python版微信公眾號支付-Native支付方式

本文詳細講解Python語言進行公眾號開發時，參考開發者文件進行Native支付（模式二），並給出具體的程式碼：

基於Django專案的Python版微信公眾號支付-JSAPI支付方式

本文詳細講解Python語言進行公眾號開發時，參考開發者文件進行JSAPI支付，並給出具體的程式碼：

利用python做微信公眾號標題的詞雲圖

技術標籤：python大作業python資料視覺化一、標題資料的獲取 1.通過微信公眾平臺後臺網頁，左側的統計模組來下載相應的資料，單獨把標題複製出來，形成檔案形式； 2.通過網頁爬蟲來爬取。

VUE對接微信公眾號文章列表資料

最近在使用VUE開發一個PC端展示型系統，其中新聞板塊客戶的需求是要對接他們的公眾號資料。

向微信公眾號文章中新增mp4、rar、zip等檔案給使用者下載

現在隨著微信公眾號的使用率越來越高大家對公眾號的功能需求也越來越廣假如想在文章中新增一個MP4、rar、zip等壓縮檔案讓使用者來瀏覽、下載、編輯，就需要通過微附件小程式來實現了使用微附件小程式可以在文章中上

向微信公眾號文章新增**指南檔案

微信公眾號的運營者在編輯圖文資訊時只能在文章中新增文字或者圖片等內容想在文章中直接新增一個指南檔案（比如：專案申報指南、專案課題指南、操作指南等）公眾號的編輯工具欄是沒有這個新增功能的只能手動進行編

向微信公眾號文章新增Excel表格檔案、PPT簡報

在編輯微信公眾號文章時需要手動編輯圖文資訊想要在文章中新增一個可供使用者下載、編輯的檔案時很多公眾號的運營者不知道如何操作在公眾號資訊編輯頁面是沒有新增ppt功能的今天就推薦給同行們一款可以上傳excel表

怎樣在微信公眾號文章中新增**計劃表

隨著公眾號使用者群體的壯大公眾號平臺的功能也越來也多也越來越實用但是還有一些功能沒有開發跟優化政府跟企業想要在文章中新增一份計劃表（如：崗位計劃表、招聘計劃表等）讓使用者瀏覽或下載如果計劃表很長，直接

微信公眾號文章怎樣新增答案檔案

學校、政府類公眾號需要在文章中釋出一些試題、答案公眾號運營者通常需要手動把檔案輸入文章中這樣工作量非常大，而且耗時編輯完成釋出後，使用者瀏覽起來不方便想要下載、列印也無法實現要是把試題、答案檔案直接新

python如何匯出微信公眾號文章方法詳解

相關推薦