微信公眾號資料採集

阿新 • • 發佈：2020-10-13

一、採集公眾號文章URL

1.執行環境

1.配置detail_config.txt

最近統計感興趣的公眾號的閱讀資料，這篇文章就記錄一下實現過程。本文只用於學習交流，請勿他用。

一、採集公眾號文章URL

本程式主要考慮是在window下執行，在執行之前，請確保已有python的基本執行環境，以及相關的python外掛。

1.執行環境

1.Webdriver

確保window環境有google瀏覽器，如果你所使用的google瀏覽器版本不知支援程式中所提供的webdriver，有以下解決方式：

一是下載自己電腦中google瀏覽器版本所對應的webdriver

二是安裝檔案中提供的gongle瀏覽器

三是自己查詢其他瀏覽器的對應的webdriver(這裡不建議這麼做，除非自己能搞定遇到的問題)

2.python執行環境

python版本>=3.6

3.cx-oracle

版本 5.3這個版本對應伺服器上的oracle資料庫版本11g,其他版本連線不上

pip install oracle==5.3

4.lxml

execl檔案操作需要的外掛

pip install lxml

5.註冊一個微信公眾號

用已有的也行

2.採集文章連線

1.配置config.txt

這個檔案可以配置多個公眾號，程式會將所配置的公眾號的文章url採集下來，注意格式為：

每個公眾號一行

公眾號名起始時間結束時間

即需要採集的公眾號名稱，採集的開始時間，結束時間，以空格隔開，程式只會儲存起始時間，結束時間內的文章資料。

2.啟動程式

點選JZTravel_Artical_Url.bat，微信掃一掃，登入自己的微信公眾號，登入成功後，會進入微信公眾號頁面，不要關閉這個頁面，因為程式會自動將這個頁面退出，頁面退出後程序將採集文章url。

程式執行結束後，會在data

資料夾下產生相應的檔案，裡面儲存著需要採集的微信公眾號文章的url。

注意：登入過程中，可能出現以下報錯，不用急，這可能是當前網路問題，導致頁面上的資料載入不全導致，重試幾次就行。

二、採集文章詳細資訊

1.配置detail_config.txt

採集公眾號詳情的配置檔案

注意：由於cookie的原因，這個檔案只能配置一個公眾號資訊，並且這個需要採集的公眾號必須和cookie中的連線對應，格式為

公眾號名稱|資料儲存方式

即需要採集的公眾號，儲存方式，以”|”分開，包存方式有三種，xls—儲存為execl，oracle—儲存到oracle資料庫，other—同時儲存到execl檔案和Oracle資料庫。根據實際選擇需要。

2.啟動程式

點選JZTravel_Artical_Detail.bat，程式將自動採集文章的詳細資料。

注意：

報錯一：程式出現以下錯誤時，不會影響採集程式，也不會影響採集結果

報錯二：程式出現以下錯誤時，是cookie失效導致的，需要從新匯入cookie資料，不用擔心，已經採集過的文章資料，不會重複採集。

報錯三：程式出現以下錯誤時，是爬蟲程式寫入的Excel檔案被打開了，需要關閉檔案重新啟動程式，也就是說，爬蟲採集的過程中是不能開啟execl檔案的。

三、資料

考慮到實際執行爬蟲的網路環境，這裡採用資料多重備份。包括資料本地檔案備份和資料庫備份。

1.資料庫

2.Execl

按照採集日期分開儲存。

本文只用於學習交流，請勿他用。技術支援，扣扣：3165845957

微信公眾號資料採集

目錄一、採集公眾號文章URL 1.執行環境 1.Webdriver 2.python執行環境 3.cx-oracle 4.lxml 5.註冊一個微信公眾號

基於Python採集爬取微信公眾號歷史資料

鯤之鵬的技術人員將在本文介紹一種通過模擬操作微信App的方式採集指定公眾號的所有歷史資料的方法。

微信公眾號VUE專案安卓能請求到資料IOS不能

報錯的場景前端專案使用https://www.project.com 後端介面地址使用http://www.project.com

解決搜狗微信公眾號採集後圖片無法正常載入的問題

目前我們一般是從搜狗搜尋引擎中的微信搜尋中取爬，經過我的反覆嘗試，總結寶貴經驗如下供各位參考：

python爬蟲：搜狗微信公眾號文章資訊的採集（https://weixin.sogou.com/），儲存csv檔案

1 import requests 2 from requests.exceptions import RequestException 3 from lxml import etree 4 import csv

圖片資料編碼與微信公眾號圖片

標題: 圖片資料編碼與微信公眾號圖片作者: 夢幻之心星[email protected] 標籤: [#圖片,#資料編碼,#Base64]

VUE對接微信公眾號文章列表資料

最近在使用VUE開發一個PC端展示型系統，其中新聞板塊客戶的需求是要對接他們的公眾號資料。

基於springboot微信公眾號開發(微信自動回覆)

效果圖 1.準備工作申請微信訂閱號(個人只能申請訂閱號,而且沒什麼功能,也無法認證),申請完畢,點選開發=>基本配置,如下圖:

Java實現微信公眾號自定義選單的建立方法示例

本文例項講述了Java實現微信公眾號自定義選單的建立方法。分享給大家供大家參考，具體如下：

Java實現的微信公眾號獲取微信使用者資訊示例

本文例項講述了Java實現的微信公眾號獲取微信使用者資訊。分享給大家供大家參考，具體如下：

Java實現微信公眾號獲取臨時二維碼功能示例

本文例項講述了Java實現微信公眾號獲取臨時二維碼功能。分享給大家供大家參考，具體如下：

微信公眾號獲取access_token的方法例項分析

本文例項講述了微信公眾號獲取access_token的方法。分享給大家供大家參考，具體如下：

python編寫微信公眾號首圖思路詳解

前言之前一直在美圖秀秀調整自己的微信公眾號首圖，效果也不盡如人意，老是調來調去，最後發出來的圖片被裁剪了一大部分，丟失部分關鍵資訊，十分惱火，於是想著用python寫一個程式，把微信公眾號首圖的模式固定下來

python微信公眾號開發簡單流程實現

本文為大家分享了python微信公眾號開發的簡單過程，供大家參考，具體內容如下

微信公眾號中的JSSDK接入及invalid signature等常見錯誤問題分析(全面解析)

最近在搞微信公眾號開發，進行到網頁開發部分被坑了一天，最坑的問題就是invalid signature，而網上大部分解答這個問題的都沒有說清楚，都直接丟文件。博主認為這樣很不好。本文是博主結合自身遇到的問題所寫，整個流

微信公眾號網頁分享功能開發的示例程式碼

現在每天都可以看到很多微信分享的連結上面有網站或者商家的自定義的分享標題，和分享連結的描述及分享出去的影象，例如下面的分享出去的連結：

Vue微信公眾號網頁分享的示例程式碼

前言今天做了個分享功能，反正挺詭異的，下面就來說一說步驟後端使用egg.js,程式碼如下：

Python版實現微信公眾號掃碼登陸

基於python 實現公眾掃碼登陸前提申請公眾號服務，配置相關資訊，並在相關平臺進行配置，就這麼多東西

C#實現微信公眾號會員卡管理的示例程式碼

為了更好地理解微信公眾號--會員卡管理，作者特意花了不少的時間對其研究，並用c#開發出會員卡demo，主要包含會員卡建立、設定開卡欄位、通過建立二維碼來投放會員卡、同步會員卡資料/啟用會員卡、拉取會員資訊、更新

微信公眾號二次分享ios分享失敗問題

一、首先，看正常通用的 1、繫結域名　　再公眾號開發設定裡邊配置域名 2、引入js檔案

微信公眾號資料採集

一、採集公眾號文章URL

1.執行環境

1.Webdriver

2.python執行環境

3.cx-oracle

4.lxml

5.註冊一個微信公眾號

2.採集文章連線

1.配置config.txt

2.啟動程式

二、採集文章詳細資訊

1.配置detail_config.txt

2.啟動程式

三、資料

1.資料庫

2.Execl

相關推薦