Python爬取微信公眾號文章、標題、文章地址

阿新 • • 發佈：2021-01-20

前言

本文的文字及圖片過濾網路，可以學習，交流使用，不具有任何商業用途，如有問題請及時聯絡我們以作處理。

Python爬蟲、資料分析、網站開發等案例教程視訊免費線上觀看

https://space.bilibili.com/523606542

基本開發環境

Python 3.6
皮查姆

爬取兩個公眾號的文章：

1，爬取青燈程式設計公眾號所有的文章

2，爬取所有關於python的公眾號文章

爬取青燈程式設計公眾號所有的文章

1，登陸公眾號之後點選圖文

2，開啟開發者工具

3，點選超連結

相關的資料加載出來，就有關於資料包，包含了文章標題，連結，摘要，釋出時間等等，也可以選擇其他的公眾號也可以爬取的，但是這需要你有一個微信公眾號。

要加cookie

import pprint
import time
import requests
import csv

f = open('青燈公眾號文章.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['標題', '文章釋出時間', '文章地址'])
csv_writer.writeheader()

for page in range(0, 40, 5):
    url = f'https://mp.weixin.qq.com/cgi-bin/appmsg?action=list_ex&begin={page}&count=5&fakeid=&type=9&query=&token=1252678642&lang=zh_CN&f=json&ajax=1 
'
    headers = {
        'cookie': '加cookie',
        'referer': 'https://mp.weixin.qq.com/cgi-bin/appmsg?t=media/appmsg_edit_v2&action=edit&isNew=1&type=10&createType=0&token=1252678642&lang=zh_CN',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36 
',
    }

    response = requests.get(url=url, headers=headers)
    html_data = response.json()
    pprint.pprint(response.json())
    lis = html_data['app_msg_list']
    for li in lis:
        title = li['title']
        link_url = li['link']
        update_time = li['update_time']
        timeArray = time.localtime(int(update_time))
        otherStyleTime = time.strftime("%Y-%m-%d %H:%M:%S", timeArray)
        dit = {
            '標題': title,
            '文章釋出時間': otherStyleTime,
            '文章地址': link_url,
        }
        csv_writer.writerow(dit)
        print(dit)

爬取所有關於python的公眾號文章

1，搜狗搜尋python選擇微信

注意：如果不登陸只能爬取前十頁資料，登陸之後可以爬取2W多篇文章。

2，爬取標題，公眾號，文章地址，釋出時間靜態網頁直接爬取即可

import time
import requests
import parsel
import csv

f = open('公眾號文章.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['標題', '公眾號', '文章釋出時間', '文章地址'])
csv_writer.writeheader()

for page in range(1, 2447):
    url = f'https://weixin.sogou.com/weixin?query=python&_sug_type_=&s_from=input&_sug_=n&type=2&page={page}&ie=utf8'
    headers = {
        'Cookie': '自己的cookie',
        'Host': 'weixin.sogou.com',
        'Referer': 'https://www.sogou.com/web?query=python&_asf=www.sogou.com&_ast=&w=01019900&p=40040100&ie=utf8&from=index-nologin&s_from=index&sut=1396&sst0=1610779538290&lkt=0%2C0%2C0&sugsuv=1590216228113568&sugtime=1610779538290',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
    }
    response = requests.get(url=url, headers=headers)
    selector = parsel.Selector(response.text)
    lis = selector.css('.news-list li')
    for li in lis:
        title_list = li.css('.txt-box h3 a::text').getall()
        num = len(title_list)
        if num == 1:
            title_str = 'python' + title_list[0]
        else:
            title_str = 'python'.join(title_list)

        href = li.css('.txt-box h3 a::attr(href)').get()
        article_url = 'https://weixin.sogou.com' + href
        name = li.css('.s-p a::text').get()
        date = li.css('.s-p::attr(t)').get()
        timeArray = time.localtime(int(date))
        otherStyleTime = time.strftime("%Y-%m-%d %H:%M:%S", timeArray)
        dit = {
            '標題': title_str,
            '公眾號': name,
            '文章釋出時間': otherStyleTime,
            '文章地址': article_url,
        }
        csv_writer.writerow(dit)
        print(title_str, name, otherStyleTime, article_url)

Python爬取微信公眾號文章、標題、文章地址

前言本文的文字及圖片過濾網路，可以學習，交流使用，不具有任何商業用途，如有問題請及時聯絡我們以作處理。

使用python爬取微信公眾號文章

一、批量獲取公眾號往期推送url連結 1. 獲取微信公眾號文章的長期連結原因由於我們檢視的微信公眾號的文章連結都是隨機生成的，如果在前端想要獲取往期推送的所有文章，就需要手動點開一個個複製，非常麻煩，所以我

Python selenium爬取微信公眾號文章程式碼詳解

參照資料：selenium webdriver新增cookie: https://www.jb51.net/article/193102.html 需求：想閱讀微信公眾號歷史文章，但是每次找回看得地方不方便。

fiddle python抓取微信公眾號文章

分析 1，先進行準備工作：使用fiddle抓包（大家可以自行百度怎麼使用哦） 2，開啟電腦端微信，找到需要爬取的公眾號

基於Python採集爬取微信公眾號歷史資料

鯤之鵬的技術人員將在本文介紹一種通過模擬操作微信App的方式採集指定公眾號的所有歷史資料的方法。

python如何匯出微信公眾號文章方法詳解

1.安裝wkhtmltopdf 下載地址:https://wkhtmltopdf.org/downloads.html 我測試用的是windows的，下載安裝後結果如下

Python版實現微信公眾號掃碼登陸

基於python 實現公眾掃碼登陸前提申請公眾號服務，配置相關資訊，並在相關平臺進行配置，就這麼多東西

Python爬取微信小程式通用方法程式碼例項詳解

背景介紹最近遇到一個需求，大致就是要獲取某個小程式上的資料。心想小程式本質上就是移動端加殼的瀏覽器，所以想到用Python去獲取資料。在網上學習了一下如何實現後，記錄一下我的實現過程以及所踩過的小坑。本文關

Python爬取微信小程式Charles實現過程圖解

一、前言最近需要獲取微信小程式上的資料進行分析處理，第一時間想到的方式就是採用python爬蟲爬取資料，嘗試後發現諸多問題，比如無法獲取目標網址、解析網址中存在指定引數的不確定性、加密問題等等，經過一番嘗試

微信公眾號開發：5、企業微信 SDK —— 傳送文字訊息

原文：https://www.cnblogs.com/Quinnz/p/12292598.html下面在控制檯應用裡展示一個簡單的例子來實現傳送文字訊息。本文目錄:建立控制檯應用新增SDK引用命令列方式進入專案目錄新增包引用配置和使用SDK新增appsettin

微信公眾號獲取使用者頭像、暱稱等資訊

技術標籤：前端phpopenidphpjavascriptjqueryhtml5 微信公眾號網頁可以獲取使用者頭像暱稱等資訊，具體怎麼獲取看程式碼：

Python 微信公眾號文章爬取

此文轉載自：https://blog.csdn.net/qq_36684855/article/details/110226009 Python 微信公眾號文章爬取

Python 微信公眾號文章爬取的示例程式碼

一.思路我們通過網頁版的微信公眾平臺的圖文訊息中的超連結獲取到我們需要的介面

python selenium 微信公眾號歷史文章隨手一點就返回首頁？鬱悶之下只好將他們都下載下來。

參照資料：selenium webdriver 如何新增cookie:https://www.cnblogs.com/sundahua/p/10202494.html

python爬蟲：搜狗微信公眾號文章資訊的採集（https://weixin.sogou.com/），儲存csv檔案

1 import requests 2 from requests.exceptions import RequestException 3 from lxml import etree 4 import csv

python編寫微信公眾號首圖思路詳解

前言之前一直在美圖秀秀調整自己的微信公眾號首圖，效果也不盡如人意，老是調來調去，最後發出來的圖片被裁剪了一大部分，丟失部分關鍵資訊，十分惱火，於是想著用python寫一個程式，把微信公眾號首圖的模式固定下來

使用Puppeteer爬取微信文章的實現

一朋友在群裡問有沒有什麼辦法能夠一次性把這個連結裡的文章儲存下來。點開可以看到，其實就是一個文章合集。所以需求就是，把這個文件中的連結裡的文章挨個儲存下來。儲存形式可以有很多種，可以是圖片，也可以是網

python微信公眾號開發簡單流程實現

本文為大家分享了python微信公眾號開發的簡單過程，供大家參考，具體內容如下

SpringBoot session 共享（copy自微信公眾號的文章）

在傳統的單服務架構中，一般來說，只有一個伺服器，那麼不存在 Session 共享問題，但是在分散式/叢集專案中，Session 共享則是一個必須面對的問題，先看一個簡單的架構圖：

基於Django專案的Python版微信公眾號支付-Native支付方式

本文詳細講解Python語言進行公眾號開發時，參考開發者文件進行Native支付（模式二），並給出具體的程式碼：

Python爬取微信公眾號文章、標題、文章地址

前言

基本開發環境

爬取兩個公眾號的文章：

爬取青燈程式設計公眾號所有的文章

爬取所有關於python的公眾號文章

相關推薦