1. 程式人生 > >pyhton微博爬蟲(2)——獲取微博使用者關注列表

pyhton微博爬蟲(2)——獲取微博使用者關注列表

本文的主要目標是獲取微博使用者關注列表以及關注列表中各微博使用者的ID暱稱詳情連結粉絲數關注數等關鍵資訊。

實現程式碼如下所示:

# -*- coding: utf-8 -*-
"""
Created on Thu Aug  3 20:59:53 2017

@author: Administrator
"""

import requests
import json
import time
import random
import pymysql.cursors


def crawlDetailPage(url,page):
    #讀取微博網頁的JSON資訊
    req = requests.get(url)
    jsondata = req.text
    data = json.loads(jsondata)

    #獲取每一條頁的資料
content = data['cards'] #print(content) #迴圈輸出每一頁的關注者各項資訊 for i in content: followingId = i['user']['id'] followingName = i['user']['screen_name'] followingUrl = i['user']['profile_url'] followersCount = i['user']['followers_count'] followCount = i['user'
]['follow_count'] print("---------------------------------") print("使用者ID為:{}".format(followingId)) print("使用者暱稱為:{}".format(followingName)) print("使用者詳情連結為:{}".format(followingUrl)) print("使用者粉絲數:{}".format(followersCount)) print("使用者關注數:{}".format(followCount)) ''' 資料庫操作 '''
#獲取資料庫連結 connection = pymysql.connect(host = 'localhost', user = 'root', password = '123456', db = 'weibo', charset = 'utf8mb4') try: #獲取會話指標 with connection.cursor() as cursor: #建立sql語句 sql = "insert into `following` (`followingId`,`followingName`,`followingUrl`,`followersCount`,`followCount`) values (%s,%s,%s,%s,%s)" #執行sql語句 cursor.execute(sql,(followingId,followingName,followingUrl,followersCount,followCount)) #提交資料庫 connection.commit() finally: connection.close() for i in range(1,11): print("正在獲取第{}頁的關注列表:".format(i)) #微博使用者關注列表JSON連結 url = "https://m.weibo.cn/api/container/getSecond?containerid=1005052164843961_-_FOLLOWERS&page=" + str(i) crawlDetailPage(url,i) #設定休眠時間 t = random.randint(31,33) print("休眠時間為:{}s".format(t)) time.sleep(t)

執行結果如下圖所示:

這裡寫圖片描述

mysql資料庫中的資料儲存如下圖所示:

這裡寫圖片描述