pyhton微博爬蟲（2）——獲取微博使用者關注列表

阿新 • • 發佈：2019-02-02

本文的主要目標是獲取微博使用者關注列表以及關注列表中各微博使用者的ID、暱稱、詳情連結、粉絲數、關注數等關鍵資訊。

實現程式碼如下所示：

# -*- coding: utf-8 -*-
"""
Created on Thu Aug  3 20:59:53 2017

@author: Administrator
"""

import requests
import json
import time
import random
import pymysql.cursors


def crawlDetailPage(url,page):
    #讀取微博網頁的JSON資訊
    req = requests.get(url)
    jsondata = req.text
    data = json.loads(jsondata)

    #獲取每一條頁的資料 

    content = data['cards']
    #print(content)

    #迴圈輸出每一頁的關注者各項資訊
    for i in content:
        followingId = i['user']['id']
        followingName = i['user']['screen_name']
        followingUrl = i['user']['profile_url']
        followersCount = i['user']['followers_count']
        followCount = i['user' 
]['follow_count']

        print("---------------------------------")
        print("使用者ID為:{}".format(followingId))
        print("使用者暱稱為:{}".format(followingName))
        print("使用者詳情連結為:{}".format(followingUrl))
        print("使用者粉絲數:{}".format(followersCount))
        print("使用者關注數:{}".format(followCount))



        '''
        資料庫操作
        ''' 


        #獲取資料庫連結
        connection  = pymysql.connect(host = 'localhost',
                                  user = 'root',
                                  password = '123456',
                                  db = 'weibo',
                                  charset = 'utf8mb4')
        try:
            #獲取會話指標
            with connection.cursor() as cursor:
                #建立sql語句
                sql = "insert into `following` (`followingId`,`followingName`,`followingUrl`,`followersCount`,`followCount`) values (%s,%s,%s,%s,%s)"

                #執行sql語句
                cursor.execute(sql,(followingId,followingName,followingUrl,followersCount,followCount))

                #提交資料庫
                connection.commit()
        finally:
            connection.close()


for i in range(1,11):
    print("正在獲取第{}頁的關注列表:".format(i))
    #微博使用者關注列表JSON連結
    url = "https://m.weibo.cn/api/container/getSecond?containerid=1005052164843961_-_FOLLOWERS&page=" + str(i)
    crawlDetailPage(url,i)
    #設定休眠時間
    t = random.randint(31,33)
    print("休眠時間為:{}s".format(t))
    time.sleep(t)

執行結果如下圖所示：

這裡寫圖片描述

mysql資料庫中的資料儲存如下圖所示：

這裡寫圖片描述

pyhton微博爬蟲（2）——獲取微博使用者關注列表

本文的主要目標是獲取微博使用者關注列表以及關注列表中各微博使用者的ID、暱稱、詳情連結、粉絲數、關注數等關鍵資訊。實現程式碼如下所示： # -*- coding: utf-8 -*- """ Created on Thu Aug 3 20:59:53

pyhton微博爬蟲（3）——獲取微博評論資料

本文的主要目標是獲取微博評論資料，具體包括微博評論連結、總評論數、使用者ID、使用者暱稱、評論時間、評論內容、使用者詳情連結等。實現程式碼如下所示： # -*- coding: utf-8 -*- """ Created on Tue Aug 8 16:

微信開發（二）——獲取微信使用者的基本資訊

我們在微信開發過程中，很可能需要獲取授權使用者的微信頭像來作為系統的預設頭像，這是個非常簡單的實現現在我們的手上已經用於openid和accesstoken（這不是全域性token！！！），不知道如何獲取的見上一節，微信開發獲取openid 我們通過以下方法

【網路爬蟲】【java】微博爬蟲（二）：如何抓取HTML頁面及HttpClient使用

一、寫在前面上篇文章以網易微博爬蟲為例，給出了一個很簡單的微博爬蟲的爬取過程，大概說明了網路爬蟲其實也就這麼回事，或許初次看到這個例子覺得有些複雜，不過沒有關係，上篇文章給的例子只是讓大家對爬蟲過程有所瞭解。接下來的系列裡，將一步一步地剖析每個過程。現

微信開發（2）:微信js sdk分享朋友圈，朋友，獲取config介面注入許可權驗證（java）

進行微信開發已經一陣子了，從最初的什麼也不懂，到微信授權登入，分享，更改底部選單，素材管理，等。今天記錄一下微信jssdk 的分享給朋友的功能，獲取config介面注入。官方文件走一下簡單說：四步走 1.繫結域名（注意：設定js安全域名的時候，需

pyhton爬蟲（8）——獲取網易新聞內容

本文主要目的是獲取網易新聞標題和正文內容。實現程式碼如下所示： # -*- coding: utf-8 -*- """ Created on Mon Jul 17 15:46:30 2017 @author: Administrator """ from b

【網路爬蟲】【java】微博爬蟲（四）：資料處理——jsoup工具解析html、dom4j讀寫xml

之前提到過，對於簡單的網頁結構解析，可以直接通過觀察法、手工寫正則解析，可以做出來，比如網易微博。但是對於結構稍微複雜點的，比如新浪微博，如果還用正則，用眼睛一個個去找，未免太麻煩了。本文介紹兩個工具包：解析html, xml的jsoup，

Java中的微信支付（2）：API V3 微信平臺證書的獲取與重新整理

![](https://img2020.cnblogs.com/other/1739473/202010/1739473-20201030090354982-980711550.jpg) ## 1. 前言在[Java中的微信支付（1）：API V3版本簽名詳解](https://mp.weixin.qq

53. Python 爬蟲（2）

expires www. als aid rgb user col pri request CookieRequests通過會話信息來獲取cookie信息Cookie的五要素： Name value domain path expires打印cookie

多研究些架構，少談些框架（ 2 ）：微服務和充血模型

方法平時是把小系統生涯過程語句小結大量上篇我們聊了微服務的DDD之間的關系，很多人還是覺得很虛幻，DDD那麽復雜的理論，聚合根、值對象、事件溯源，到底我們該怎麽入手呢？實際上DDD和面向對象設計、設計模式等等理論有千絲萬縷的聯系，如果不熟悉OOA、OOD

網易雲音樂評論爬蟲（2）：歌曲的全部評論

ima cbc 原理分析 nbsp oss 處理 oop win 接下來用過網易雲音樂聽歌的朋友都知道，網易雲音樂每首歌曲後面都有很多評論，熱門歌曲的評論更是接近百萬或者是超過百萬條．現在我就來分享一下如何爬取網易雲音樂歌曲的全部評論，由於網易雲音樂的評論都做了混淆加密處

【ADNI】資料預處理（2）獲取 subject slices

ADNI Series 1、【ADNI】資料預處理（1）SPM，CAT12 2、【ADNI】資料預處理（2）獲取 subject slices 3、【ADNI】資料預處理（3）CNNs 4、【ADNI】資料預處理（4）Get top k slices according to CNN

Python的學習筆記DAY7---關於爬蟲（2）之Scrapy初探

首先是安裝，python3+windows10 64位。安裝Scrapy，安裝，直接pip install Scrapy.....下載了半天報錯。。好像是沒有lxml這

院隊博客（2）

win 性方面範圍精度需要社團可能網站方法團隊的PM：李誌鵬軟件的需求分析：作用範圍：尋找並報名社團背景材料：社團目前面臨招新社員難的問題並完成任務1.2系統（或用戶）的特點該軟件是一個整合了眾多的鏈接搜索軟件，主要用於高校的社團納新。擁有運存小，效

微信支付（2）

接著上文，做微信支付（h5）需要微信登入的環節。不多講在微信登入的時候可以獲取到微信對於的微信的公眾號的唯一標識即openid，這裡我是將獲取的openid存放在使用者表的。需要將他加入引數列表進行生成預支付的訂單號。話歸正題，微信支付需要做的準備工作。需要登入微信商戶平臺設定好祕鑰。

手把手教你寫網路爬蟲（2）：迷你爬蟲架構

語言&環境有需要Python學習資料的小夥伴嗎?小編整理【一套Python資料、原始碼和PDF】，感興趣者可以加學習群：548377875或者加小編微信：【mmp9972】反正閒著也是閒著呢，不如學點東西啦~~ 語言：帶足彈藥，繼續用Python開路！ t

認識爬蟲（2）

用爬蟲下載簡單的頁面，可以拿來練手 import requests class TiebaSpider: def __init__(self,tieba_name_crawl): """ 初始化必要引數，完成基礎設定 :param

微信開發常用技巧（2）-ios微信開發alert上面顯示地址問題，以及移動端提示框推薦

ios微信開發alert上面顯示地址問題做微信開發的朋友可能會遇到：安卓微信的alert()，沒有問題，ios微信的alert(),會tm很尷尬的出現你的document.domain地址解：過濾程式碼如下 window.alert = function(name)

微信公眾號（服務號）接入開發（2）之微信授權登陸

如果使用者在微信客戶端中訪問第三方網頁，公眾號可以通過微信網頁授權機制，來獲取使用者基本資訊，進而實現業務邏輯。 1. 授權回撥域名的說明：（1）、這裡填寫的是域名（是一個字串），而不是URL，因此請勿加http://等協議頭；（2）、授權

python爬蟲（20）獲取酷我音樂排行榜榜單作品

獲取酷我音樂榜單歌曲共分為三步第一步，在榜單主頁，獲取各個榜單的名字以及bangid 從這裡可以看到有三類榜單，全球榜，分類榜還有特色榜，每一個分類榜單再包含幾個榜單然後我們就可以使用F12工具檢視一下網頁元素我們需要獲得的元素是榜單名字，以及b

pyhton微博爬蟲（2）——獲取微博使用者關注列表

相關推薦