Python爬蟲實現模擬點選動態頁面

阿新 • • 發佈：2020-03-06

動態頁面的模擬點選：

以鬥魚直播為例：http://www.douyu.com/directory/all

爬取每頁的房間名、直播型別、主播名稱、線上人數等資料，然後模擬點選下一頁，繼續爬取

程式碼如下

#!/usr/bin/python3
# -*- coding:utf-8 -*-
__author__ = 'mayi'
 
"""
動態頁面的模擬點選：
  模擬點選鬥魚直播：http://www.douyu.com/directory/all
  爬取每頁房間名、直播型別、主播名稱、線上人數等資料，然後模擬點選下一頁，繼續爬取
"""
 
from selenium import webdriver
import json
 
# 呼叫環境變數指定的PhantomJS瀏覽器建立瀏覽器物件，executable_path：指定PhantomJS位置
driver = webdriver.PhantomJS(executable_path = r"D:\Program Files\phantomjs\bin\phantomjs")
from bs4 import BeautifulSoup
 
class DouyuSpider(object):
  """
  爬蟲類
  """
  def __init__(self):
    self.url = "http://www.douyu.com/directory/all/"
    self.driver = webdriver.PhantomJS()
    self.file_name = open("douyu.json","w",encoding = "utf-8")
 
  def run(self):
    """
    爬蟲開始工作
    """
    self.driver.get(self.url)
    # 迴圈處理每一頁，直至最後一頁
    page = 1
    start_flag = True
    while True:
      # 等待3秒，防止訪問過於頻繁
      self.driver.implicitly_wait(3)
      print("正在處理第" + page + "頁......")
      page += 1
      # 解析
      soup = BeautifulSoup(self.driver.page_source,"lxml")
      # 線上直播部分
      online_live = soup.find_all('ul',{'id': 'live-list-contentbox'})[0]
      # 房間列表
      live_list = online_live.find_all('li')
      # 處理每一個房間
      for live in live_list:
        # 房間名、直播型別、主播名稱、線上人數
        # 房間名
        home_name = live.find_all('h3',{'class': 'ellipsis'})[0].get_text().strip()
        # 直播型別
        live_type = live.find_all('span',{'class': 'tag ellipsis'})[0].get_text().strip()
        # 主播名稱
        anchor_name = live.find_all('span',{'class': 'dy-name ellipsis fl'})[0].get_text().strip()
        # 線上人數
        online_num = live.find_all('span',{'class' :'dy-num fr'})[0].get_text().strip()
        # print(home_name,live_type,anchor_name,online_num)
        item = {}
        item["房間名"] = home_name
        item["直播型別"] = live_type
        item["主播名稱"] = anchor_name
        item["線上人數"] = online_num
        if start_flag:
          start_flag = False
          content = "[\n" + json.dumps(item)
        else:
          content = ",\n" + json.dumps(item)
        self.file_name.write(content)
      # page_source.find()未找到內容則返回-1
      if self.driver.page_source.find('shark-pager-disable-next') != -1:
        # 已到最後一頁
        break
      # 模擬點選下一頁
      self.driver.find_element_by_class_name('shark-pager-next').click()
 
    # 爬蟲結束前關閉檔案
    self.file_name.write("\n]")
    self.file_name.close()
if __name__ == '__main__':
  douyu = DouyuSpider()
  douyu.run()

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python爬蟲實現模擬點選動態頁面

動態頁面的模擬點選：以鬥魚直播為例：http://www.douyu.com/directory/all 爬取每頁的房間名、直播型別、主播名稱、線上人數等資料，然後模擬點選下一頁，繼續爬取

python中用ctypes模擬點選的例項講解

在小編學習python中的模擬點選之前，我們想要對某一項操作進行自動指令的重複，可以選擇大家熟知的按鍵精靈。那麼對比python的模擬點選，小編還是覺得python中使用更加方便。這樣說不能讓有些小夥伴信服，下面小編就

python模擬點選網頁按鈕實現方法

python怎麼模擬點選網頁按鈕前提環境: Python3 和 Visual Studio Code安裝完畢安裝selenium : 在終端輸入: pip install selenium,如圖

Python flask框架實現瀏覽器點選自定義跳轉頁面

程式碼如下 _init_.py from flask import Flask,request,url_for,redirect,render_template app = Flask(__name__)

python模擬點選在ios中實現的例項講解

我們都知道因為作業系統的不同，很多遊戲區分為安卓和蘋果兩個版本。那麼之前學會python模擬點選的小夥伴開始擔心，如果手機是ios版本那還能使用嗎？這個問題小編進行了測試，小夥伴們完全不用憂慮ios版本，因為經過

opencv+python實現滑鼠點選影象,輸出該點的RGB和HSV值

我就廢話不多說了，大家還是直接看程式碼吧！ import cv2 # 讀取圖片並縮放方便顯示

Python爬蟲教程：利用Python爬蟲實現CSDN模擬登入

大綱前言分析加密引數 uaTokenwebUmidToken 傳送模擬請求對比解決障礙瀏覽器傳送postman模仿

請實現滑鼠點選頁面中中任意標籤和實現鏈式呼叫，每日刷兩題

請實現滑鼠點選頁面中中任意標籤，alert該標籤名稱(注意相容性) document.onclick = function (e) {

python模擬點選玩遊戲的例項講解

小編髮現很多小夥伴都喜歡玩一些遊戲，而手遊因為玩的場景限制不多，所以受眾的人更多。遊戲裡有很多重複的任務需要我們完成，雖然過程非常無聊，但是為了任務獎勵還是有很多小夥伴不厭其煩的去做。那麼，有沒有什麼

python selenium 模擬點選div 登入操作

技術標籤：seleniumpython疑難雜症selenium 進行了登入操作，發現無法操作跳轉頁面的div層

JS實現點選切換頁面

今天學習了JS和html結合的，點選來切換到不同內容顯示。 <!DOCTYPE html> <html>

Python 爬蟲實現增加播客訪問量的方法實現

一、序言：世界 1024 程式猿節日不加班，閒著沒事兒。。。隨手寫了個播客訪問量爬蟲玩玩，訪問量過萬不是事兒！！！每個步驟註釋都很清晰，程式碼僅供學習參考！

Python爬蟲實現使用beautifulSoup4爬取名言網功能案例

本文例項講述了Python爬蟲實現使用beautifulSoup4爬取名言網功能。分享給大家供大家參考，具體如下：

Python爬蟲實現的根據分類爬取豆瓣電影資訊功能示例

本文例項講述了Python爬蟲實現的根據分類爬取豆瓣電影資訊功能。分享給大家供大家參考，具體如下：

Python爬蟲實現“盜取”微信好友資訊的方法分析

本文例項講述了Python爬蟲實現“盜取”微信好友資訊的方法。分享給大家供大家參考，具體如下：

python 爬蟲實現增量去重和定時爬取例項

前言：在爬蟲過程中，我們可能需要重複的爬取同一個網站，為了避免重複的資料存入我們的資料庫中通過實現增量去重去解決這一問題本文還針對了那些需要實時更新的網站增加了一個定時爬取的功能；

python爬蟲實現獲取下一頁程式碼

我們首先來看下例項程式碼： from time import sleep import faker import requests from lxml import etree

Android 實現為點選事件新增震動效果

Android 點選Button 實現震動效果教程 Overview 在Android 的點選效果中，遇到震動效果的還是很多的。

Android實現WebView點選攔截跳轉原生

1. 首先設定Web檢視 webview.setWebViewClient(new MyWebViewClient()); webview1.setWebViewClient(new MyWebViewClient());

Kotlin 實現按鈕點選跳轉監聽事件方式

例子：首頁Guiding頁面點選按鈕跳轉到主頁面 package com.example.naizu.mavec import android.app.Activity

Python爬蟲實現模擬點選動態頁面

相關推薦