Python 獲取動態載入的頁面資料

阿新 • • 發佈：2019-02-02

這種動態載入的頁面，一般資料會在Network的 JS或者 XHR 類目裡。所以我們要使用開發者工具輔助。

一：開啟開發者工具，看這一頁的 XHR裡沒有任何檔案，然後點選“載入更多”按鈕，看它給我們返回什麼資訊。

返回了一個新的檔案,右鍵這個檔案，Open in new tab。

這個頁面是一個JSON格式的資料，通過檢視，發現這個json資料的內容就是剛載入的電影資料

二：再載入幾次，再來看看 XHR 載入的這幾個頁面的 url：

https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E9%9D%92%E6%98%A5&start=20
https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E9%9D%92%E6%98%A5&start=40
https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E9%9D%92%E6%98%A5&start=60
https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E9%9D%92%E6%98%A5&start=80
https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E9%9D%92%E6%98%A5&start=100

對比發現只有最後 start= 後面的數字在變化，而且是以20為步長遞增的，20正好對應每次加載出來的電影數量。

import requests
import json
import time

for a in range(5):
    url = 'https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=青春&start={}'.format(a * 20)
    file = requests.get(url).json()  # 返回的是 json檔案所以用 .json()
    time.sleep(2)
#每次載入20個電影資訊
    for i in range(20):
        dict = file['data'][i]  # 取出字典中 'data' 下第 [i] 部電影的資訊
        urlname = dict['url']
        title = dict['title']
        rate = dict['rate']
        cast = dict['casts']
        print('影名:{}  評分:{}  演員:{}  連結:{}\n'.format(title, rate, '、'.join(cast), urlname))

Python 獲取動態載入的頁面資料

這種動態載入的頁面，一般資料會在Network的 JS或者 XHR 類目裡。所以我們要使用開發者工具輔助。一：開啟開發者工具，看這一頁的 XHR裡沒有任何檔案，然後點選“載入更多”按鈕，看它給我們返回什麼資訊。返回了一個新的檔案,右鍵這個檔案，Open i

d3滑鼠拖拽、放大縮小後動態載入頁面資料demo

d3滑鼠拖拽、放大縮小後動態載入頁面資料demo index.html <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <style

Python爬蟲開發（四）：動態載入頁面的解決方案與爬蟲代理

0×00 前言如果讀者讀過我前面的關於爬蟲的文章，應該大概都清楚我們現在可以對一個靜態的web頁面”為所欲為“了，但是技術的發展總是沒有止境的，僅僅是這樣對靜態頁面處理遠遠不夠，要知道現在很多的web頁面有意無意為了防止靜態爬蟲使用ajax技術動態載入頁面，這就導致了在面對這些網站的時候，我們

asp.net頁面通過Javascript使用CanvasJS.Chart畫曲線，曲線實現動態載入後臺資料（通過ajax）

頁面程式碼： <html> <head> <script src="jQuery.js" type="text/javascript"></script> <script src="https://canvasjs.com/assets/

【python爬蟲】動態載入頁面的解決辦法（以ins為例）

現在很多的web頁面使用ajax技術動態載入頁面。但對於爬蟲來說，目標資料很可能不在頁面HTML原始碼中（右鍵檢視網頁原始碼，通過F12查詢），針對靜態頁面的爬蟲不再滿足現在的需求。很多教程都推薦用Selenium和PhantomJS配合使用，實現網頁的渲染，得到網頁的全

Python高階爬蟲（四）：動態載入頁面的解決方案與爬蟲代理

*原創作者：VillanCh 0×00 前言 0×01 動態頁面解決方案Selenium+PhantomJS 0×02 原理回顧對比 0×03 Quick Start 0×04 webdriver API 0×05 匿名爬蟲 0×06 匿名爬蟲解決方案 0×07 完結總結

python獲取動態網站上面的動態加載的數據（selenium+Firefox）

bs4 cep tom 源碼 exc () utf firefox target 最近突然想到以前爬取百度學術上的參考文獻，大家可以看一下以前我的寫的博客：http://www.cnblogs.com/ybf-yyj/p/7351493.html，但是如果利用這個方法，太痛

Python web 動態渲染頁面的抓取

通過直接分析ajax資訊,我們仍然可以利用request或者urllib來獲取資訊,但是,JavaScript動態渲染頁面的方式不僅只有ajax一種,也不是傳統的html頁面資訊,運用模擬瀏覽器的執行方式來獲取資訊,只要瀏覽器能接收到,我們就能獲取出來.在 Python 中提供了許多模擬瀏覽器執行的

Python----獲取http請求報文資料

Python—-獲取http請求報文資料 import socket if __name__ == '__main__': # 1.建立tcp服務端套接字 tcp_server_socket = socket.socket(socket.AF_

Java：java爬蟲獲取動態網頁的資料

說明：只是分享一種解決方案，程式碼以及部分截圖不方便貼出，請諒解！前段時間一直在研究爬蟲，抓取網路上的特定的資料，如果只是靜態網頁就是再簡單不過了，直接使用Jsoup ： Document doc = Jsoup.connect(url).timeout(2000).

Python的動態載入機制

眾所周知import是用來載入Python模組的，其實import是呼叫內建函式__import__來工作的，這就使我們動態載入模組變成了可能。import glob, os modules = [] for module_file in glob.glob('*-plugin.py'):

python獲取xml中的資料

文章目錄一、xml中節點包含的屬性：二、節點型別三、python獲取xml節點：例項1 列印根節點資訊例項2 列印標籤對之間的資料例項3 列印節點屬性

HTML之動態載入表格資料

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head>

Python 獲取新浪財經資料的案例

data_info = {'num':'200',#股票數目 'sort':'r3_net', #散戶資金流入 'asc':'0', 'bankuai':'', 'shichang':''} data = urllib.url

Echarts使用及動態載入圖表資料

Echarts簡介 echarts，縮寫來自Enterprise Charts，商業級資料圖表，一個純JavaScript的圖表庫，來自百度。。。我想應該夠簡潔了使用Echarts 目前，就官網的文件顯示，使用echarts有兩種方式，echarts3之前

利用python獲取pdf檔案元資料

開發語言：python3 開發工具：pycharm python第三方模組：PyPDF2 python內建模組：sys 第一步：pycharm安裝第三方模組“PyPDF2” &n

樹莓派使用Python獲取DHT22的溫溼度資料

說明樹莓派系統使用的是Raspbian 9，Python版本是Python3，感測器使用DHT22，PC端使用Putty通過SSH協議連線樹莓派，埠為預設的22。還用到了Windows下的mstsc工具，用來影象化登入樹莓派，不習慣使用命令的操作可以用

移動app手機物理鍵返回、後退、上一頁面並重新載入頁面資料

專案中遇到一個問題，做個筆記。就是在微信網頁上面本來是有返回按鈕的，但是大多數人都為了方便，會使用安卓手機自帶的物理返回鍵，這個返回鍵按下後，上一頁內容獲取最新資料。如圖:需求：常見問題，點選一個問題後

Echarts使用及動態載入圖表資料折線圖X軸資料動態載入

Echarts簡介 echarts，縮寫來自Enterprise Charts，商業級資料圖表，一個純Javascript的圖表庫，來自百度。。。我想應該夠簡潔了使用Echarts 目前，就官網的文件顯示，使用echarts有兩種方式，echart

Extjs 動態載入ComboBox資料

{ xtype : 'combo', emptyText : '請選擇年份^',//下拉框初始顯示欄位 fieldLabel : '年份選擇',

Python 獲取動態載入的頁面資料

相關推薦