Selenium+BeautifulSoup+json獲取Script標籤內的json資料

阿新 • • 發佈：2020-12-08

Selenium爬蟲遇到資料是以 JSON 字串的形式包裹在 Script 標籤中，

假設Script標籤下程式碼如下：

<script id="DATA_INFO" type="application/json" >
{
  "user": {
    "isLogin": true,"userInfo": {
      "id": 123456,"nickname": "LiMing","intro": "人生苦短，我用python"
    }
  }
}
</script>

此時drive.find_elements_by_xpath('//*[@id="DATA_INFO"] 只能定位到元素，但是無法通過.text方法，獲取Script標籤下的json資料

from bs4 import BeautifulSoup as bs
import json as js
#selenium獲取當前頁面原始碼
html = drive.page_source
#BeautifulSoup轉換頁面原始碼
bs=BeautifulSoup(html,'lxml')
#獲取Script標籤下的完整json資料，並通過json載入成字典格式
js_test=js.loads(bs.find("script",{"id":"DATA_INFO"}).get_text())
#獲取Script標籤下的nickname 值
js_tes

到此這篇關於Selenium+BeautifulSoup+json獲取Script標籤內的json資料的文章就介紹到這了,更多相關Selenium+BeautifulSoup獲取json內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Selenium+BeautifulSoup+json獲取Script標籤內的json資料

Selenium爬蟲遇到資料是以 JSON 字串的形式包裹在 Script 標籤中，假設Script標籤下程式碼如下：

python3 BeautifulSoup模組使用字典的方法抓取a標籤內的資料示例

本文例項講述了python3 BeautifulSoup模組使用字典的方法抓取a標籤內的資料。分享給大家供大家參考，具體如下：

Python爬蟲庫BeautifulSoup獲取物件(標籤)名,屬性,內容,註釋

一、Tag(標籤)物件 1.Tag物件與XML或HTML原生文件中的tag相同。 from bs4 import BeautifulSoup

JSON獲取屬性值方法程式碼例項

JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式。易於人閱讀和編寫。同時也易於機器解析和生成。它基於JavaScript（Standard ECMA-262 3rd Edition - December 1999）的一個子集。

Java連線Redis,儲存物件獲取物件()byte和json),連線池

Java連線Redis Jedis連線Redis,Lettuce連線Redis Jedis連線Redis 1. 建立maven專案 2. 引入依賴

如何獲取前端提交來得json格式資料

composer.json { \"require\": { \"guzzlehttp/guzzle\": \"~6.0\" } } composer install index.php 訪問該頁面請求後臺介面

詳解BeautifulSoup獲取特定標籤下內容的方法

以下是個人在學習beautifulSoup過程中的一些總結，目前我在使用爬蟲資料時使用的方法的是：先用find_all()找出需要內容所在的標籤，如果所需內容一個find_all()不能滿足，那就用兩個或者多個。接下來遍歷find_all的結

所有key 獲取json_JavaScript前後端JSON使用方法詳解

技術標籤：所有key 獲取json 彙總整理下JSON在JavaScript前後端中的使用方法，包括字串和JSON物件的互轉，JSON陣列的遍歷，JSON物件key值的獲取，JSON內容格式化輸出到檔案，讀取JSON內容檔案轉化為JSON物件等

js中動態獲取頁面的script地址，並動態給他新增script標籤和地址，解決頁面白屏問題

技術標籤：vue3.0vuevuejs 前言：（業務邏輯）在vue中，遇到這樣的情況，初始化載入太多js，導致頁面白屏，為了解決這個情況，決定使用具體元件具體載入相應的cdn地址。

JS-JSON-獲取JSON物件中的資料展示到表格裡

JS-JSON-獲取JSON物件中的資料展示到表格裡 1.要求點選按鈕，將學生資訊展示到表格裡，並顯示總記錄條數。

SpringBoot過濾器如何獲取POST請求的JSON引數

目錄SpringBoot過濾器獲取POST請求的ON引數想到了使用過濾器來實現這個功能所以我們可以通過獲取到輸入流來獲取bodwww.cppcns.comy從原始碼我們可以看到我們建立一個類並繼承這個包裝類有一點需要注意的SpringBoot過

Django學習——ajax傳送其他請求、上傳檔案（ajax和form兩種方式）、ajax上傳json格式、 Django內建序列化（瞭解）、分頁器的使用

1 ajax傳送其他請求 1 寫在form表單 submit和button會觸發提交<form action=\"\"> </form>註釋

Android 獲取Assets中的Json檔案轉換為實體類

package com.commerce.img.tools; import android.content.Context; import com.commerce.img.entity.DataUrl;

Python使用selenium + headless chrome獲取網頁內容的方法示例

使用python寫爬蟲時，優選selenium，由於PhantomJS因內部原因已經停止更新，最新版的selenium已經使用headless chrome替換掉了PhantomJS，所以建議將selenium更新到最新版，使用selenium + headless chrome

python json 遞迴列印所有json子節點資訊的例子

我就廢話不多說了，直接上程式碼吧 def json_txt(self,dic_json): #self.debug_print(\"json_txt\")

JavaScript 02 script標籤

javascript程式碼必須放在script標籤中script標籤可以放在html的任何地方，一般建議放在head標籤裡

介面自動化，sso單點登陸不支援通過介面返回token，其他請求又需要token。解決方式，使用UI自動化的selenium框架登陸獲取token

找解決方案，找了好久，終於找到了，其他部落格給了我思路 F12後切換到Application,然後看token是儲存在localStorage還是sessionStorage

關於控制檯使用script標籤動態插入jQuery指令碼無法立即正常使用的問題。

問題背景：目的：通過在他人的網頁也增添jQuery庫來使用自己的jQuery指令碼，

python爬蟲獲取一個月內全球大地震目錄，cartopy在世界地圖上繪製震中分佈圖

import cartopy.crs as ccrs import matplotlib.pyplot as plt from cartopy.mpl.gridliner import LONGITUDE_FORMATTER, LATITUDE_FORMATTER

輸入框檢索內容，html標籤內檢索

@{ ViewData[\"Title\"] = $\"驗收部位\"; } <div class=\"row no-gutters align-items-center\"> <div class=\"col-3\">關鍵詞查詢：</div>

Selenium+BeautifulSoup+json獲取Script標籤內的json資料

相關推薦