第十章採集javascript 使用selenium庫進行獲取

阿新 • • 發佈：2018-12-19

#!/usr/bin/env python
# _*_ coding:utf-8 _*_
# 等3秒獲取指定的內容 會有selenium不支援無頭的phantomjs的警告
# from selenium import webdriver
# import time
# driver=webdriver.PhantomJS(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
# driver.get("http://pythonscraping.com/pages/javascript/ajaxDemo.html")
# time.sleep(3)
# print(driver.find_element_by_id('content').text)
# driver.close()


# 用id檢查頁面是不是已經完全載入
# from selenium import webdriver
# from selenium.webdriver.common.by import By
# from selenium.webdriver.support import expected_conditions as EC
# from selenium.webdriver.support.ui import WebDriverWait
#
# driver=webdriver.PhantomJS(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
# driver.get("http://pythonscraping.com/pages/javascript/ajaxDemo.html")
# try:
#     element=WebDriverWait(driver,10).until(
#         EC.presence_of_element_located(By.ID,"loadedButton"))
# finally:
#     print(driver.find_element_by_id("content").text)
#     driver.close()

# 處理重定向 客戶端重定向的處理 在頁面開始載入時監控dom元素，重複呼叫這個元素
# 直到selenium丟擲StaleElementReferenceException異常，說明網頁發生了跳轉

# 每半分鐘檢查一次網頁，看是否html的標籤還在不在，時限為10s
import time

from selenium import webdriver
from selenium.common.exceptions import StaleElementReferenceException


def waitForLoad(driver):
    elem=driver.find_element_by_tag_name("html")
    count=0
    while True:
        count+=1
        if count>20:
            print("timing put after 10 seconds and returns")
            return
        time.sleep(.5)
        try:
            elem==driver.find_element_by_tag_name("html")
        except StaleElementReferenceException:
            return
driver=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs')
driver.get("http://pythonscraping.com/pages/javascript/redirectDemo1.html")
waitForLoad(driver)
print(driver.page_source)

第十章採集javascript 使用selenium庫進行獲取

#!/usr/bin/env python # _*_ coding:utf-8 _*_ # 等3秒獲取指定的內容會有selenium不支援無頭的phantomjs的警告 # from selenium import webdriver # import time # dr

第三十章：JSTL標籤庫

作者：java_wxid JSTL 標籤庫 JSTL標籤庫全稱是指 JSP Standard Tag Library JSP標準標籤庫。是一個不斷完善的開放原始碼的JSP標籤庫。 EL表示式主要是為了替換jsp中的表示式指令碼，而標籤庫則是為了替換程式碼指令碼。這樣使得整個jsp頁

為什麼我要放棄javaScript資料結構與演算法（第十章）—— 排序和搜尋演算法

本章將會學習最常見的排序和搜尋演算法，如氣泡排序、選擇排序、插入排序、歸併排序、快速排序和堆排序，以及順序排序和二叉搜尋演算法。第十章排序和搜尋演算法排序演算法我們會從一個最慢的開始，接著是一些效能好一些的方法先建立一個數組（列表）來表示待排序和搜尋的資料結構。 function Arra

《C++語言程式設計基礎》學習第十章泛型程式設計與C++標準模板庫

STL簡介：標準模板庫（Standard Template Library，簡稱STL）提供了一些非常常用的資料結構和演算法標準模板庫（Standard Template Library，簡稱STL）定義了一套概念體系，為泛型程式設計提供了邏輯基礎 STL中的各個類模板、

第十章 k-均值演算法 10.4 對地圖上的點進行聚類

將地圖上的點進行聚類，安排交通工具抵達這些簇的質心，然後步行到每個簇內地址。這裡我們直接用給出的檔案進行操作，跳過10.4.1節。新增程式碼： def distSLC(vecA, vecB):

《利用python進行資料分析》第十章時間序列（一）

stamp = ts.index[2] print ts[stamp],'\n' #還有更方便的用法，傳入可以被解釋為日期的字串 print ts['1/10/2011'] print ts['20110110'],'\n' #對於較長的時間序列，只需傳入“年”或“年月”即可輕鬆選取資料切片 long_ts

【MySQL比知必會】第八章用通配符進行過濾

通配符操作符範圍 name 使用技巧商品 -- rom 1、LIKE操作符　　之前使用的操作符都是針對已知的數據，而使用通配符可以對未知數據也進行搜索。　　通配符（wildcard）：用來匹配值得一部分的特殊字符。　　搜索模式（search pattern）：

《Java並發編程實戰》第十章避免活躍性危急讀書筆記

for 分析 tac mage cas 系統 ron htm 發生一、死鎖所謂死鎖：是指兩個或兩個以上的進程在運行過程中。因爭奪資源而造成的一種互相等待的現象。若無外力作用。它們都將無法推進下去。百科百科當兩個以上的運算單元，兩方都在等待對方停止執

【MySQL必知必會】第十章創建計算字段

客戶機 cat 第十章去掉 quantity 字段 cme 引用 field 1、字段（field）：一般與列（同義），經常互換使用，不過數據庫列一般稱之為列，字段通常用在計算字段的連接上。 2、拼接：將值連接到一起構成單個值。　　註：多數DBMS使用+或||來實現拼接

android：第十章，後臺的默默勞動者——服務，學習筆記

nts height border 之間默認方便第八章 ssa 重寫一、多線程1）本章首先介紹了安卓的多線程編程，說明在子線程中如果要修改UI，必須通過Handler, Message, MessageQueue, Looper來實現，但是這樣畢竟太麻煩了。 2）然

第十章網絡文件共享服務之ftp

download 服務端 10.1 ftp介紹網絡文件共享服務主流的主要有三種，分別是ftp、nfs、samba。在上一章中我們已經了解了nfs，本章我們將來說說ftp。 FTP是File Transfer Protocol（文件傳輸協議）的簡稱，用於internet上的控制文件的雙向傳輸。

第十章常用的JVM參數記錄

verbose eap jvm參數路徑 rect pac 直接內存堆內存卸載 GC -XX:+PrintGC 打印GC日誌 -XX:+PrintGCDetails 打印詳細的GC日誌 -Xloggc:/var/gc.log 將GC日誌打印在根目錄的var

《構建之法》第十章所見

辦公大數據量性能可能電腦 nbsp 構建運行服務本章標題名為典型用戶和場景，通過舉例子來描述對於我們所需要做的軟件的典型用戶，讓我們通俗易懂。隨後引入了典型用戶的定義，運用了石頭網站的例子描述，雖然沒有具體的方法，但是讓我們有了一定的了解與基礎，典型用戶就

第十章事務更新

擁有串行化 9.png com png log 異常終止異常產生從某種角度看：二段鎖協議是調度器實現串行化的依據的準則。沖突鎖的定義很明顯是要保證執行沖突操作的兩

Python核心編程第二版第十章課後答案

syntax arp 語句打開文件 ast pre 代碼塊 any 運行 10.1 引發異常。以下的哪個因素會在程序執行時引發異常？註意這裏我們問的並不是異常的原因。 a) 用戶； b) 解釋器； c) 程序； d) 以上所有； e) 只有 b) 和 c)； f) 只

從零開始的linux 第十章

history命令歷史調用詳解 bash快捷鍵詳解用法從零開始的linux 第十章老師：“都什麽時候了，小編怎麽還不更新博客！！”(裝作四處看風景)路人甲：“大概...小編..小編還在睡覺吧~~~”（↑聽完小編在睡覺的消息後，老師的目光中散發出兇惡...不...慈愛的眼神）（於是...老師點燃一支煙，深吸了

《當下的力量》第十章臣服的意義

光驅 asc 哲學家包含著生存不同分時排行榜限制第十章臣服的意義接受當下時刻你幾次提到過“臣服”。我不喜歡這個觀點。它聽起來就像宿命論一樣。如果我們一直接受現實，我們就不會做出努力去改善它們。在我看來，在個人生活和集體方

Redis 設計與實現（第九章） -- 數據庫

resize ger think contex sta 占用 return bsp null 概述 1.數據庫結構 2.數據庫鍵空間 3.鍵生存時間 4.持久化對過期鍵處理 5.數據庫通知 1.數據庫結構 Redis服務器將所有server狀態都保存在數據結構

第十章對象和類

ble blog 使用 perm stat c++11 有一個引入組件通常，C++程序員將接口（類定義）放在頭文件中，並將實現（類方法的代碼）放在源代碼文件中。在oop中，通常把對象成員函數的調用稱作發送消息給對象。訪問控制關鍵字：private（類默認的訪

Redis 設計與實現（第十章） -- 持久化AOF

written led atom 我們 continue ctc unixtime 機制 warn 概述 Redis除了RDB方式提供持久化外，還提供了AOF的方式，和RDB保存數據庫的鍵值對不同，AOF是記錄數據庫執行的命令來記錄數據庫狀態的。當AOF開始時，Redis

第十章 採集javascript 使用selenium庫進行獲取

相關推薦

第十章採集javascript 使用selenium庫進行獲取