Python selenium頁面載入慢超時的解決方案
開發環境:
win10-64 python2.7.16 chrome77
from selenium import webdriver driver = webdriver.Chrome(executable_path='chromedriver.exe') driver.get('http://全部載入完成超級慢的網站') user = 'abc' pwd = '123 driver.find_element_by_id('email').send_keys(user) driver.find_element_by_id('pass').send_keys(pwd)
先看這樣一段程式碼
當執行了get以後,除非網站全部載入完成,否則你只能乖乖等,什麼都不能幹,這是整個程式是阻塞的,get不完就別想進行下面操作
這個等待可能是5分鐘或者更久
其實5秒鐘的時候介面就已經打開了,然後他還在載入些什麼js,img,等待速度超慢的,但是網頁人工是可以操作
那麼有沒有什麼辦法呢,網上找了一通,給出了很多解決方案
首先是這貨(下面是我複製的):
from selenium import webdriver driver=webdriver.Chrome() driver.set_page_load_timeout(5) driver.set_script_timeout(5)#這兩種設定都進行才有效
try: d.get(s) except: d.execute_script('window.stop()')#這句話好像沒什麼軟用
可以在頁面停止載入後繼續操作了
driver.set_page_load_timeout(5)這玩意一設定,沒問題,5秒後網頁確實停止了,但是driver也死了,不管執行什麼都是timeout,還說try一下,driver是死透了,只能重新來
不知道是selenium更新了還是他自己沒測試還是chrome更新了,現在這麼設定就是找死的
注意:使用set_page_load_timeout時候,當頁面未加載出任何東西的時候(往往是html原始碼未載入),因為超時而停止,會導致driver失效,
後面的driver都不能操作,所以超時設定應該至少保證頁面內容加載出來一部分,設定超時不宜過短,如下圖在頁面此種狀態下停止載入後driver失效。
不錯,是有人也說了,不能設定太短,會失效,但是我可以說,你設定5分鐘照樣失效,只要超時一次,driver就完蛋,直接翻車
接下來是另一個方法
# coding = utf-8 from selenium import webdriver from selenium.webdriver.support.wait import WebDriverWait import time driver = webdriver.Chrome() class button(): def __call__(self,driver): if driver.find_element_by_id('js_love_url'): return True else: return False driver.implicitly_wait(60) time_start = time.time() driver.get('https://www.163.com/') # driver.find_element_by_id('js_love_url').click() WebDriverWait(driver,2,0.5).until(button()) time_end = time.time() print('access time is : ',time_end - time_start) time.sleep(2) driver.quit()
用WebDriverWait進行操作,不過我測試下來,driver.get()不執行完,下面的程式碼根本就不會執行,所以還是不行
找了各種方法,各種操作,都失敗了,總算今天找到了正確的方法
原理非常簡單:driver.get()這個操作,改成不阻塞的就行了,這樣開啟網頁就操作完成了,不需要等他載入
下面我可以直接等待需要的元素出現即可進行操作
配置也是很簡單
from selenium import webdriver from selenium.webdriver.common.desired_capabilities import DesiredCapabilities #get直接返回,不再等待介面載入完成 desired_capabilities = DesiredCapabilities.CHROME desired_capabilities["pageLoadStrategy"] = "none" driver = webdriver.Chrome(executable_path='chromedriver.exe')
配置一個引數,就是頁面載入策略,系統預設是等待,就是等他載入完,直接設定成none,就是不等待,這樣就是get操作完後直接就是結束了
到此這篇關於Python selenium頁面載入慢超時的解決方案的文章就介紹到這了,更多相關Python selenium載入慢內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!