Python模組之selenium的簡單使用
阿新 • • 發佈:2021-10-03
1、selenium介紹
selenium最初是一個自動化測試工具,模擬使用者的操作。
而爬蟲中使用它主要是為了解決requests無法直接執行JavaScript程式碼的問題 selenium本質是通過驅動瀏覽器,完全模擬瀏覽器的操作,比如跳轉、輸入、點選、下拉等,來拿到網頁渲染之後的結果,可支援多種瀏覽器,包括headless,可以在各種平臺使用。
2、安裝準備
#匯入模組 from selenium import webdriver
下載應用程式與對應的驅動,這裡以Windows平臺為例,下載Chrome瀏覽器和對應的瀏覽器驅動
下載Chrome瀏覽器:https://www.google.cn/chrome/
檢視驅動和瀏覽器版本的對映關係:http://blog.csdn.net/huilan_same/article/details/51896672
下載對應的驅動程式:http://chromedriver.storage.googleapis.com/index.html
3、selenium操作
3.1.簡單使用
from selenium import webdriver #載入相應瀏覽器的驅動檔案 #這會到的一個瀏覽器的示例物件,每例項化一個物件,都會開啟一個新的瀏覽器 driver=webdriver.Chrome(r'./chromedriver.exe') #開啟一個新的頁面,預設多個請求連結會被覆蓋,只顯示最後一個請求page=driver.get('https://www.baidu.com/') #關閉瀏覽器 driver.quit()
3.1元素定位
find_element_by_id
|
find_elements_by_id
|
通過元素id定位
|
find_element_by_name
|
find_elements_by_name
|
通過元素name定位
|
find_element_by_xpath
|
find_elements_by_xpath
|
通過xpath表示式定位
|
find_element_by_link_text
|
find_elements_by_link_tex |
通過完整超連結定位
|
find_element_by_partial_link_text
|
find_elements_by_partial_link_text
|
通過部分連結定位
|
find_element_by_tag_name
|
find_elements_by_tag_name
|
通過標籤定位
|
find_element_by_class_name
|
find_elements_by_class_name
|
通過類名進行定位
|
find_elements_by_css_selector
|
find_elements_by_css_selector
|
通過css選擇器進行定位
|