1. 程式人生 > 其它 >Python模組之selenium的簡單使用

Python模組之selenium的簡單使用

1、selenium介紹

selenium最初是一個自動化測試工具,模擬使用者的操作。
而爬蟲中使用它主要是為了解決requests無法直接執行JavaScript程式碼的問題 selenium本質是通過驅動瀏覽器,完全模擬瀏覽器的操作,比如跳轉、輸入、點選、下拉等,來拿到網頁渲染之後的結果,可支援多種瀏覽器,包括headless,可以在各種平臺使用。

2、安裝準備

#匯入模組
from selenium import webdriver 

下載應用程式與對應的驅動,這裡以Windows平臺為例,下載Chrome瀏覽器和對應的瀏覽器驅動

下載Chrome瀏覽器:https://www.google.cn/chrome/

檢視驅動和瀏覽器版本的對映關係:http://blog.csdn.net/huilan_same/article/details/51896672

下載對應的驅動程式:http://chromedriver.storage.googleapis.com/index.html

3、selenium操作

3.1.簡單使用

from selenium import webdriver
#載入相應瀏覽器的驅動檔案
#這會到的一個瀏覽器的示例物件,每例項化一個物件,都會開啟一個新的瀏覽器
driver=webdriver.Chrome(r'./chromedriver.exe')
#開啟一個新的頁面,預設多個請求連結會被覆蓋,只顯示最後一個請求
page=driver.get('https://www.baidu.com/') #關閉瀏覽器 driver.quit()

3.1元素定位

元素定位
find_element_by_id
find_elements_by_id 
通過元素id定位
find_element_by_name
find_elements_by_name
通過元素name定位
find_element_by_xpath
find_elements_by_xpath
通過xpath表示式定位
find_element_by_link_text
find_elements_by_link_tex
通過完整超連結定位
find_element_by_partial_link_text
find_elements_by_partial_link_text
通過部分連結定位
find_element_by_tag_name
find_elements_by_tag_name
通過標籤定位
find_element_by_class_name
find_elements_by_class_name
通過類名進行定位
find_elements_by_css_selector
find_elements_by_css_selector
通過css選擇器進行定位