Python學習--Selenium模塊學習(2)

阿新 • • 發佈：2019-01-27

driver cond 屬性 ted cat aid browser ng- links

Selenium的基本操作

獲取瀏覽器驅動尋找方式

1. 通過手動指定瀏覽器驅動路徑
2. 通過 `$PATH`環境變量找尋瀏覽器驅動

可參考Python學習--Selenium模塊簡單介紹(1)

控制瀏覽器訪問URL

browser.get(https://www.baidu.com/)

find系列函數定位元素

- `find_element_by_xxx`   返回第一個符合條件 `WebElement`
- `find_elements_by_xxx`  返回符合條件所有元素包含了`WebEelemnt`列表

- `find`函數系列說明
  - `find_element_by_class_name`    通過class 查詢元素
  - `find_element_by_id`            通過 ID
  - `find_element_by_name`          通過name
  - `find_element_by_tag_name`      通過標簽名稱
  - `find_element_by_css_selector`  css樣式選擇
  - `find_element_by_link_text`     通過鏈接內容查找
  - `find_element_by_partial_link_text` 通過鏈接內容包含的內容查找，模糊查詢
  - `find_element_by_xpath`         通過 xpath 查找數據

獲取元素屬性和文本內容

# 獲取屬性
element.get_attribute(‘屬性名‘)
# 獲取文本內容
element.text

輸入框輸入內容

input_element.send_keys(‘博客園‘)

自動百度查找博客園

import time

# 1. 導入模塊
from selenium import webdriver

# 2. 創建瀏覽器對象,
browser = webdriver.Chrome()  # 參數驅動路徑,默認參數也是當前路徑的chromedriver驅動

# 3. 輸入網址
browser.get("https://www.baidu.com/")

timeout = 60
start_time = time.time()
while True:
    try:
        time.sleep(0.1)  # 兼顧其他程序使用CPU資源
        # 4. 找到輸入框，輸入關鍵詞
        input_element = browser.find_element_by_id(‘kw‘)
        input_element.send_keys("小a玖拾柒-博客園")  # 查詢博客園
        # 5. 找到“百度一下”的按鈕，點擊一下按鈕
        button = browser.find_element_by_id(‘su‘)
        button.click()
        time.sleep(3)  # 讓網頁加載完成
        # 6. 找到作者的博客園鏈接
        url_element = browser.find_element_by_link_text("小a玖拾柒 - 博客園")
        url_element.click()
        break
    except Exception as e:
        if time.time() > start_time:   # 超時
            print(e)
            break

# 退出瀏覽器
time.sleep(3)
browser.quit()

查看百度首頁的鏈接(獲取元素是文本內容和元素屬性)

import time
# 1. 導入模塊
from selenium import webdriver

# 2. 創建瀏覽器對象,
browser = webdriver.Chrome()  # 參數驅動路徑,默認參數也是當前路徑的chromedriver驅動

# 3. 輸入網址
browser.get("https://www.baidu.com/")

baidu_list = browser.find_elements_by_class_name("mnav")
for item in baidu_list:
    # 獲取元素是文本內容和元素屬性
    print("{0}:{1}".format(item.text, item.get_attribute("href")))

# 退出瀏覽器
time.sleep(5)
browser.quit()

技術分享圖片

擴展：Selenium的自動等待方式

當控制瀏覽器時，瀏覽器正在加載頁面同時又去獲取數據導致瀏覽器尋找不到需要操作的元素引發異常。
- 方式一：強制等待，浪費時間

import time
time.sleep(秒數)

- 方式二：隱性等待，缺點：無法控制 AJAX請求

browser.implicitly_wait(等待時間)

- 方式三：顯性等待，每個元素都可以自己定義檢查條件

手動編寫：

timeout = 60
start_time = time.time()
while True:
    try:
        time.sleep(0.1)  # 兼顧其他程序使用CPU資源
        # 4. 找到輸入框，輸入關鍵詞
        input_element = browser.find_element_by_id(‘kw‘)
        input_element.send_keys("小a玖拾柒-博客園")  # 查詢博客園
        # 5. 找到“百度一下”的按鈕，點擊一下按鈕
        button = browser.find_element_by_id(‘su‘)
        button.click()
        time.sleep(3)  # 讓網頁加載完成
        # 6. 找到作者的博客園鏈接
        url_element = browser.find_element_by_link_text("小a玖拾柒 - 博客園")
        url_element.click()
        break
    except Exception as e:
        if time.time() > start_time:   # 超時
            print(e)
            break

Selenium提供：

# 導入顯性等待的API需要的模塊
    # 1> 等待對象模塊
    from selenium.webdriver.support.wait import WebDriverWait
    # 2> 導入等待條件模塊
    from selenium.webdriver.support import expected_conditions as EC
    # 3> 導入查詢元素模塊
    from selenium.webdriver.common.by import By

    # 使用selenium api 實現顯性等待
    # 1> 創建等待對象
    # 參數一 瀏覽器對象
    # 參數二 超時時間
    # 參數三 檢查元素時間間隔
    wait = WebDriverWait(browser,60,0.1)
    # presence_of_element_located 檢查元素是否存在，參數是一個元祖，元祖內部描述等待元素查詢方案
    # visibility_of_element_located 檢查元素是否可見
    url_element= wait.until(EC.presence_of_element_located((By.CLASS_NAME,"favurl")))

    url_element.click()

Python學習--Selenium模塊學習(2)

driver cond 屬性 ted cat aid browser ng- links Selenium的基本操作獲取瀏覽器驅動尋找方式 1. 通過手動指定瀏覽器驅動路徑2. 通過 `$PATH`環境變量找尋瀏覽器驅動可參考Python學習--Selenium模塊簡

Python中request模塊學習【深入淺出】

lencod pan 代碼傳遞參數 tro .org pro range request 安裝: pip install requests 使用： import requests HTTP請求：GET、POST、PUT、DELETE、HEAD、OPTIONS

Day15 - Python基礎15 模塊學習-selectors

acc OS key 模式 style except 查看支持平臺本節內容 1：Python/selectors模塊 2：selsect實例 1：Python/selectors模塊及隊列 selectors模塊是可以實現IO多路復用機制：它具有根據平臺

Python：pickle模塊學習

highest 進行編碼不同 protocal 不能被繼承 col style 字典 1. pickle模塊的作用將字典、列表、字符串等對象進行持久化，存儲到磁盤上，方便以後使用 2. pickle對象串行化 pickle模塊將任意一個python對象轉換成一系統

Python隨機數random模塊學習，並實現生成6位驗證碼

import ID for循環 list 序列獲取大小前言字符一、前言學習python隨機數random模塊的使用 ,並使用模塊中的函數，實現6位驗證碼生成二、random模塊 1、random.random() 返回0-1直接的隨機數，類型為float &g

python之常用模塊學習

報錯 print ima 學習 module 因此 end 匹配 img 1、模塊調用 import module from module import xx from module.xx.xx import xx as rename from module.xx.xx

python導入模塊（2）

line -h .com pre () main alt class print main.py文件 #_*_coding:utf-8_*_ #__author__ = "csy" from module_csy import say_hello as hello

day5模塊學習 -- os模塊學習

osi admin conf base cache errors day3 card www python基礎之模塊之os模塊 os模塊 os模塊的作用： os，語義為操作系統，所以肯定就是操作系統相關的功能了，可以處理文件和目錄這些我們日常手動需要做的操作，就比如

Nginx服務學習(7)-模塊學習

tex -- nginx -t 內容 root ace and index modified 模塊 http_stub_status_module配置：##Nginx的客戶端狀態語法：Syntax: stub_status;Default: --Context: serv

Nginx服務學習(9)-模塊學習

mit ber conn 模塊學習 one delay node zone 限制模塊連接頻率限制 --- limit_conn_module請求頻率限制 --- limit_req_module 連接頻率限制Syntax：limit_conn_zone key zo

selenium + python自動化測試unittest框架學習（四）python導入模塊及包知識點

腳本 selenium imp pat 程序文件 sel sys module 在寫腳本的時候，發現導入某些模塊，經常報錯提示導入模塊失敗，這裏來惡補下python導入模塊的知識點。 1.模塊導入時文件查找順序在腳本中，import xxx模塊時的具體步驟：（1）新建

Python 模塊學習2

sage 發生 HR ear list 管理 func tro 變量（1）configparse模塊如何創建如下配置文件 [DEFAULT] ServerAliveInterval = 45 Compression = yes CompressionLevel = 9

PYTHON學習第一模塊 Haproxy配置操作

strip uri color 操作 conn fio env print name 購物車模擬需求：根據用戶輸入輸出對應的backend下的 server信息可添加backend 和 sever信息可刪除backend 和sever信息添加server信息時,

Python學習筆記-模塊

python 模塊模塊：頂層文件（也是模塊文件）模塊文件模塊在物理形式上表現為.py結尾的代碼文件Python中，模塊本身也是對象，所以模塊也有變量，函數，類在一個模塊的頂層定義的所有變量都在被導入時成為了被導入模塊的屬性查看標準庫模塊：help(‘modules‘)頂層文件：包含了

Python 之路 Day5 - 常用模塊學習

shelve 乘除 etime 轉義字符 ict ron bbc pro 一個數模塊介紹 time &datetime模塊 random os sys shutil json & picle shelve xml處理 yaml處理 configparse

[ python編程 ] subprocess模塊學習總結

system rgs all 命令參數 htm code屬性 pen block 轉載：http://www.jb51.net/article/48086.htm 從Python 2.4開始，Python引入subprocess模塊來管理子進程，以取代一些舊模塊的

【Python模塊學習】sys模塊

err form pri 字符串文件系統 version stdout 通過編碼方式 sys模塊的操作如下： 1 sys.argv # 實現從程序外部向程序傳遞參數。 2 sys.exit([arg]) # 程序中間的退出，arg=0為正常退出。 3 sys

python 模塊學習

article rup sea 技術技術分享 blog color arc 個數一：什麽是正則？　正則就是用一些具有特殊含義的符號組合到一起（稱為正則表達式）來描述字符或者字符串的方法。或者說：正則就是用來描述一類事物的規則。（在Python中）它內嵌在Python中

PYTHON學習第二模塊 python內置模塊介紹

第一個 move re.search tar 保留 all basic format mktime 1 >>> import time 2 >>> time.time() 3 1491064723.808669 4 >>&g

學習Python基礎--------5模塊

環境變量 ack 。。組織功能學習 shu 代碼優化獲取主要內容模塊介紹 time和datetime模塊 random os sys shutil json和picle shelve xml處理 hashlib re正則表達式模塊介紹1.定義　　模塊：用

Python學習--Selenium模塊學習(2)

Selenium的基本操作

擴展：Selenium的自動等待方式

相關推薦