Python+Selenium+phantomjs實現網頁模擬登入和截圖功能(windows環境)

阿新 • • 發佈：2020-01-09

本文全部操作均在windows環境下

安裝 Python

Python是一種跨平臺的計算機程式設計語言，它可以執行在Windows、Mac和各種Linux/Unix系統上。是一種面向物件的動態型別語言，最初被設計用於編寫自動化指令碼(shell)，隨著版本的不斷更新和語言新功能的新增，越來越多被用於獨立的、大型專案的開發

去Python的官網 www.python.org 下載安裝

安裝時勾選pip (python包管理工具)，同時安裝pip

python安裝好之後，開啟命令列工具cmd，輸入“python -V”,然後敲回車，如果出現python版本號，則表示安裝成功

安裝 selenium

selenium 是一個用於Web應用程式測試的工具。selenium測試直接執行在瀏覽器中，就像真正的使用者在操作一樣。支援的瀏覽器包括IE（7,8,9,10,11），Mozilla Firefox，Safari，Google Chrome，Opera等。selenium 是一套完整的web應用程式測試系統，包含了測試的錄製（selenium IDE）,編寫及執行（Selenium Remote Control）和測試的並行處理（Selenium Grid）

通過python包管理工具pip安裝

pip install selenium

安裝 phantomjs

phantomJS是一個基於webkit的javaScript API。它使用QtWebKit作為它核心瀏覽器的功能，使用webkit來編譯解釋執行javaScript程式碼。任何你可以基於在webkit瀏覽器做的事情，它都能做到。它不僅是個隱性的瀏覽器，提供了諸如css選擇器、支援wen標準、DOM操作、json、HTML5等，同時也提供了處理檔案I/O的操作，從而使你可以向作業系統讀寫檔案等。phantomJS的用處可謂非常廣泛諸如網路監測、網頁截圖、無需瀏覽器的wen測試、頁面訪問自動化等

phantomjs安裝連結 www.phantomjs.org

在桌面建立demo資料夾，建立demo.py檔案，當做我們的指令碼檔案，建立img資料夾用來存放擷取的圖片demo.py：

# coding=utf-8
# 匯入網頁驅動軟體
from selenium import webdriver
# 匯入WebDriverWait等待模組
from selenium.webdriver.support.wait import WebDriverWait
import time

# 呼叫環境變數指定的PhantomJS瀏覽器建立瀏覽器物件
# 括號內為phantomjs安裝位置
driver = webdriver.PhantomJS(executable_path="D:\\Python27\\Scripts\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe")
# 訪問的網址（以央視網為例）
driver.get("http://www.cctv.com/")
# 最大化瀏覽器
driver.maximize_window()

# 模擬點選登入按鈕登入彈出登入框（後面有定位元素方法介紹）
driver.find_elements_by_xpath('//span[@class="btn_icon"]')[1].click()

# 等待登入頁面載入完成，WebDriverWait （後面有等待方法介紹）
WebDriverWait(driver,0.5).until(lambda diver:driver.find_element_by_xpath('//a[@class="dl"]'),message="")
time.sleep(2)
# 擷取登入框的頁面儲存到相應位置
driver.save_screenshot('demo\\img\\login1.png')
# 定位登入頁面使用者名稱和密碼元素並模擬填入使用者名稱和密碼
driver.find_element_by_name("username").send_keys('xxxxxxxxxxx')
driver.find_element_by_name("passwd_view").send_keys('xxxxxxxxxxx')
# 模擬點選登入按鈕登入
driver.find_element_by_link_text('登入').click()

WebDriverWait(driver,0.5).until(lambda diver:driver.find_elements_by_xpath('//span[@class="btn_icon"]'),message="")
time.sleep(2)
# 擷取登入後的頁面儲存到相應位置
driver.save_screenshot('demo\\img\\login2.png')

# 模擬點選按鈕跳轉體育頁面
driver.find_element_by_link_text('體育').click()
WebDriverWait(driver,0.5).until(lambda diver:driver.find_element_by_link_text('CBA'),message="")
time.sleep(2)

# 擷取體育頁面儲存到相應位置
driver.save_screenshot('demo\\img\\sport.png')

# 退出驅動關閉所有視窗
driver.quit()

執行python指令碼

開啟命令列視窗cmd，切換到demo.py檔案的路徑下，輸入

python demo.py

指令碼執行後會自動填寫我們設定好的使用者名稱密碼並登入，擷取設定好的頁面並儲存到img資料夾

登入框的頁面截圖：

在這裡插入圖片描述

登入後的頁面截圖：

在這裡插入圖片描述

體育頁面截圖：

在這裡插入圖片描述

部分方法介紹：區塊定位截圖（二次截圖）方法：

PIL(Python Image Library)是python的第三方影象處理庫，PIL功能非常強大，API非常簡單易用，已經是Python平臺事實上的影象處理標準庫了。 PIL只支援python2.x的版本，python3.x的版本需要安裝pillow,pillow是一個對PIL友好的分支，但是支援python3.x的版本

python2.x版本下安裝PIL進行二次截圖

pip install PIL

python3.x版本下安裝pillow 進行區塊定位截圖

pip install pillow

demo.py:

# 匯入Image類
from PIL import Image

# 定位需要二次截圖區塊的元素
img = driver.find_element_by_xpath('//*[@class="weui-img"]')
# 區塊元素左上角在網頁中的x座標
left = img.location['x']
# 區塊元素左上角在網頁中的y座標
top = img.location['y']
# 區塊元素右下角在網頁中的x座標
right = img.location['x'] + img.size['width']
# 區塊元素右下角在網頁中的y座標
bottom = img.location['y'] + img.size['height']
# 開啟頁面的截圖
photo = Image.open('demo\\img\\img_page.png')
# 根據區塊元素座標實現二次截圖
photo = photo.crop((left,top,right,bottom))
# 儲存二次截圖
photo.save('demo\\img\\img.png')

WebDriver8種基本元素定位方法：

1. find_element_by_id() 根據id屬性進行定位

例如：find_element_by_id(“one”) 定位id為one的元素

2. find_element_by_name() 根據name屬性進行定位

例如：find_element_by_name(“one”) 定位name屬性為one的元素

3. find_element_by_class_name() 根據class的名字進行定位

例如：find_element_by_class_name(“one”) 定位class為one的元素

4. find_element_by_xpath() xpath是XML路徑語言，通過確定xml文件中的元素位置來完成對元素的定位

例如：find_element_by_xpath("//div[@id=‘one']") 定位id為one的div元素
find_element_by_xpath("//*[@class=‘two']") 定位class為two的元素

5. find_element_by_css_selector() 根據css屬性進行定位

例如：find_element_by_css_selector("#one") 定位id為one的div元素
find_element_by_css_selector(".two") 定位class為two的元素

6. find_element_by_tag_name () 根據標籤名進行定位

例如：find_element_by_tag_name(“input”) 定位input元素

7. find_element_by_link_text() 根據完整a連結文字進行定位find_element_by_partial_link_text() 根據部分a連結文字進行定位

例如：find_element_by_link_text(“新聞”) 定位文字為‘新聞'的a元素
find_element_by_partial_link_text(“聞”) 定位文字包括‘聞'的a元素

8. By定位( 需要匯入By類：from selenium.webdriver.common.by import By )

例如：find_element(By.ID,“one”) 定位id為one的元素
find_element(By.NAME,“one”) 定位name屬性為one的元素
find_element(By.CLASS_NAME,“one”) 定位class為one的元素
find_element(By.TAG_NAME,“div”) 定位div元素

當定位元素為多個時，使用elements複數定位，即把定位方法中的element換成elements，此時獲取到的為相同屬性的一組元素，返回一個list佇列，然後可以再去定位單個元素

例如：find_elements_by_class_name(“one”)[1] 定位class為one的所有元素中第二個元素

selenium的3種等待方法：

在做自動化測試時，有時下一步的操作會依賴上一步的結果或者內容，上一步操作成功完成之後才能進行下一步操作，此時，我們就需要使用等待，來判斷上一步操作是否完成，進而執行下面的操作，例如登入頁面進行登入操作時，需要等待登入頁面載入成功，才能定位到使用者名稱和密碼對應的元素，然後才能填充使用者名稱和密碼，進行登入操作。

1. 強制等待time.sleep(s) 強制等待s秒後再進行下面的操作

缺點：不易把控時間，等待時間固定，如果沒到設定時間，已經可以進行下面的操作，則需要多餘的等待，如果到達設定時間，還沒完成上一步操作，下面的操作還無法正常進行，則會直接報錯

2. 隱式等待implicitly_wait(s) 在s秒內，上一步操作完成，進行下一步操作，否則等待s秒後，然後進行下一步操作

缺點：如果到達設定時間，還沒完成上一步操作，下面的操作還無法正常進行，則會直接報錯

3. 顯式等待（推薦使用）WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)

等待頁面載入完成，找到某個條件發生後再繼續執行後續程式碼，如果超過設定時間檢測不到則丟擲異常

driver：瀏覽器驅動
timeout：最長超時時間，預設以秒為單位
poll_frequency：檢測的間隔步長，預設為0.5s
ignored_exceptions：超時後的丟擲的異常資訊，預設丟擲NoSuchElementExeception異常

與until()結合使用：

WebDriverWait(driver,s).until(method，message="")

在s秒內，每0.5秒檢測一次，如果傳入的方法返回為true，進行下一步操作，如果到達設定時間未檢測到，下面的操作無法正常執行，則會直接報錯

總結

以上所述是小編給大家介紹的Python+Selenium+phantomjs實現網頁模擬登入和截圖功能(windows環境)，希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回覆大家的。在此也非常感謝大家對我們網站的支援！
如果你覺得本文對你有幫助，歡迎轉載，煩請註明出處，謝謝！

Python+Selenium+phantomjs實現網頁模擬登入和截圖功能(windows環境)

Python+Selenium+phantomjs實現網頁模擬登入和截圖功能(windows環境)

使用python實現對元素的長截圖功能

4、python+selenium實現12306模擬登入

python+selenium+PhantomJS抓取網頁動態載入內容

(九)selenium實現12306模擬登入

Python3以GitHub為例來實現模擬登入和爬取的例項講解

Python爬蟲教程：利用Python爬蟲實現CSDN模擬登入

Python模擬登入和登入跳轉的參考示例

基於selenium實現12306模擬登入

c# 使用Selenium模擬登入和操作資料的學習記錄

c# 使用Selenium模擬登入和操作資料的學習記錄【續】

Windows下 Python Selenium PhantomJS 抓取網頁並截圖

Python +Selenium解決圖片驗證碼登入或註冊問題(推薦)

python+selenium 指令碼實現每天自動登記的思路詳解

Python + selenium + crontab實現每日定時自動打卡功能

python+selenium+chromedriver實現爬蟲示例程式碼

Python Selenium截圖功能實現程式碼

Python selenium爬蟲實現定時任務過程解析

Python selenium模組實現定位過程解析

Python+Selenium基礎篇之2-開啟和關閉火狐/IE/谷歌瀏覽器

Python+Selenium+phantomjs實現網頁模擬登入和截圖功能(windows環境)

相關推薦