微軟最強 Python 自動化工具開源了!不用寫一行程式碼!
阿新 • • 發佈:2020-12-04
![image](https://upload-images.jianshu.io/upload_images/1466987-ef86c2640ba4508d?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
## 1\. 前言
最近,微軟開源了一款非常強大的 Python 自動化依賴庫:playwright-python
它支援主流的瀏覽器,包含:Chrome、Firefox、Safari、Microsoft Edge 等,同時支援以無頭模式、有頭模式執行
playwright-python 提供了同步、非同步的 API,可以結合 Pytest 測試框架使用,並且支援瀏覽器端的自動化指令碼錄製
專案地址:
https://github.com/microsoft/playwright-python
## 2\. 準備
在實戰之前,我們只需要 2 步
第 1 步,安裝 playwright-python 依賴庫
```
# 安裝依賴庫
pip3 install playwright
```
第 2 步,安裝主流的瀏覽器驅動
這樣,會將 Chromeium、Firefox、Webkit 瀏覽器驅動下載到本地
```
# 安裝瀏覽器驅動
python -m playwright install
```
## 3\. 實戰一下
3-1 錄製指令碼
我們先檢視錄製指令碼的命令說明
![image](https://upload-images.jianshu.io/upload_images/1466987-13a58d132a6737bb?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
其中
* python -m playwright codegen 錄製指令碼
* --help 幫助文件
* -o 生成自動化指令碼的目錄
* --target 指令碼語言,包含 JS 和 Python,分別對應值為:python 和 javascript
* -b 指定瀏覽器驅動
比如:
```
# 我們通過下面命令開啟 Chrome 瀏覽器開始錄製指令碼
# 指定生成語言為:Python(預設Python,可選)
# 儲存的檔名:1.py(可選)
# 瀏覽器驅動:webkit(預設webkit,可選)
# 最後跟著要開啟的目標網站(預設僅僅是開啟瀏覽器,可選)
python -m playwright codegen --target python -o '1.py' -b webkit https://www.baidu.com
```
接著,在瀏覽器模擬搜尋一次的操作,然後關閉瀏覽器
![image](https://upload-images.jianshu.io/upload_images/1466987-92d1969d8a181b9f?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
最後,自動化指令碼會自動生成,儲存到檔案中
```
from playwright import sync_playwright
def run(playwright):
browser = playwright.webkit.launch(headless=False)
context = browser.newContext()
# Open new page
page = context.newPage()
# Go to https://www.baidu.com/
page.goto("https://www.baidu.com/")
# Fill input[name="wd"]
page.fill("input[name=\"wd\"]", "AirPython")
# Press Enter
# with page.expect_navigation(url="https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=AirPython&fenlei=256&rsv_pq=a1739d870005eec3&rsv_t=e640wwS33ra1Koivxvy1WyTxyknRwnllWiw4JBqIYd/KUN/WKpWLtL2b2+0&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=21&rsv_sug1=18&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=6199&rsv_sug4=6199"):
with page.expect_navigation():
page.press("input[name=\"wd\"]", "Enter")
# Close page
page.close()
# ---------------------
context.close()
browser.close()
with sync_playwright() as playwright:
run(playwright)
```
3-2 同步
同步的關鍵字為:sync_playwright
比如,我們依次使用三個瀏覽器核心開啟瀏覽器,然後百度一下,接著對在搜尋介面截圖,最後關閉瀏覽器
```
from time import sleep
from playwright import sync_playwright
# 注意:預設是無頭模式
with sync_playwright() as p:
# 分別對應三個瀏覽器驅動
for browser_type in [p.chromium, p.firefox, p.webkit]:
# 指定為有頭模式,方便檢視
browser = browser_type.launch(headless=False)
page = browser.newPage()
page.goto('http://baidu.com')
# 執行一次搜尋操作
page.fill("input[name=\"wd\"]", "AirPython")
with page.expect_navigation():
page.press("input[name=\"wd\"]", "Enter")
# 等待頁面載入完全
page.waitForSelector("text=百度熱榜")
# 截圖
page.screenshot(path=f'example-{browser_type.name}.png')
# 休眠5s
sleep(5)
# 關閉瀏覽器
browser.close()
```
需要指出的是,playwright-python 內建的 API 基本上囊括常見的自動化操作
3-3 非同步
非同步步的關鍵字為:async_playwright
結合 asyncio,我們同時執行上面的操作
```
import asyncio
from playwright import async_playwright
# 非同步執行
async def main():
async with async_playwright() as p:
for browser_type in [p.chromium, p.firefox, p.webkit]:
# 指定為有頭模式,方便檢視
browser = await browser_type.launch(headless=False)
page = await browser.newPage()
await page.goto('http://baidu.com')
# 執行一次搜尋操作
await page.fill("input[name=\"wd\"]", "AirPython")
await page.press("input[name=\"wd\"]", "Enter")
# 等待頁面載入完全
await page.waitForSelector("text=百度熱榜")
# 截圖
await page.screenshot(path=f'example-{browser_type.name}.png')
await browser.close()
asyncio.get_event_loop().run_until_complete(main())
```
## 4\. 最後
事實上,Playwright 是一個跨語言的自動化框架,支援 Python、Java、JS 等
Playwright 相比傳統的自動化框架 Selenium 來說,在 Context 上下文及 API 使用上,顯得更簡潔且強大,更加詳細的功能可以通過閱讀原文去解鎖
更多 Python 自動化、爬蟲相關的原創技術乾貨,可以關注公眾號 **AirPython** 來解鎖!
**推薦閱讀**
[帶你用 Python 實現自動化群控(入門篇)](http://mp.weixin.qq.com/s?__biz=MzU1OTI0NjI1NQ==&mid=2247486180&idx=1&sn=7a1d282e608ec14c655e8105984639f7&chksm=fc1b7424cb6cfd3207004c88cd8820a2d7f0b1ad31ba24ab7952a2d66810460bfddc6cd4bc18&scene=21#wechat_redirect)
[這些自動化場景,批處理完全可以取代 Python](http://mp.weixin.qq.com/s?__biz=MzU1OTI0NjI1NQ==&mid=2247486072&idx=1&sn=e45a83d7d467d6b3ab8972b43d3c1419&chksm=fc1b74b8cb6cfdae4b385f2a5986fdec56b819e4f1656b4c37f9df1b4bd90c6d3c340e9edf7b&scene=21#wechat_redirect)
[我用幾行 Python 自動化指令碼完美解決掉了小姐姐的微信焦慮感](http://mp.weixin.qq.com/s?__biz=MzU1OTI0NjI1NQ==&mid=2247486280&idx=1&sn=0de84df032b528dc04bc6f6a66204096&chksm=fc1b7588cb6cfc9e6c5f458da302f71dbf6aba5badbd70c8f4b63139fe7221f6ddf914c0ba1a&scene=21#wechat_redirect)