關於Puppeteer的那些事兒

阿新 • • 發佈：2020-07-23

原文:https://www.cnblogs.com/zlforever-young/p/11594211.html

最近開始上手一個自動化測試工具Puppeteer，來談一談關於它的一些事兒。

Puppeteer中文文件：https://zhaoqize.github.io/puppeteer-api-zh_CN/#?product=Puppeteer&version=v1.20.0&show=api-class-puppeteer(推薦看完預熱視訊後再讀API)

Puppeteer官方文件：https://github.com/GoogleChrome/puppeteer

預熱視訊：https://www.youtube.com/watch?v=IvaJ5n5xFqU

以及 https://www.youtube.com/watch?v=ARt3zDHSsd4

線上編寫測試網站：https://try-puppeteer.appspot.com/

puppeteer社群：https://slack.com/

√安裝

安裝puppeteer

cnpm i puppeteer

安裝puppeteer-core

cnpm i puppeteer-core

√常用方法或屬性：

1.puppeteer.launch([options])

//Puppeteer 模組提供了一種啟動 Chromium 例項的方法。 下面就是使用 Puppeteer 進行自動化的一個典型示例：
const puppeteer = require('puppeteer');

puppeteer.launch().then(async browser => {
  const page = await browser.newPage();
  await page.goto('https://www.google.com');
  // 其他操作...
  await browser.close();
});

2.Browser

當 Puppeteer 連線到一個 Chromium 例項的時候會通過 puppeteer.launch 或 puppeteer.connect 建立一個 Browser 物件。

//下面是使用 Browser 建立 Page 的例子
const puppeteer = require('puppeteer');

puppeteer.launch().then(async browser => {
  // 儲存節點以便能重新連線到 Chromium
  const browserWSEndpoint = browser.wsEndpoint();
  // 從 Chromium 斷開和 puppeteer 的連線
  browser.disconnect();

  // 使用節點來重新建立連線
  const browser2 = await puppeteer.connect({browserWSEndpoint});
  // 關閉 Chromium
  await browser2.close();
});

//一個斷開連線和重連到 Browser 的例子：
const puppeteer = require('puppeteer');

puppeteer.launch().then(async browser => {
  // 儲存節點以便能重新連線到 Chromium
  const browserWSEndpoint = browser.wsEndpoint();
  // 從 Chromium 斷開和 puppeteer 的連線
  browser.disconnect();

  // 使用節點來重新建立連線
  const browser2 = await puppeteer.connect({browserWSEndpoint});
  // 關閉 Chromium
  await browser2.close();
});

3.Page

Page 提供操作一個 tab 頁或者 extension background page 的方法。一個 Browser 例項可以有多個 Page 例項。

下面的例子建立一個 Page 例項，導航到一個 url ，然後儲存截圖：

const puppeteer = require('puppeteer');

puppeteer.launch().then(async browser => {
  const page = await browser.newPage();
  await page.goto('https://example.com');
  await page.screenshot({path: 'screenshot.png'});
  await browser.close();
});

4.Keyboard

Keyboard 提供一個介面來管理虛擬鍵盤. 高階介面為 keyboard.type, 其接收原始字元, 然後在你的頁面上生成對應的 keydown, keypress/input, 和 keyup 事件.

為了更精細的控制(虛擬鍵盤), 你可以使用 keyboard.down, keyboard.up 和 keyboard.sendCharacter 來手動觸發事件, 就好像這些事件是由真實的鍵盤生成的.

//持續按下 Shift 來選擇一些字串並且刪除的例子:


await page.keyboard.type('Hello World!');
await page.keyboard.press('ArrowLeft');

await page.keyboard.down('Shift');
for (let i = 0; i < ' World'.length; i++)
  await page.keyboard.press('ArrowLeft');
await page.keyboard.up('Shift');

await page.keyboard.press('Backspace');
// 結果字串最終為 'Hello!'

//按下A的例子
await page.keyboard.down('Shift');
await page.keyboard.press('KeyA');
await page.keyboard.up('Shift');

5.Mouse

Mouse 類在相對於視口左上角的主框架 CSS 畫素中執行。

每個 page 物件都有它自己的 Mouse 物件，使用見 page.mouse。

// 使用 ‘page.mouse’ 追蹤 100x100 的矩形。
await page.mouse.move(0, 0);
await page.mouse.down();
await page.mouse.move(0, 100);
await page.mouse.move(100, 100);
await page.mouse.move(100, 0);
await page.mouse.move(0, 0);
await page.mouse.up();

更多方法和屬性請閱讀官網

√實戰01：跳轉指定頁面

原始碼：跳轉到百度首頁

const puppeteer=require('puppeteer');

(async ()=>{

    const browser = await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800}});
    const page=  await browser.newPage();
    await page.goto("https://www.baidu.com");

})();

效果：

√實戰02：輸入文字與元素點選

程式碼：在百度中搜索

const puppeteer=require('puppeteer');

(async ()=>{

    const browser = await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800}});
    const page=  await browser.newPage();
    await page.goto("https://www.baidu.com");  //跳轉頁面
    const input_text= await page.$("#kw");     //獲取百度首頁的搜尋框。page.$()用來查詢元素
    await input_text.type("Hello Word!");      //type()輸入內容
    const btn_click=await page.$("#su");       //獲取百度首頁的搜尋按鈕。
    await btn_click.click();                   //點選搜尋按鈕。

})();

效果：

√實戰03：獲取文字元素值

原始碼：獲取百度詞條的值

const puppeteer=require('puppeteer');

(async ()=>{

    const browser = await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800}});
    const page=  await browser.newPage();
    await page.goto("https://www.baidu.com");  //跳轉頁面
    const input_text= await page.$("#kw");     //獲取百度首頁的搜尋框。page.$()用來查詢元素
    await input_text.type("Hello Word!");      //type()輸入內容
    const btn_click=await page.$("#su");       //獲取百度首頁的搜尋按鈕。
    await btn_click.click();                  //點選搜尋按鈕。

    await page.waitFor('div#content_left > .result-op.c-container.xpath-log',{visible:true});//由於獲取元素是非同步操作，需要等待該元素加載出來

    let resultText= await page.$eval('div#content_left > .result-op.c-container.xpath-log',ele=>{return ele.innerHTML})//獲取元素並返回元素下的innerHTML。 .$eval表示獲取單個元素
    console.log("result is ",resultText);//在控制檯打印出值。

})();

演示：

√實戰04：puppeteer檔案上傳操作

程式碼：在百度首頁上傳圖片

const puppeteer=require('puppeteer');

(async ()=>{
    const browser = await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800}});
    const page = await browser.newPage();
    await page.goto('https://www.baidu.com');

    await page.waitForSelector('span.soutu-btn');  //等待選擇元素出現
    const soutuBtn=await page.$('span.soutu-btn'); //獲取圖片按鈕
    await soutuBtn.click();                        //點選展開圖片按鈕

    await page.waitForSelector('input.upload-pic');   //等待上傳按鈕出現
    const uploadPic=await page.$('input.upload-pic'); //獲取上傳按鈕
    await uploadPic.uploadFile('C:\\Capture.PNG');    //上傳圖片。注意：路徑要用雙斜槓。
})();

演示：

√實戰05：puppeteer處理多個元素

程式碼：列印京東上的手機資訊

const puppeteer = require('puppeteer');

(async()=>{
    const browser=await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800}});
    const page =await browser.newPage();
    await page.goto('https://www.jd.com');

    await page.waitFor("#key");
    const inputText=await page.$("#key");
    await inputText.type("手機");
    await page.keyboard.press('Enter');

    await page.waitForSelector("ul.gl-warp > li");
    const items=await page.$$eval("ul.gl-warp > li",eles=>eles.map(ele=>ele.innerText));
    console.log("手機列表=",items);
})();

演示：

√實戰06：puppeteer切換iframe進行操作

iframe跟page的用法類似。使用前需要切換到iframe裡面並用src定位要操作的iframe。操作可參考：https://github.com/GoogleChrome/puppeteer/blob/v1.20.0/docs/api.md#class-frame

程式碼：自動在阿里雲的註冊iframe裡面填寫註冊資訊

const puppeteer = require('puppeteer');

(async()=>{
    const browser = await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800}});
    const page = await browser.newPage();
    await page.goto("https://account.aliyun.com/register/register.html");

    //切換iframe
    const frame= await page.frames().find(frame=>frame.url().includes("https://passport.aliyun.com"));//切換iframe,並找到對應src的iframe
    await frame.waitFor("input#nick"); //等待輸入框載入完成
    const nick =await frame.$("input#nick");//獲取輸入框
    await nick.type("測試使用者");//輸入資料
    
})();

演示：

√實戰07：puppeteer拖拽操作阿里雲驗證碼

程式碼：自動操作阿里雲驗證滑動模組

const puppeteer = require('puppeteer');

(async()=>{
    const browser = await puppeteer.launch({headless:false,defaultViewport:{width:1000,height:800},ignoreDefaultArgs:["--enable-automation"]});//在有些頁面可能需要將automation提示去掉。使用ignoreDefaultArgs:["--enable-automation"]引數
    const page = await browser.newPage();
    await page.goto("https://account.aliyun.com/register/register.html");

    //切換iframe
    const frame= await page.frames().find(frame=>frame.url().includes("https://passport.aliyun.com"));//切換iframe,並找到對應src的iframe
    await frame.waitForSelector("span#nc_1_n1z");//等待滑動塊載入完成
    const span =await frame.$("span#nc_1_n1z");  //獲取滑動元素
    const spanInfo=await span.boundingBox();     //獲取滑動塊的資訊，包括位置（x,y）以及寬和高
    //console.log(spanInfo);

    await frame.waitForSelector("div#nc_1_n1t"); //等待包裹滑塊的div載入完成
    const outDiv=await frame.$("div#nc_1_n1t");  //獲取包裹滑塊的div
    const outDivInfo=await outDiv.boundingBox(); //獲取包裹滑塊的div的資訊，包括位置（x,y）以及寬和高
    //console.log(outDivInfo);

    await page.mouse.move(spanInfo.x,spanInfo.y);//將滑鼠移動到滑塊位置
    await page.mouse.down();                     //將滑鼠按下（預設是左鍵）
    for(var i=0;i<outDivInfo.width;i++){
        page.mouse.move(spanInfo.x+i,spanInfo.y);//讓滑鼠向左移動outDivInfo的寬度距離
    }
    await page.mouse.up();                       //將滑鼠鬆開
 
})();

演示：

√實戰08：puppeteer自動抓取百度新聞上的語句並自動登入微博賬戶發一條微博

程式碼：這個實戰似乎翻車了，被微博檢測到自動化而被要求輸入驗證碼

const puppeteer = require('puppeteer');
const config=require('./config'); //為了保護我的個人隱私，所以我把賬號和密碼儲存在了config檔案中

(async ()=>{
    // console.log(config.username);
    // console.log(config.password);
    const browser = await puppeteer.launch({
        headless:false,
        defaultViewport:{width:1280,height:800},
        ignoreDefaultArgs:["--enable-automation"],//移除自動化，防止頁面生成驗證碼
        slowMo:200,//輸入延遲時間
        args:['--window-size:1280,800'],//調整視窗大小
        
    });
    const page= await browser.newPage();
    await page.goto('https://news.baidu.com/',{waitUntil:"networkidle2"});//第一個引數是要前往的地址url,第二個引數是保證頁面全部載入

    await page.waitForSelector('#imgTitle>a>strong');
    const newsText=await page.$eval("#imgTitle>a>strong",ele=>ele.innerText);//匹配第一個元素
    // console.log(newsText);

    await page.goto('https://weibo.com',{waitUntil:"networkidle2"});
    await page.waitFor(5*1000);//防止被檢測
    await page.reload();//防止被檢測

    await page.waitForSelector('#loginname');                   //等待賬號輸入框載入完成
    const inputText=await page.$('#loginname');                 //獲取賬號輸入框元素
    await inputText.click();                                    //防止被檢測，具體情況具體分析
    await inputText.type(config.username);

    await page.waitForSelector('input[name="password"]');       //等待密碼輸入框載入完成
    const inputPwd=await page.$('input[name="password"]');      //獲取密碼輸入框
    await inputPwd.click();//防止被檢測，具體情況具體分析
    await inputPwd.type(config.password);


    await page.waitForSelector('a[action-type="btn_submit"]');  //等待確認按鈕載入
    const submit=await page.$('a[action-type="btn_submit"]');   //獲取確認按鈕
    await submit.click();                                       //點選

})();

演示：翻車啦！！！

√實戰09：puppeteer模擬快捷鍵

程式碼演示：https://github.com/GoogleChrome/puppeteer/blob/v1.20.0/docs/api.md#class-keyboard

√實戰10：puppeteer切換瀏覽器tab頁

主要用到api：browser.target();

文件：https://github.com/GoogleChrome/puppeteer/blob/v1.20.0/docs/api.md#class-browser

√實戰11：puppeteer處理彈出的對話方塊

主要用到的api：Dialog處理彈出的內容

文件：https://github.com/GoogleChrome/puppeteer/blob/v1.20.0/docs/api.md#class-dialog

√實戰12：puppeteer執行JavaScript方法

主要用到的方法：page.evaluate(()=>{ 在這裡面可以寫任意JS程式碼 })

文件：https://github.com/GoogleChrome/puppeteer/blob/v1.20.0/docs/api.md#class-page

√實戰13：配置typescript環境，並在其中使用puppeteer

待完善

√實戰14：獲取全屏截圖

原始碼：

const puppeteer =require('puppeteer');//引入puppeteer
(async()=>{//使用自執行函式
    const browser = await puppeteer.launch();//生成browser例項

    const page = await browser.newPage();//生成一個頁面
    await page.goto('https://cn.aliyun.com/');//前往頁面

    console.log(await page.content());//列印頁面資訊（原始碼）
    await page.screenshot({//截圖
    path: 'ali.png',
    fullPage: true
    });

    await browser.close();//關閉browser例項
})();

效果圖：

關於Puppeteer的那些事兒

原文:https://www.cnblogs.com/zlforever-young/p/11594211.html 最近開始上手一個自動化測試工具Puppeteer，來談一談關於它的一些事兒。

資料結構與演演算法之連結串列的那些事兒

前言一名優秀的程式設計師，必然要有紮實的資料結構與演演算法基礎。以下是筆者梳理的資料結構與算法系列，歡迎大家閱讀指正，同時也希望對大家有所幫助。

深入淺出Mysql索引的那些事兒

一.索引的作用一般的應用系統，讀寫比例在10:1左右，而且插入操作和一般的更新操作很少出現效能問題，遇到最多的，也是最容易出問題的，還是一些複雜的查詢操作，所以查詢語句的優化顯然是重中之重。

Spring Cloud（零）：微服務的那些事兒

spring cloud 是微服務分散式部署的一套解決方案。它涵蓋了很多元件，比如配置中心、服務發現註冊、負載均衡、阻斷器、訊息匯流排、資料監控等，這些元件都是為微服務分散式部署中幾乎都會遇到的問題。

淺談React中元件邏輯複用的那些事兒

基本每個開發者都需要考慮邏輯複用的問題，否則你的專案中將充斥著大量的重複程式碼。那麼 React 是怎麼複用元件邏輯的呢？本文將一一介紹 React 複用元件邏輯的幾種方法，希望你讀完之後能夠有所收穫。如果你對這些

關於HTTP請求的那些事兒

關於 HTTP 請求，如果你知道有GET、POST請求，GET是在url 裡用鍵值對傳參，POST 只是換一個請求方法或者有時還可以傳送一些json格式引數的話。如果你還想知道為什麼有時候用 Ajax 請求明明和介面要求的引數一致卻提示

有關 Session 的那些事兒

原文連結： https://blog.by24.cn/archives/about-session.html Web 開發中，Session 是經常用到的概念，但是在日常交流中，似乎又經常引起誤解。

聊聊Django應用的部署和效能的那些事兒

隨著工作的深入，我越來越發現Python Web開發中有很多坑，也一直在羨慕AspNetCore和Go等的可執行檔案部署和高效能，以及Spring生態的豐富，不過因為工作用了Django，生活還是要繼續的嘛，這Django好歹也是有很大份額

關於MongoDB ObjectId的那些事兒

ObjectId 是什麼？一句話，ObjectId 是 MongoDB 文件 _id（主鍵）的預設型別。 ObjectId 的組成？

jQuery的那些事兒

jQuery概述 j-JavaScript+Query就是查詢js的庫，把js中的DOM操作做了封裝，實現快速查詢使用其中的功能。

C#中 Thread，Task，Async/Await，IAsyncResult 的那些事兒！

說起非同步，Thread，Task，async/await，IAsyncResult 這些東西肯定是繞不開的，今天就來依次聊聊他們

goroutine切換背後那些事兒

本文基於於GoLang 1.13。 1. 寫在前面微信公眾號：[double12gzh] 個人主頁: https://gzh.readthedocs.io

Kernel那些事兒之記憶體管理(10) --- 地址空間

前面花了好多時間講了記憶體管理中 node, zone, page frame, buddy system等。這些都是實體地址空間中的概念。然而，對於一個程序來說，它看到的卻是完全不同的地址空間。

SQL Server 計劃快取那些事兒

查詢計劃快取內容 SELECT qs.plan_handle, a.attrlist,* FROMsys.dm_exec_query_stats qs CROSSAPPLY sys.dm_exec_sql_text(qs.sql_handle) est

AOP 與註解的那些事兒~

持續原創輸出,點選上方藍字關注我目錄前言什麼是AOP？AOP的相關概念（面試常客）Spring Boot 如何整合AOP自定義一個註解？使用攔截器如何自定義註解？內部呼叫導致AOP註解失效總結

詳解C#中 Thread，Task，Async/Await，IAsyncResult的那些事兒

說起非同步，Thread，Task，async/await，IAsyncResult 這些東西肯定是繞不開的，今天就來依次聊聊他們

淺談AsyncLocal，我們應該知道的那些事兒

前言最近檢視有關框架原始碼，發現AsyncLocal這玩意水還挺深，於是花了一點功夫去研究，同時對比ThreadLocal說明二者區別以及在何時場景下使用AsyncLocal或ThreadLocal。ThreadLocal相信很多童鞋用過，但AsyncLocal

MySQL的那些事兒（一）常用的SQL語句

SQL語句是對MySQL資料庫最基本的操作手段。整理一下常用的SQL語句（包含一些終端命令）。

技術基礎 | 有關K8ssandra的那些事兒

如果你對K8ssandra還感到比較陌生，這篇FAQ正是為你準備的無論你是在哪兒看到的這篇文章（無論Github還是官方文件），你都可以向我們提出新的問題或對文章中提到的問題做出修正。作為一個開源專案，K8ssandra的使

Erlang那些事兒第1回之我是變數,一次賦值永不改變

　　第1回先從不變的變數說開來，學過其他程式語言的人都知道，變數之所以叫變數，是因為它會經常變，被修改。假設原本X = 10，後來再執行X = 24，那麼X就從10變成了24，這對於程式新手和老鳥來說，都是永恆不變的真

關於Puppeteer的那些事兒

√安裝

√常用方法或屬性：

√實戰01：跳轉指定頁面

√實戰02：輸入文字與元素點選

√實戰03：獲取文字元素值

√實戰04：puppeteer檔案上傳操作

√實戰05：puppeteer處理多個元素

√實戰06：puppeteer切換iframe進行操作

√實戰07：puppeteer拖拽操作阿里雲驗證碼

√實戰08：puppeteer自動抓取百度新聞上的語句並自動登入微博賬戶發一條微博

√實戰09：puppeteer模擬快捷鍵

√實戰10：puppeteer切換瀏覽器tab頁

√實戰11：puppeteer處理彈出的對話方塊

√實戰12：puppeteer執行JavaScript方法

√實戰13：配置typescript環境，並在其中使用puppeteer

√實戰14：獲取全屏截圖

相關推薦