1. 程式人生 > >Puppeteer 應用容器化

Puppeteer 應用容器化

Puppeteer 應用容器化

Intro

Puppeteer是谷歌官方出品的一個通過DevTools協議控制headless Chrome的Node庫。可以通過Puppeteer的提供的api直接控制Chrome模擬大部分使用者操作來進行UI Test或者作為爬蟲訪問頁面來收集資料。
更多的介紹,可以參考這裡

專案中使用到了 Puppeteer 來做一些爬蟲專案,最後需要把應用容器化部署在 docker 上,於是就有了這篇文章。

自定義 docker image

谷歌官方還沒有推出一個官方的 docker 映象,但是官方有一個 dockerfile 示例

參見官方文件: https://github.com/GoogleChrome/puppeteer/blob/master/docs/troubleshooting.md#running-puppeteer-in-docker

於是自己在官方的 dockerfile 基礎上加以修改,製作了一個 image,docker hub 映象地址:https://hub.docker.com/r/weihanli/puppeteer/

Dockerfile 內容詳見: https://github.com/WeihanLi/docker-env/blob/master/docker-puppeteer/Dockerfile

怎麼使用

  • 在 docker-compose 中使用

    示例 docker-compose 檔案:

    version: '2'
    services:
      puppeteer-crawler:
        image: weihanli/puppeteer:latest
        container_name:  puppeteer-crawler
        ports:
          - 10240:3000
        volumes:
          - ./src:/app

    我的專案結構是這樣的

    - src (具體的專案程式碼)
    Dockerfile
    docker-compose.yml
  • 基於此映象構建新的映象

    示例 Dockerfile:
    ```
    FROM weihanli/puppeteer:latest

    COPY --chown=pptruser:pptruser ./src .

    EXPOSE 3000
    ``這裡指定了--chown=pptruser:pptruser` 是因為官方建議不用使用 root 使用者,新建了一個 pptruser 的使用者組以及使用者,使用pptruser這個使用者去執行要執行的程式碼,這裡是為了防止出現使用者許可權相關問題。

如果可以使用 docker-compose 的話,建議還是使用 docker-compose

docker 映象啟動之後預設執行的命令是 yarn start,你只需要在 app 目錄下可以執行 npm run start 或者 yarn start 都是可以的,當然你也可以自定義要執行的命令來覆蓋預設的 Command 命令

Reference

End

最後如果你在考慮容器化一個 Puppeteer 應用,希望你可以使用這個映象,如果有什麼問題也歡迎和我聯絡,我會盡我所能去解決問題。