Selenium截圖圖片未載入的問題解決--【懶載入】

阿新 • • 發佈：2020-10-10

需求：

截圖後轉PDF。

問題：

selenium截圖後，圖片未載入

如下圖：

原因：

網站使用了懶載入技術：只有在瀏覽器中縱向滾動條滾動到指定的位置時，頁面的元素才會被動態載入。

什麼是圖片懶載入？

圖片懶載入是一種網頁優化技術。圖片作為一種網路資源，在被請求時也與普通靜態資源一樣，將佔用網路資源，而一次性將整個頁面的所有圖片載入完，將大大增加頁面的首屏載入時間。

為了解決這種問題，通過前後端配合，使圖片僅在瀏覽器當前視窗內出現時才載入該圖片，達到減少首屏圖片請求數的技術就被稱為“圖片懶載入”。

解決：

模擬人滾動滾動條的行為, 實現頁面的載入

模擬人滾動滾動條的程式碼：

        js_height = "return document.body.clientHeight"
        driver.get(link)
        k = 1
        height = driver.execute_script(js_height)
        while True:
            if k * 500 < height:
                js_move = "window.scrollTo(0,{})".format(k * 500)
                print(js_move)
                driver.execute_script(js_move)
                time.sleep(0.2)
                height = driver.execute_script(js_height)
                k += 1
            else:
                break

全部程式碼：

#!/usr/bin/python3
# -*- coding:utf-8 -*-
"""
@author: lms
@file: screenshot.py
@time: 2020/10/10 13:02
@desc: 
"""

import time
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from PIL import Image


def screenshot_and_convert_to_pdf(link):
    path = './'

    # 一定要使用無頭模式，不然截不了全頁面，只能截到你電腦的高度
    chrome_options = Options()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')
    chrome_options.add_argument('--no-sandbox')
    driver = webdriver.Chrome(chrome_options=chrome_options)
    try:
        driver.implicitly_wait(20)
        driver.get(link)

        # 模擬人滾動滾動條,處理圖片懶載入問題
        js_height = "return document.body.clientHeight"
        driver.get(link)
        k = 1
        height = driver.execute_script(js_height)
        while True:
            if k * 500 < height:
                js_move = "window.scrollTo(0,{})".format(k * 500)
                print(js_move)
                driver.execute_script(js_move)
                time.sleep(0.2)
                height = driver.execute_script(js_height)
                k += 1
            else:
                break

        time.sleep(1)
        # 接下來是全屏的關鍵，用js獲取頁面的寬高
        width = driver.execute_script("return document.documentElement.scrollWidth")
        height = driver.execute_script("return document.documentElement.scrollHeight")
        print(width, height)
        # 將瀏覽器的寬高設定成剛剛獲取的寬高
        driver.set_window_size(width, height)
        time.sleep(1)

        png_path = path + '/{}.png'.format('123456')
        # pdf_url = SERVER_URL + '/static/global_tech_map/{}.pdf'.format(.pic_num)
        # 截圖並關掉瀏覽器
        driver.save_screenshot(png_path)
        driver.close()
        # png轉pdf
        image1 = Image.open(png_path)
        im1 = image1.convert('RGB')
        pdf_path = png_path.replace('.png', '.pdf')
        im1.save(pdf_path)

    except Exception as e:
        print(e)


if __name__ == '__main__':
    screenshot_and_convert_to_pdf('https://mp.weixin.qq.com/s/nJRnGpPVeJ1kdMIOwiPNpg')

處理完成後的截圖：

感謝閱讀~

Selenium截圖圖片未載入的問題解決--【懶載入】

需求：截圖後轉PDF。問題： selenium截圖後，圖片未載入如下圖：原因：網站使用了懶載入技術：只有在瀏覽器中縱向滾動條滾動到指定的位置時，頁面的元素才會被動態載入。

Python Selenium截圖功能實現程式碼

目標：執行之後會在D盤生成一個jt+當前時間.png，該圖片為百度首頁截圖一 get_screenshot_as_file

Selenium-截圖

報錯截圖 from selenium import webdriver from time import sleep from selenium.webdriver.common.action_chains import ActionChains

在 macOS 中，如何自動壓縮截圖圖片大小

一、錯誤的誤會我是這樣在 Markdown 中插入截圖圖片的：截圖到剪貼簿後，直接在 Typora 中貼上，iPic 將自動將圖片上傳到阿里雲圖床（物件儲存）。我一直使用 Alfred 的 Clipboard History 功能檢視截圖大小，發現圖

Win10系統內建截圖工具失靈的解決方法

有時候win10系統電腦上沒有登入微信或者QQ，我們就會選擇使用內建的截圖工具來截圖，但有時候難免會遇到截圖工具失靈的問題，這時候該怎麼辦呢?下面小編就跟大家分享Win10系統內建截圖工具失靈的解決方法。

python+selenium截圖

get_screenshot_as_file() save_screenshot() get_screenshot_as_file() 該方式通過driver獲取該方法，將截圖要儲存的路徑寫入，如果圖片格式未新增.png，會返回False

Selenium截圖和錄屏

Selenium網頁截圖的四種方法 1. driver.get_screenshot_as_base64(): 用途：獲取截圖的base64編碼資料，在HTML介面輸出截圖時使用。

win10系統dns錯誤如何解決【系統天地】

最近有位win10系統使用者在使用電腦的過程當中，碰到了dns錯誤的情況，使用者不知道如何解決，為此非常苦惱，那麼win10系統dns錯誤如何解決呢?下面為大家分享win10電腦dns錯誤的解決方法。第一步：使用 ipconfig /fl

[JS]百度地圖大量圖層載入時的懶載入

最近在做一個地圖的視覺化打點，需要載入的圖層太多了全部繪製圖層時，效能變的異常緩慢。所以我用瞭如下方法，來簡單實現了一個圖層懶載入

「新手教程」PHP 簡易的註冊服務的實現及若干問題的解決【包含程式碼】

@目錄模組介紹程式碼說明若干問題的解決php-cgi not found & 502bad gateway502 bad gatewayPHP CORS 跨域請求

canvas中圖片、視訊的載入（截圖、切片）

canvas中圖片、視訊的載入（截圖、切片） 1.圖片的載入必須用load事件載入，確保圖片載入完成了，才能進行新增到canvas中

【JAVA】MyEclipse新建JSP中文亂碼問題的解決！（有截圖）

一、臨時解決方法：問題出到這裡【pageEncoding="ISO-8859-1" 】改成 pageEncoding="UTF-8"，即可解決！

擷取視訊中某一幀的圖片，以及解決視訊截圖空白的問題

接觸到視訊錄製這類的需求，我們通常為了ui展示更加美化，我們會在預覽的時候，展示視訊的某一幀的圖片；

轉：html2canvas截圖另存圖片模糊問題解決辦法

https://segmentfault.com/a/1190000040823707 在使用html2canvas.js發現一個問題，當你截圖區域有背景圖片的情況下：

【經驗】微信小程式 canvas 圖片拉伸對 wx.canvasToTempFilePath 截圖匯出的影響。

前言 canvas如果圖片出現了拉伸，wx.canvasToTempFilePath匯出的圖片會出現不可預測的奇怪不完整情況。所以咱們研究下。

【Puppeteer】解決截圖不精確問題

先推一波，歡迎進來指正，提出更好的改進建議參靠這裡=》最全資料進階

Python+Selenium+phantomjs實現網頁模擬登入和截圖功能(windows環境)

本文全部操作均在windows環境下安裝 Python Python是一種跨平臺的計算機程式設計語言，它可以執行在Windows、Mac和各種Linux/Unix系統上。是一種面向物件的動態型別語言，最初被設計用於編寫自動化指令碼(shell)，隨

Python爬蟲圖片懶載入技術 selenium和PhantomJS解析

一.什麼是圖片懶載入？ - 案例分析：抓取站長素材http://sc.chinaz.com/中的圖片資料

Selenium基於PIL實現拼接滾動截圖

Selenium預設的截圖save_screenshot只支援對當前視窗內容進行截圖，當如果你想要擷取整個網頁，那麼，可以明確的告訴你。

win10系統截圖無法儲存的兩種解決方法

截圖功能的重要性相信大家都知道，操作電腦經常會用到。win10系統自帶有截圖工具，不需要下載其他截圖軟體，有時候使用win10截圖後竟然無法儲存圖片，怎麼回事？這種情況可能是我們系統的元件出現問題，我們不妨試試

Selenium截圖 圖片未載入的問題解決--【懶載入】

需求：

問題：

原因：

解決：

處理完成後的截圖：

相關推薦

Selenium截圖圖片未載入的問題解決--【懶載入】