利用Pycharm+selenium+chromedriver測試瀏覽器

阿新 • • 發佈：2018-12-10

背景

在抓取動態網頁失敗的時候，瞭解到selenium+chromedriver可以比較方便實現動態網頁抓取。利用Python抓取煎蛋網妹子圖。但是程式碼執行出錯。

原始碼（測試程式碼，沒有參考學習價值，僅供測試）

# -*- coding:utf-8 -*-

import urllib.request
import json
import os
import re
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.chrome.options import Options

# 下載page_number頁前的所有圖片
# def
s = r'img src=\"(.+jpg)'
re_hmtl = re.compile(s)

def getPage(url):
    chrome_options = Options()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')
    driver = webdriver.Chrome(chrome_options = chrome_options)
    dirver.get(url)
    return driver.page_source


def save_imgs(folder, page_number):
    if(os.path.exists(folder) == False):
        os.mkdir(folder) # 建立一個名為mm_pic的資料夾
    os.chdir(folder) # 切換到mm_pic資料夾下

    url = 'http://jandan.net/ooxx/' # 網站地址
    url = url + 'page-' + str(page_number) + '#comments'
    html = getPage(url)
    print(html)
    # req = urllib.request.Request(url)
    # req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36')
    # source = urllib.request.urlopen(req)
    #print(source)
    #url_source = source.read().decode('utf-8')
    #print('Status:',source.status,source.reason)
    # url_source = BeautifulSoup(source.read(),'html.parser')
    # print(url_source.contents)

    print('OK')


if __name__ == '__main__':
    save_imgs('mm_pic',55)

報錯如下，作為一個Python小白並不明白錯誤原因是什麼。
在這裡插入圖片描述

解決

參考資料如下：
Chromedriver進行瀏覽器自動化測試
 Chromedriver官方文件參考
截圖如下：
在這裡插入圖片描述

原來要裝載Chromedriver的安裝路徑。

下載chromedriver下載地址
解壓到資料夾
程式碼測試，執行成功。

from selenium import webdriver

driver = webdriver.Chrome(r'D:\Chromedriver\chromedriver.exe')# 將Chromedriver的安裝路徑作為引數
driver.get('https://www.google.com')

print(driver.title)
print(driver.current_url)

測試成功

# -*- coding:utf-8 -*-

import urllib.request
import json
import os
import re
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.chrome.options import Options

# 下載page_number頁前的所有圖片
# def
s = r'img src=\"(.+jpg)'
re_hmtl = re.compile(s)

def getPage(url):
    chrome_options = Options()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')
    driver = webdriver.Chrome(chrome_options = chrome_options,executable_path=r'D:\Chromedriver\chromedriver.exe')
    driver.get(url)
    return driver.page_source


def save_imgs(folder, page_number):
    if(os.path.exists(folder) == False):
        os.mkdir(folder) # 建立一個名為mm_pic的資料夾
    os.chdir(folder) # 切換到mm_pic資料夾下

    url = 'http://jandan.net/ooxx/' # 網站地址
    url = url + 'page-' + str(page_number) + '#comments'
    html = getPage(url)
    print(html)
    # req = urllib.request.Request(url)
    # req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36')
    # source = urllib.request.urlopen(req)
    #print(source)
    #url_source = source.read().decode('utf-8')
    #print('Status:',source.status,source.reason)
    # url_source = BeautifulSoup(source.read(),'html.parser')
    # print(url_source.contents)

    print('OK')


if __name__ == '__main__':
    save_imgs('mm_pic',55)

利用Pycharm+selenium+chromedriver測試瀏覽器

背景在抓取動態網頁失敗的時候，瞭解到selenium+chromedriver可以比較方便實現動態網頁抓取。利用Python抓取煎蛋網妹子圖。但是程式碼執行出錯。原始碼（測試程式碼，沒有參考學習價值，僅供測試） # -*- coding:utf-8 -*- import u

python+selenium自動化測試——瀏覽器驅動

ted body 控制 must settings tao int .html 模式 selenium控制瀏覽器需要下載對應版本的驅動，並把下載好的驅動解壓然後拷貝到python的安裝目錄。 1、chrome 驅動對應版本及下載地址;https://npm.taobao

selenium自動化測試瀏覽器驅動安裝（屬於轉載文章）

edge 轉載 app alt sele blank chrome borde ads 1.下載selenium壓縮包 http://pypi.python.org/pypi/selenium 下載後壓縮在python文件下的lib>site-package文件夾下

selenium自動化測試-瀏覽器基本操作

webdriver 通過協議和介面發現DOM中的元素，並實現控制瀏覽器的行為，例如開啟瀏覽器、控制瀏覽器大小、瀏覽器重新整理及瀏覽器前進、後退等，接下來介紹瀏覽器的一些基本操作。 1.啟動瀏覽器 driver = webdriver.Chrome() 開啟其他瀏覽器，比如Firefox, dri

python3+selenium自動化測試：chromedriver更新不及時會導致無法開啟chrome瀏覽器的問題

2017年7月的時候，我安裝了chrome瀏覽器，當時的chromedirver.exe版本是2.33版本的，今年2018年10月，都過去了一年多了，我的chrome瀏覽器版本已經到了v69，我的筆記本是2011年的筆記本，很老了，很久沒有在上面跑過自動化指令碼，今天在上面運

robotframework+selenium搭配chrome瀏覽器，web測試案例（搭建篇）

web 留言大小寫都沒有小寫 mirrors png path input 這兩天發布版本做的事情有點多，都沒有時間努力學習了，先給自己個差評，今天折騰了一天，把robotframework 和 selenium 還有appnium 都研究了一下，大概有個譜，

selenium自動化測試資源整理（含所有版本chrome、chromedriver、firefox下載鏈接）

網址 www mod org AD down adas mozilla 下載鏈接 1. 所有版本chrome下載是不是很難找到老版本的chrome？博主收集了幾個下載chrome老版本的網站，其中哪個下載的是原版的就不得而知了。 http://www.slimje

利用selenium和Chrome瀏覽器進行自動化網頁搜尋與瀏覽

轉自：https://www.cnblogs.com/liangxuehui/p/5797185.html 功能簡介：利用利用selenium和Chrome瀏覽器，讓其自動開啟百度頁面，並設定為每頁顯示50條，接著在百度的搜尋框中輸入selenium，進行查詢。然後再開啟的頁面中選中“Selenium

四、利用SeimiCrawler爬蟲框架和selenium自動化測試工具分別實現對網站的爬取

一、案例背景這裡為了簡化操作，我們以爬取 http://www.fzdm.com/ 網頁的熱門漫畫為例。二、對比 SeimiCrawler爬蟲框架爬取速度較快，但是不穩定（表現線上程一多，易崩潰）；selenium自動化測試工具爬取速度略慢，但是穩定。三、方式一：S

Selenium + Pycharm 搭建自動化測試環境

今天嘗試搭建了Selenuim + Pycharm的自動化測試環境，過程如下： 1、安裝Python，用的3.5，安裝的過程中記得選中將Python目錄設定到Path中，免得後繼手動新增。 2、安裝Selenium, 因為安裝的Python 3.5 已經自帶了pip，

selenium自動化測試資源整理（含所有版本chrome、chromedriver、firefox下載連結）

今天把手頭有的一些關於selenium測試的資源整理了一下，分享出來。 1. 所有版本chrome下載是不是很難找到老版本的chrome？博主收集了幾個下載chrome老版本的網站，其中哪個下載的是原版的就不得而知了。 2. 所有版本firefox下載火狐相

python+selenium自動化測試之路Day4之pycharm的使用詳解

前言在寫指令碼之前，先要找個順手的寫指令碼工具。python是一門解釋性程式語言，所以一般把寫python的工具叫直譯器。寫python指令碼的工具很多，小編這裡就不一一列舉的，只要自己用著順手就可以的，如果你還沒有選好直譯器，小編這裡推薦pychar

Eclipse 執行 Selenium WebDriver 測試指令碼無法啟動瀏覽器

// Selenium Client: selenium-java-2.34.0 // 系統版本：Windows 7 64-bit 在 Eclipse Java EE 上執行一個使用 IEDriver 驅動 IE 瀏覽器的 Web 測試指令碼時，出現如下錯誤： java.

java，利用Selenium調用瀏覽器，動態模擬瀏覽器事件，動態獲取頁面信息

cti 模擬中間 bar 新建 getopt 復制鼠標 mis 1、環境搭建 jdk1.6版本：selenium 2.4版本。 jdk1.8版本：selenium3.14版本。（1）selenium的jar包下載：地址：http://selenium-rel

🔥《手把手教你》系列基礎篇之3-python+ selenium自動化測試-驅動瀏覽器和元素定位大法（詳細）

1. 簡介上一篇中，只是簡單地一帶而過的說了一些驅動瀏覽器，這一篇繼續說說驅動瀏覽器，然後再說一說元素定位的方法。完成環境的安裝並測試之後，我們對Selenium有了一定的瞭解了，接下來我們繼續驅動瀏覽器做一些基本操作：視窗尺寸設定、網頁截圖、重新整理、前進和後退 2. 視窗尺寸設定在測試過程中，我們

用Selenium自動化測試時，讓ChromeDriver中不顯示“正受到自動測試軟體控制”

背景：在用Selenium做自動化測試的時候，預設ChromeDriver是會提示“Chrom正受到自動測試軟體控制”的。如下圖這樣。但我們有些場景下，不希望這個提示出現。本文探索了幾種語言去掉這個提示條的方法，希望對小夥伴有幫助。 1. Java ChromeOptions

利用gulp解決微信瀏覽器緩存問題

緩存 js文件資源瀏覽器中清除 cat alt style ima 做了好多項目，這次終於要解決微信瀏覽器緩存這個令人頭疼的問題了。每次上傳新的文件，在微信瀏覽器中訪問時，總要先清除微信的緩存，實在麻煩，在網上搜羅了很多解決辦法，終於找到了方法：利用gulp解決緩存問

利用Mocking Framework 單元測試Entity Framework

dom class exp detached 異步 dbr cnblogs kde num 一、前言　　在實際編寫程序時，往往需要與數據庫打交道，在單元測試中直接使用數據庫又顯得太重，如果可以方便的編寫一些測試數據，這樣更易於檢測功能。如何模擬數據庫行為便是本篇的主題。微

python+selenium自動化測試環境安裝

更改可用測試 tun art pyc amber 執行文件的因為自己安裝自動化測試環境時，遇到過許多問題，自己整理了一下安裝的步驟，感謝那些幫助過我的人。 1.安裝python，我裝的是3.5版本，網絡上也有許多安裝步驟，照著就可以了（其實一直下一步也行）不

【Selenium-WebDriver自學】Selenium-IDE測試創建（三）

html 位置當我模塊 mage baidu 用例問題測試 =======================================================================================================

利用Pycharm+selenium+chromedriver測試瀏覽器

背景

解決

相關推薦