selenium + chromedriver遇到的那些坑
最近在研究爬蟲,自學了一下selenium+Chromedriver進行爬取。在配置環境變數的時候遇到了很多坑,在這裡總結一下經驗和大家分享一下。(windows XP 最高支援的python版本是3.4.4)
在配置環境變數前先確保下面的步驟的成功!
一. 保證python安裝好,並新增到Path中在Window下,驗證方法如下:
- 在Window下:在開始選單中找到執行輸入cmd或直接搜尋cmd點選進入,輸入python,如果出現下圖中的>>>則證明Python安裝成功。
- 在Mac下,找到終端輸入python,如果同樣出現>>>
二. 保證selenium安裝成功
- 在Windows下:在開始選單中找到執行輸入cmd或直接搜尋cmd點選進入(在Mac下:在終端中)輸入python,輸入pip install selenium(Mac下輸入pip3 install selenium)
- 在Windows下:在開始選單中找到執行輸入cmd或直接搜尋cmd點選進入(在Mac下:在終端中)輸入python,輸入python,出現>>>之後輸入
import selenium
如果沒有報錯資訊則證明selenium安裝成功
對應版本資訊,檢視notes.txt,對應版本資訊如第二張圖中紅框所示。
配置環境變數:
一. 在Windows中,右鍵此電腦-屬性-高階系統設定-環境變數系統環境變數-Path-編輯,然後找到谷歌瀏覽器的檔案位置(在桌面快捷方式右鍵-開啟檔案位置),並把下載好的Chromedriver.exe放入路徑下,並複製路徑新增進環境變數中(通過圖中新建新增新的環境變數)。
二. 在Mac中,在終端中輸入命令 sudo mv chromedriver檔案目錄 空格 要移動至的目錄。(路徑要根據你自己的做修改)
驗證環境變數新增是否新增成功
首先重啟cmd或者終端!!,然後在開始選單中找到執行輸入cmd或直接搜尋cmd點選進入(在Mac下:在終端中)輸入chromedriver,如果出現下圖則證明新增環境變數成功:
請保證在此步驟時保證編輯器處於關閉狀態。
新建py檔案輸入下面的程式碼,並執行程式碼如果沒有報錯則證明chromedriver配置成功:
from selenium import webdriver
driver = webdriver.Chromedriver()
driver.get('http:\\www.baidu.com')
如果嘗試過上述方法還會報錯,在這裡給出一個終極辦法:
from selenium import webdriver
driver = webdriver.Chromedriver(executable_path='chromedriver的路徑')
driver.get('http://www.baidu.com')