[Python3網絡爬蟲開發實戰] 1.2.3-ChromeDriver的安裝
前面我們成功安裝好了Selenium庫,但是它是一個自動化測試工具,需要瀏覽器來配合使用,本節中我們就介紹一下Chrome瀏覽器及ChromeDriver驅動的配置。
首先,下載Chrome瀏覽器,方法有很多,在此不再贅述。
隨後安裝ChromeDriver。因為只有安裝ChromeDriver,才能驅動Chrome瀏覽器完成相應的操作。下面我們來介紹下怎樣安裝ChromeDriver。
1. 相關鏈接
- 官方網站:https://sites.google.com/a/chromium.org/chromedriver
- 下載地址:https://chromedriver.storage.googleapis.com/index.html
2. 準備工作
在這之前請確保已經正確安裝好了Chrome瀏覽器並可以正常運行,安裝過程不再贅述。
3. 查看版本
點擊Chrome菜單“幫助”→“關於Google Chrome”,即可查看Chrome的版本號,如圖1-14所示。
圖1-14 Chrome版本號
這裏我的Chrome版本是58.0。
請記住Chrome版本號,因為選擇ChromeDriver版本時需要用到。
4. 下載ChromeDriver
打開ChromeDriver的官方網站,可以看到最新版本為2.31,其支持的Chrome瀏覽器版本為58~60,官網頁面如圖1-15所示。
圖1-15 官網頁面
如果你的Chrome版本號是58~60,那麽可以選擇此版本下載。
如果你的Chrome版本號不在此範圍,可以繼續查看之前的ChromeDriver版本。每個版本都有相應的支持Chrome版本的介紹,請找好自己的Chrome瀏覽器版本對應的ChromeDriver版本再下載,否則可能無法正常工作。
找好對應的版本號後,隨後到ChromeDriver鏡像站下載對應的安裝包即可:https://chromedriver.storage.googleapis.com/index.html。在不同平臺下,可以下載不同的安裝包。
5. 環境變量配置
下載完成後,將ChromeDriver的可執行文件配置到環境變量下。
在Windows下,建議直接將chromedriver.exe文件拖到Python的Scripts目錄下,如圖1-16所示。
圖1-16 Python Scripts目錄
此外,也可以單獨將其所在路徑配置到環境變量,具體的配置方法請參見1.1節。
在Linux和Mac下,需要將可執行文件配置到環境變量或將文件移動到屬於環境變量的目錄裏。
例如,要移動文件到/usr/bin目錄。首先,需要在命令行模式下進入其所在路徑,然後將其移動到/usr/bin:
1 | sudo mv chromedriver /usr/bin |
當然,也可以將ChromeDriver配置到$PATH。首先,可以將可執行文件放到某一目錄,目錄可以任意選擇,例如將當前可執行文件放在/usr/local/chromedriver目錄下,接下來可以修改~/.profile文件,相關命令如下:
1 | export PATH="$PATH:/usr/local/chromedriver" |
保存後執行如下命令:
1 | source ~/.profile |
即可完成環境變量的添加。
6. 驗證安裝
配置完成後,就可以在命令行下直接執行chromedriver
命令了:
1 | chromedriver |
如果輸入控制臺有類似圖1-17所示的輸出,則證明ChromeDriver的環境變量配置好了。
圖1-17 控制臺輸出
隨後再在程序中測試,執行如下Python代碼:
1 2 | from selenium import webdriver browser = webdriver.Chrome() |
運行之後,如果彈出一個空白的Chrome瀏覽器,則證明所有的配置都沒有問題。如果沒有彈出,請檢查之前的每一步配置。
如果彈出後閃退,則可能是ChromeDriver版本和Chrome版本不兼容,請更換ChromeDriver版本。
如果沒有問題,接下來就可以利用Chrome來做網頁抓取了。
[Python3網絡爬蟲開發實戰] 1.2.3-ChromeDriver的安裝