1. 程式人生 > >python爬蟲十三:selenium模擬瀏覽器+chrome+windows

python爬蟲十三:selenium模擬瀏覽器+chrome+windows

最近一直在學習爬蟲,教程都是phantomjs的瀏覽器,聽說效能好,速度快,呵呵,但是phantomjs這個玩意前不久和selenium模組分手了,他們都震驚了,我也跟著震驚一下。。。

不扯淡了,下面是介紹在selenium下的chrome瀏覽器的配置

1.現在大神那裡下載chrome的驅動點選開啟連結


2.下載好後,將驅動複製到python目錄下


3.下載就要下載一個版本對應的瀏覽器


5.ok在網上下載對應的google瀏覽器點選開啟連結,這個網站很棒!!!

6.下載只要在我們的pycharm中執行程式碼就ok了

# -*- coding: utf-8 -*-

from selenium import webdriver

from time import sleep

#掉用第三方包selenium開啟瀏覽器登陸
driver=webdriver.Chrome()#開啟chrome
#driver.implicitly_wait(30)
#driver.maximize_window() #視窗最大化(無關緊要哈)


# 用get開啟百度頁面
driver.get("http://www.baidu.com")
# 查詢頁面的“設定”選項,並進行點選
driver.find_elements_by_link_text('設定')[0].click()



# 開啟設定後找到“搜尋設定”選項,設定為每頁顯示50條
'''
<a class="setpref" href="javascript:;">搜尋設定</a>'''
driver.find_elements_by_link_text('搜尋設定')[0].click()
sleep(2)


'''
<select name="NR" id="nr">
<option value="10" selected="">每頁顯示10條</option>
<option value="20">每頁顯示20條</option>
<option value="50">每頁顯示50條</option>
</select>
'''
m = driver.find_element_by_id('nr')
sleep(2)
m.find_element_by_xpath('//*[@id="nr"]/option[3]').click()
sleep(2)



# 處理彈出的警告頁面
#點選確定警告框
driver.find_element_by_class_name("prefpanelgo").click()
sleep(2)
driver.switch_to_alert().accept()
sleep(2)


# 找到百度的輸入框,並輸入“selenium”
'''
<input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">'''
driver.find_element_by_id('kw').send_keys('selenium')
sleep(2)


# 點選搜尋按鈕
'''
<input type="submit" id="su" value="百度一下" class="bg s_btn">
'''
driver.find_element_by_id('su').click()
sleep(2)
# 在開啟的頁面中找到“Selenium - 開源中國社群”,並開啟這個頁面
driver.find_elements_by_link_text('Selenium_百度百科')[0].click()
流暢的一筆!!