python爬蟲十三:selenium模擬瀏覽器+chrome+windows
阿新 • • 發佈:2019-01-10
最近一直在學習爬蟲,教程都是phantomjs的瀏覽器,聽說效能好,速度快,呵呵,但是phantomjs這個玩意前不久和selenium模組分手了,他們都震驚了,我也跟著震驚一下。。。
不扯淡了,下面是介紹在selenium下的chrome瀏覽器的配置
1.現在大神那裡下載chrome的驅動點選開啟連結
2.下載好後,將驅動複製到python目錄下
3.下載就要下載一個版本對應的瀏覽器
5.ok在網上下載對應的google瀏覽器點選開啟連結,這個網站很棒!!!
6.下載只要在我們的pycharm中執行程式碼就ok了
流暢的一筆!!# -*- coding: utf-8 -*- from selenium import webdriver from time import sleep #掉用第三方包selenium開啟瀏覽器登陸 driver=webdriver.Chrome()#開啟chrome #driver.implicitly_wait(30) #driver.maximize_window() #視窗最大化(無關緊要哈) # 用get開啟百度頁面 driver.get("http://www.baidu.com") # 查詢頁面的“設定”選項,並進行點選 driver.find_elements_by_link_text('設定')[0].click() # 開啟設定後找到“搜尋設定”選項,設定為每頁顯示50條 ''' <a class="setpref" href="javascript:;">搜尋設定</a>''' driver.find_elements_by_link_text('搜尋設定')[0].click() sleep(2) ''' <select name="NR" id="nr"> <option value="10" selected="">每頁顯示10條</option> <option value="20">每頁顯示20條</option> <option value="50">每頁顯示50條</option> </select> ''' m = driver.find_element_by_id('nr') sleep(2) m.find_element_by_xpath('//*[@id="nr"]/option[3]').click() sleep(2) # 處理彈出的警告頁面 #點選確定警告框 driver.find_element_by_class_name("prefpanelgo").click() sleep(2) driver.switch_to_alert().accept() sleep(2) # 找到百度的輸入框,並輸入“selenium” ''' <input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">''' driver.find_element_by_id('kw').send_keys('selenium') sleep(2) # 點選搜尋按鈕 ''' <input type="submit" id="su" value="百度一下" class="bg s_btn"> ''' driver.find_element_by_id('su').click() sleep(2) # 在開啟的頁面中找到“Selenium - 開源中國社群”,並開啟這個頁面 driver.find_elements_by_link_text('Selenium_百度百科')[0].click()