第十二章避開採集的陷阱 使用selenium庫處理cookie
阿新 • • 發佈:2018-12-19
#!/usr/bin/env python # _*_ coding:utf-8 _*_ #根據cookie訪問網站 #思路:第一個webdriver獲取網站和cookie,然後第二個web網站載入同一個網站(必須先載入,這樣selenium才知道cookie屬於哪個網站) #刪除所有的cookie,替換成第一個的cookie,當再次載入頁面的額時候應該兩組的cookie時間戳、原始碼、和其他資訊應該完全一致 from selenium import webdriver driver=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs') driver.get("http://pythonscraping.com") driver.implicitly_wait(1) print(driver.get_cookies()) saveCookies=driver.get_cookies() driver2=webdriver.phantomjs(executable_path='D:/pycharm/phantomjs-2.1.1-windows/bin/phantomjs') driver2.get("http://pythonscraping.com") driver2.delete_all_cookies() for cookie in saveCookies: driver2.add_cookie(cookie) driver2.get("http://pythonscraping.com") driver2.implicitly_wait(1) print(driver2.get_cookies())