使用代理訪問百度網站 ProxyHandler python 爬蟲 入門
阿新 • • 發佈:2018-11-08
python 使用代理訪問百度網站 ProxyHandler 爬蟲
''' 使用代理訪問百度網站 -ProxyHandler處理(代理伺服器) -使用代理伺服器,是爬蟲的常用手段 -獲取代理伺服器的地址: -www.xicidaili.com -www.goubanjia.com -代理用來隱藏真實訪問中,代理也不允許頻繁訪問某一固定網站,所以,代理一定要很多很多 -基本使用步驟: 1.設定代理地址 2.建立ProxyHandler 3.建立opener 4.安裝opener ''' from urllib import request,error if __name__ == '__main__': url="http://www.baidu.com" #1.設定代理地址 proxy = {'http':'218.60.8.83:3129'} #2.建立ProxyHandler proxy_handler = request.ProxyHandler(proxy) #3.建立opener/ 負責開啟的 opener = request.build_opener(proxy_handler) #4.安裝opener request.install_opener(opener) #如果訪問url,則使用代理伺服器 try: rsp = request.urlopen(url) html = rsp.read().decode() print(html) except error.URLError as e: print(e) except Exception as e: print(e)