1. 程式人生 > >簡單的Python網路爬蟲程式

簡單的Python網路爬蟲程式

<span style="font-size:18px;">import urllib
import httplib2
import urllib.request
import webbrowser

url='http://www.163.com'
content=urllib.request.urlopen(url).read()

open('163.com.html','wb').write(content)


webbrowser.open_new_tab('163.com.html')
webbrowser.open_new_tab('www.baidu.com')</span>
<span style="font-size:18px;">
</span>
<span style="font-size:18px;">上邊的程式碼用來抓取網易首頁上的內容,並將抓取到的內容儲存在名為163.com.html的html檔案中,然後再使用預設的瀏覽器顯示該html檔案,</span>
<span style="font-size:18px;">最後使用預設的瀏覽器開啟百度網頁。</span>

Python的版本為3.2,Python2中在引用庫時只需使用

<span style="font-size:18px;">import urllib
import httplib2
import webbrowser</span>
而無需新增
<span style="font-size:18px;">import urllib.request</span>
並且
<span style="font-size:18px;">content=urllib.request.urlopen(url).read()</span>
應寫為
content=urllib.urlopen(url).read()
open('163.com.html','wb').write(content)
應寫為
open('163.com.html','w').write(content)