簡單的Python網路爬蟲程式
阿新 • • 發佈:2019-02-08
<span style="font-size:18px;">import urllib import httplib2 import urllib.request import webbrowser url='http://www.163.com' content=urllib.request.urlopen(url).read() open('163.com.html','wb').write(content) webbrowser.open_new_tab('163.com.html') webbrowser.open_new_tab('www.baidu.com')</span>
<span style="font-size:18px;">
</span>
<span style="font-size:18px;">上邊的程式碼用來抓取網易首頁上的內容,並將抓取到的內容儲存在名為163.com.html的html檔案中,然後再使用預設的瀏覽器顯示該html檔案,</span>
<span style="font-size:18px;">最後使用預設的瀏覽器開啟百度網頁。</span>
Python的版本為3.2,Python2中在引用庫時只需使用
而無需新增<span style="font-size:18px;">import urllib import httplib2 import webbrowser</span>
<span style="font-size:18px;">import urllib.request</span>
並且
<span style="font-size:18px;">content=urllib.request.urlopen(url).read()</span>
應寫為
content=urllib.urlopen(url).read()
open('163.com.html','wb').write(content)
應寫為
open('163.com.html','w').write(content)