1. 程式人生 > 實用技巧 >20201202-1 【爬蟲】文章下載

20201202-1 【爬蟲】文章下載

1-1
import requests 
#引入requests庫
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md') 
#傳送請求,並把響應結果賦值在變數res上
#requests.get是在呼叫requests庫中的get()方法,它向伺服器傳送了一個請求,
#括號裡的引數是你需要的資料所在的網址,然後伺服器對請求作出了響應。
#我們把這個響應返回的結果賦值在變數res上。
1-2
import requests 
res = requests.get('
https://res.pandateacher.com/2018-12-18-10-43-07.png') print(res.status_code) #列印變數res的響應狀態碼,以檢查請求是否成功 res是一個物件,屬於requests.models.Response類

1-3
import requests
res = requests.get('https://res.pandateacher.com/2018-12-18-10-43-07.png')
#發出請求,並把返回的結果放在變數res中
pic=res.content
#把Reponse物件的內容以二進位制資料的形式返回
photo = open('
ppt.jpg','wb') #新建了一個檔案ppt.jpg,這裡的檔案沒加路徑,它會被儲存在程式執行的當前目錄下。 #圖片內容需要以二進位制wb讀寫。你在學習open()函式時接觸過它。 photo.write(pic) #獲取pic的二進位制內容 photo.close() #關閉檔案
1-4
import requests
#引用requests庫
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md')
#下載《三國演義》第一回,我們得到一個物件,它被命名為res
novel=res.text #把Response物件的內容以字串的形式返回 print(novel[:800])
1-5
import requests
#引用requests庫
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md')
#下載《三國演義》第一回,我們得到一個物件,它被命名為res
novel=res.text
#把Response物件的內容以字串的形式返回
k = open('《三國演義》.txt','a+')
#建立一個名為《三國演義》的txt文件,指標放在檔案末尾,追加內容
k.write(novel)
#寫進檔案中     
k.close()
#關閉文件