20201202-1 【爬蟲】文章下載
阿新 • • 發佈:2020-12-02
1-1 import requests #引入requests庫 res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md') #傳送請求,並把響應結果賦值在變數res上 #requests.get是在呼叫requests庫中的get()方法,它向伺服器傳送了一個請求,
#括號裡的引數是你需要的資料所在的網址,然後伺服器對請求作出了響應。 #我們把這個響應返回的結果賦值在變數res上。
1-2 import requests res = requests.get('https://res.pandateacher.com/2018-12-18-10-43-07.png') print(res.status_code) #列印變數res的響應狀態碼,以檢查請求是否成功 res是一個物件,屬於requests.models.Response類
1-3 import requests res = requests.get('https://res.pandateacher.com/2018-12-18-10-43-07.png') #發出請求,並把返回的結果放在變數res中 pic=res.content #把Reponse物件的內容以二進位制資料的形式返回 photo = open('ppt.jpg','wb') #新建了一個檔案ppt.jpg,這裡的檔案沒加路徑,它會被儲存在程式執行的當前目錄下。 #圖片內容需要以二進位制wb讀寫。你在學習open()函式時接觸過它。 photo.write(pic) #獲取pic的二進位制內容 photo.close() #關閉檔案
1-4 import requests #引用requests庫 res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md') #下載《三國演義》第一回,我們得到一個物件,它被命名為resnovel=res.text #把Response物件的內容以字串的形式返回 print(novel[:800])
1-5 import requests #引用requests庫 res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md') #下載《三國演義》第一回,我們得到一個物件,它被命名為res novel=res.text #把Response物件的內容以字串的形式返回 k = open('《三國演義》.txt','a+') #建立一個名為《三國演義》的txt文件,指標放在檔案末尾,追加內容 k.write(novel) #寫進檔案中 k.close() #關閉文件