爬取校園新聞列表
阿新 • • 發佈:2017-10-12
list 網頁 for 一個 get orm re.search 來源 desc
- 獲取單條新聞的#標題#鏈接#時間#來源#內容 #點擊次數,並包裝成一個函數。
- 獲取一個新聞列表頁的所有新聞的上述詳情,並包裝成一個函數。
- 獲取所有新聞列表頁的網址,調用上述函數。
- 完成所有校園新聞的爬取工作。
- 完成自己所選其他主題相應數據的爬取工作。
import requests import re from bs4 import BeautifulSoup url=‘http://news.gzcc.cn/html/xiaoyuanxinwen/‘ res=requests.get(url) res.encoding=‘utf-8‘ soup=BeautifulSoup(res.text,‘html.parser
爬取校園新聞列表