1. 程式人生 > >爬蟲入門簡例

爬蟲入門簡例


根據機械工業出版社出版的《從零開始學Python網路爬蟲》指導,實現其提供的簡例。
修改了一寫小問題,程式碼見GitHub
 
 
1、KuGou.py:爬取酷狗top500,beautifulsoup庫解析
 
2、DouPo.py:使用正則表示式爬取小說,並做一定資料清洗
 
3、DouBanTOP250booksExcel.py:爬取豆瓣top250圖書儲存excel表
 
4、QiDian.py:Xpath爬取小說資訊
 
5、PEXELS.py:爬取圖片並儲存
 
6、API_BaiDuMap.py:呼叫百度api,解析json資料,返回地點經緯度
 
7、QiuShiDiTu.py:呼叫api,爬取糗事百科網使用者地址資訊
 
8、DouBanTOP250booksMySQL.py:爬取豆瓣top250圖書儲存mysql資料庫
 
9、JianShu_MultiProcess.py:多程序爬取簡書儲存mysql
 
10、Ajax_JianShu.py:通過抓包分析出動態載入的簡書頁面,構造爬蟲
 
11、WeiBo.py:使用cookie資訊模擬登陸,爬取微博好友圈
 
12、Selenium_DouBan.py:使用selenium登陸豆瓣
 
13、Selenium_JingDong.py:selenium爬取京東膝上型電腦列表儲存mysql
 

小白,錯誤難免,望指正。