20行Python程式碼實現爬取起點小說

阿新 • • 發佈：2022-04-12

相信在座各位應該沒有幾個不看小說的吧，嘿嘿~

一般來說咱們書荒的時候怎麼辦？自然是去起某點排行榜先找到小說名字，然後再找度娘一搜，哎，筆趣閣就出來答案了，美滋滋~

但是那多麻煩，咱們直接用python，直接全部下載下來慢慢看不就好了~
小孩子才做選擇，成年人選擇都要…

好了，不囉嗦了，等下大家要罵我了~

準備工作

環境模組

咱們沒裝軟體的裝一下軟體，沒裝模組的裝一下模組，軟體我就不講了。

模組咱們用到的是這兩個模組，需要安裝一下。

requests   # 傳送請求
re     # 正則表示式模組

 # Python學習交流群  815624229 


#  軟體和安裝教程等等各種資料都在這裡了

pip install 模組名安裝即可

目標地址

https://read.qidian.com/chapter/3i-t4PVRihdwe0zGvdPFgA2/djLVNZuVg7eaGfXRMrUjdw2/

大家可以自己換，我這裡以它為例。

爬蟲流程

爬蟲的流程基本都是這幾步，我這裡不詳細講解了，以前的文章有些講過。

1. 傳送請求
2. 獲取資料
3. 解析資料
4. 儲存資料

完整程式碼

import requests     # 傳送請求
import re

# 偽裝
headers = {
     
'cookie': '_yep_uuid=b1421b7f-11da-b15f-a3ad-95316478f93c; e1=%7B%22pid%22%3A%22qd_P_read%22%2C%22eid%22%3A%22%22%2C%22l1%22%3A3%7D; e2=%7B%22pid%22%3A%22qd_P_read%22%2C%22eid%22%3A%22%22%2C%22l1%22%3A3%7D; newstatisticUUID=1648708045_1995757040; _csrfToken=mAWbsvESMNwir4NfKBy5fy8RedwvNBabTq3PLx6r; fu=721555856; _gid=GA1.2.1193345906.1648708045; e1=%7B%22pid%22%3A%22qd_p_qidian%22%2C%22eid%22%3A%22qd_A18%22%2C%22l1%22%3A3%7D; e2=; qdrs=0%7C3%7C0%7C0%7C1; showSectionCommentGuide=1; qdgd=1; rcr=1031788647%2C1031920667; bc=1031920667%2C1031788647; pageOps=1; lrbc=1031788647%7C686160165%7C0%2C1031920667%7C695153167%7C1; _ga_FZMMH98S83=GS1.1.1648708044.1.1.1648708759.0; _ga_PFYW0QLV3P=GS1.1.1648708044.1.1.1648708759.0; _ga=GA1.2.777546916.1648708045 
',
    'referer': 'https://book.qidian.com/',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.84 Safari/537.36',
}
url = 'https://book.大家自己改一下，看了準備工作就知道了.com/info/1031920667/#Catalog'
html_data = requests.get(url=url, headers=headers).text
info_list = re.findall('<h2 class="book_name"><a href="(.*?)" target="_blank" data-eid=".*?" data-cid=".*?" alt=".*?" title=".*?">(.*?)</a></h2>', html_data)
for link, title in info_list:
    link = 'https:' + link
    # print(link, title)
    # 1. 傳送請求
    response = requests.get(url=link, headers=headers)
    # 2. 獲取資料
    link_data = response.text
    # print(html_data)
    # 3. 解析資料
    # 網頁標籤 <p></p> <a></a> <div></div> <img />
    # <div class="read-content j_readContent" id=".*?">(.*?)</div>
    text = re.findall('<div class="read-content j_readContent" id=".*?">(.*?)</div>', link_data, re.S)[0]
    text = text.replace('<p>', '\n')
    text = title + '\n\n' + text
    print(text)
    # 4. 儲存資料
    with open('網戀女友竟是九天神凰.txt', mode='a', encoding='utf-8') as f:
        f.write(text)

兄弟們快去試試吧

20行Python程式碼實現爬取起點小說

相信在座各位應該沒有幾個不看小說的吧，嘿嘿~ 一般來說咱們書荒的時候怎麼辦？自然是去起某點排行榜先找到小說名字，然後再找度娘一搜，哎，筆趣閣就出來答案了，美滋滋~

20行Python程式碼實現視訊字元化功能

我們經常在B站上看到一些字元鬼畜視訊，主要就是將一個視訊轉換成字元的樣子展現出來。看起來是非常高階，但是實際實現起來確是非常簡單，我們只需要接觸opencv模組，就能很快的實現視訊字元化。但是在此之前，我們先

付費？是不可能的！20行Python程式碼實現一款永久免費PDF編輯工具

PDF（Portable Document Format），中文名稱便攜文件格式是我們經常會接觸到的一種檔案格式，文獻、文件...很多都是PDF格式。它以格式穩定的優勢，使得我們在列印、分享、傳輸過程中能夠最優的保持原有色彩和格式。

20行Python程式碼實現一款永久免費PDF編輯工具的實現

python爬蟲實現爬取網頁主頁資訊（html程式碼）

技術標籤：pythonweb python爬蟲實現爬取網頁主頁資訊（html程式碼） 1.爬取網站原始碼

6行Python程式碼實現進度條效果（Progress、tqdm、alive-progress和PySi

在專案開發過程中載入、啟動、下載專案難免會用到進度條，如何使用Python實現進度條呢？

50行Python程式碼實現視訊中物體顏色識別和跟蹤（必須以紅色為例）

目前計算機視覺（CV）與自然語言處理（NLP）及語音識別並列為人工智慧三大熱點方向，而計算機視覺中的物件檢測(objectdetection)應用非常廣泛，比如自動駕駛、視訊監控、工業質檢、醫療診斷等場景。

3行Python程式碼實現影象照片摳圖和換底色的方法

1、專案背景對於不會PS的小夥伴，摳圖是一個難度係數想當高的活兒，某寶照片摳圖和證件照換底色均價都是5元RMB，所以今天要介紹的這款神工具，只要 3 行程式碼 5 秒鐘就可以完成高精度摳圖，甚至都不用會程式碼，點

100行Python程式碼實現每天不同時間段定時給女友發訊息

每天不同時間段通過微信發訊息提醒女友簡介有時候，你很想關心她，但是你太忙了，以至於她一直抱怨，覺得你不夠關心她。你暗自下決心，下次一定要準時發訊息給她，哪怕是幾句話，可是你又忘記了。你覺得自己很委屈

15行Python程式碼實現免費傳送手機簡訊推送訊息功能

實現的功能：通過程式碼定時給手機推送簡訊，簡訊內容可以自定義文字，當然你也可以去別的網站爬取每日心靈雞湯，天氣預報或其它資訊進行推送。關於爬取資料可以參考：Python40行程式碼實現天氣預報和每日雞湯推送

40行Python程式碼實現天氣預報和每日雞湯推送功能

情人節剛過去幾天，但是這和我們程式設計師有什麼關係呢，對我們來說，萬物皆物件。但是啊，小編為了討得仰慕已久的女神的歡心（真香），便用python爬取了愛詞霸網站的每日一句和天氣預報網站的天氣預報，並且每天定

150行Python程式碼實現帶介面的數獨遊戲

今天閒著沒事幹，以前做過html+js版的數獨，這次做個python版本的，介面由pygame完成，數獨生成由遞迴演算法實現，由shuffle保證每次遊戲都是不一樣的情況，have fun；

150行python程式碼實現貪吃蛇遊戲

上篇博文我們實現了兩百行程式碼實現貪吃蛇遊戲，這次我們來實現一個程式碼量更加少，功能卻更加完整的

500行python程式碼實現飛機大戰

本文例項為大家分享了python程式碼實現飛機大戰的具體程式碼，供大家參考，具體內容如下

Python如何實現爬取B站視訊

5月3日晚，央視在《新聞聯播》前播放了B站青年宣言片《後浪》，這是B站首次登陸央視黃金時段，今天在朋友圈陸續看到相關的視訊。最早用B站的同學都知道，B站是和A站以異曲同工的鬼畜視訊及動漫，進入到大眾視野的非主

30行Python程式碼實現高解析度影象導航的方法

在專案開發的過程中，經常會遇到要檢視影象細節的問題，這時候我們通常會，滾動滑輪將影象放大，或者使用電腦內建的放大器功能進行檢視，如下圖所示，是我使用Altium Designer軟體的高清晰影象導航功能檢視PCB細節的

5行Python程式碼實現影象分割的步驟詳解

眾所周知影象是由若干有意義的畫素組成的，影象分割作為計算機視覺的基礎，對具有現有目標和較精確邊界的影象進行分割，實現在影象畫素級別上的分類任務。

10行python程式碼實現微信轟炸，看完你還敢得罪程式設計師嗎？

準備 Python3.7需要安裝python3.7並配置好環境路徑安裝好python後，開啟電腦的CMD終端輸入pip install itchat安裝itchat模組

10行Python程式碼實現Web自動化管控的示例程式碼

本部落格將為各位分享Python Helium庫，其是在 Selenium庫基礎上封裝的更加高階的 Web 自動化工具，它能夠通過網頁端可見的標籤、名稱來和 Web 進行互動，據說比Selenium庫簡單50%，Helium庫主要功能包括：模擬滑鼠點

用幾行python程式碼實現大量文字檔案裡的文字替換

\"\"\" 用python進行大量文字替換。因為工作需要，有時候我們需要替換大量文字檔案裡的特定文字，用python可以幫我們非常簡單快速的處理。

20行Python程式碼實現爬取起點小說

準備工作

完整程式碼

相關推薦