Python學習筆記，爬取筆趣閣小說

阿新 • • 發佈：2021-07-20

程式碼來源：Python爬取筆趣閣小說，有趣又實用

學習了基礎的語法，然後網上看到有人分享利用python爬取小說，自己拷貝了程式碼嘗試了一下。

1. 環境準備安裝BeautifulSoup4 和lxml

& C:/Python39/python.exe -m pip install --user BeautifulSoup4
& C:/Python39/python.exe -m pip install --user lxml

2. 重新命名了下載後的檔名便於排序也防止有非法的字元出現無法建立檔案，加了1秒的間隔

import os
import requests
import 
 time
from bs4 import BeautifulSoup 

# 宣告請求頭
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36'
}

# 建立儲存小說文字的資料夾
if not os.path.exists('./小說'):
    os.mkdir('./小說/')

path = 'http://www.biquw.com/book/416/'
# 訪問網站並獲取頁面資料
response = requests.get(path)
response.encoding  
= response.apparent_encoding
# print(response.text)


'''
根據上圖所示，資料是儲存在a標籤當中的。a的父標籤為li，li的父標籤為ul標籤，ul標籤之上為div標籤。
所以如果想要獲取整個頁面的小說章節資料，那麼需要先獲取div標籤。並且div標籤中包含了class屬性，
我們可以通過class屬性獲取指定的div標籤，詳情看程式碼~
'''
# lxml: html解析庫 將html程式碼轉成python物件，python可以對html程式碼進行控制
soup = BeautifulSoup(response.text, 'lxml' 
)
book_list = soup.find('div', class_='book_list').find_all('a')
# soup物件獲取批量資料後返回的是一個列表，我們可以對列表進行迭代提取
count = 1;
for book in book_list:
    book_name = book.text
    # 獲取到列表資料之後，需要獲取文章詳情頁的連結，連結在a標籤的href屬性中
    book_url = book['href']


    book_info_html = requests.get(path + book_url, headers=headers)
    book_info_html.encoding = book_info_html.apparent_encoding
    soup_part = BeautifulSoup(book_info_html.text, 'lxml') 

    info = soup_part.find('div', id='htmlContent')
    name = str(count)
    # print(info.text)
    with open('./小說/' + name.zfill(4) + '.txt', 'a', encoding='utf-8') as f:
      f.write(info.text)
    print('{} 下載完成！'.format(book_name))
    count += 1
    time.sleep(1)

Python學習筆記，爬取筆趣閣小說

程式碼來源：Python爬取筆趣閣小說，有趣又實用學習了基礎的語法，然後網上看到有人分享利用python爬取小說，自己拷貝了程式碼嘗試了一下。

python爬蟲爬取筆趣網小說網站過程圖解

首先：文章用到的解析庫介紹 BeautifulSoup： Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。

Python爬蟲實戰，爬取A股公司資料，簡單分析A股公司並生成詞雲

前言利用Python爬取並簡單分析A股公司資料。讓我們愉塊地開始吧~ 開發工具 Python版本：3.6.4

用python爬取新筆趣閣的所有小說，使用xpath提取

執行後會在執行的目錄下面建立一個建立一個筆趣閣的目錄，小說會一每個目錄分類，每部小說的章節都會在對應的小說目錄裡面

【爬蟲】對新筆趣閣小說進行爬取，儲存和下載

以前挺愛在筆趣閣看小說的（老白嫖怪了）現在學了一點爬蟲技術，就自然而然的想到了爬取筆趣閣的小說也算鍛鍊一下自己的技術，就以新筆趣閣開始

Python爬取新筆趣閣小說

Python爬取小說，並儲存到TXT檔案中我寫的這篇文章，是利用Python爬取小說編寫的程式，這是我學習Python爬蟲當中自己獨立寫的第一個程式，中途也遇到了一些困難，但是最後迎刃而解了。這個程式非常的簡單，程式的大

Python爬蟲入門實戰專案--爬取新筆趣閣小說

1、網頁檢視進入到全部小說，這就是我們要爬取的小說，這些夠看很長時間了

Python爬蟲實戰，openpyxl模組學習，爬取房價資訊並簡單的資料分析

前言利用Python爬取房價資訊並進行簡單的資料分析 Ok，讓我們開始吧~~~ 開發工具

python爬蟲學習01--電子書爬取

python爬蟲學習01--電子書爬取 1.獲取網頁資訊 import requests#匯入requests庫 \'\'\' 獲取網頁資訊

Python爬蟲入門練手案例，爬取某乎問答數（附原始碼）

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

爬取新筆趣閣小說！適合新手入門的小案例！

爬取筆趣閣小說（搜尋+爬取）首先看看最終效果（gif）：實現步驟：1.探查網站“http://www.xbiquge.la/”，看看網站的實現原理。

Python爬蟲實戰：自動化登入網站，爬取商品資料

前言隨著網際網路時代的到來，人們更加傾向於網際網路購物。某東又是電商行業的巨頭，在某東平臺中有很多商家資料。今天帶大家使用python+selenium工具獲取這些公開的商家資料

10行Python程式碼，採集筆趣閣小說！

需要的匯入的包： import requests import re 爬取筆趣閣小說：很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如

python爬蟲教程：爬取酷狗音樂，零基礎小白也能爬取哦

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲——帶你爬取古詩名句，考試什麼的不就是輕輕鬆鬆

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python爬蟲：輸入公司名稱，爬取企查查網站中的公司資訊

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

Python學習筆記之型別判斷，異常處理，終止程式操作小結

python學習筆記型別判斷，異常處理，終止程式，例項程式碼： #idle中按F5可以執行程式碼

python學習筆記（4）xlsxwriter模組運用，建立105萬行excel

技術標籤：python import xlsxwriter import random import gc from datetime import datetime C:\\Users\\測試資料_105萬.xlsx"

Python爬蟲實戰，Scrapy實戰，爬取並簡單分析知網中國專利資料

前言今天我們就用scrapy爬一波知網的中國專利資料並做簡單的資料視覺化分析唄。讓我們愉快地開始吧~