爬蟲實戰-爬取小說資訊

阿新 • • 發佈：2022-11-30

import requests
import parsel
import csv
for i in range(1,5):
    print(f"--------爬取第{i}頁-----------")
    url = f'https://www.slyqw.com/sort/{i}'
    header = {
            'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 107.0.0.0Safari / 537.36',
            'Cookie': 'zh_choose = s;Hm_lvt_c4eec4b108dac241786b4218f0d27642 = 1669790844;Hm_lpvt_c4eec4b108dac241786b4218f0d27642 = 1669791342',
            'Referer': 'https: // www.slyqw.com / whole.html'
            }
        # 通過requests 模擬傳送請求
    r = requests.get(url=url,headers=header)
    response = r.text
        # 引入pansel模組
    response = parsel.Selector(response)
    lis = response.css('.flex li')
    for li in lis:
        leibie = li.css('.img_span span::text').getall() # 小說類別
        title = li.css('.w100 a h2::text').getall()　　# 小說標題
        zuozhe = li.css('.w100 div i::text').getall()　　# 小說作者
        zishu = li.css('.w100 div .orange::text').getall()　　# 小說字數
        shijian = li.css('.w100 div .blue::text').getall()　　# 小說釋出時間
        jieshao = li.css('.w100 p::text').getall()　　# 小說簡介
        with open('小說連載.csv',mode='a',encoding='utf-8-sig',newline='') as f:   # 這裡的newline='' 如果不加，會出現跳行空行 
            writefile = csv.writer(f)
            writefile.writerow([title,zuozhe,zishu,shijian,leibie,jieshao])
    print("完成！")

　　以上資訊是爬取 5 頁小說的資訊。當然爬取資訊之後需要在excel裡面轉換替換一下不要的字元，這裡也可以在程式碼裡面直接寫 .replace()方法替換，我是直接用的excel的 ctrl+H 進行替換的。

爬蟲實戰-爬取小說資訊

import requests import parsel import csv for i in range(1,5): print(f\"--------爬取第{i}頁-----------\")

python爬蟲實戰---爬取大眾點評評論

python爬蟲實戰—爬取大眾點評評論（加密字型） 1.首先開啟一個店鋪找到評論

【爬蟲】爬取淮安資訊職業學校（蘇電院）的新聞網 python

爬取淮安資訊職業技術學院所有的新聞內容；包含所有不同的新聞內容，本指令碼會輸出顯示爬取到的新聞詳細頁URL、檔案下載URL，同時提供了下載檔案的功能，可以自行研究處理檔案下載的！（暫只支援下載爬取到的DOC/xl

Python爬蟲實戰：爬取小姐姐最近的聽歌曲目

前言作為網易雲村的深度使用者，網易雲音樂應該是我除了微信外開啟時間最長的 App 了。並不是應為網易雲上面的歌曲多，而是因為那些走心的評論。邊聽歌邊刷評論，感覺就像是走進了他人的人生之中，從另外一種意義來

Python爬蟲實戰，openpyxl模組學習，爬取房價資訊並簡單的資料分析

前言利用Python爬取房價資訊並進行簡單的資料分析 Ok，讓我們開始吧~~~ 開發工具

Python3爬蟲學習之MySQL資料庫儲存爬取的資訊詳解

本文例項講述了Python3爬蟲學習之MySQL資料庫儲存爬取的資訊。分享給大家供大家參考，具體如下：

Python爬蟲爬取新聞資訊案例詳解

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲：爬取無賬號無限制獲取企查查資訊

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

使用Python爬蟲爬取小紅書完完整整的全過程

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

python爬蟲實現爬取網頁主頁資訊（html程式碼）

技術標籤：pythonweb python爬蟲實現爬取網頁主頁資訊（html程式碼） 1.爬取網站原始碼

初學python爬蟲，爬取“豆瓣電影 Top 250”相關資訊，並下載電影封面

注：所學的視訊教程：B站Python爬蟲基礎5天速成（2021全新合集）Python入門+資料視覺化

Python如何使用BeautifulSoup爬取網頁資訊

這篇文章主要介紹了Python如何使用BeautifulSoup爬取網頁資訊,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python基於requests庫爬取網站資訊

requests庫是一個簡介且簡單的處理HTTP請求的第三方庫 get()是獲取網頁最常用的方式，其基本使用方式如下

Python爬蟲例項——爬取美團美食資料

1.分析美團美食網頁的url引數構成 1）搜尋要點美團美食，地址：北京，搜尋關鍵詞：火鍋

Python爬蟲之爬取淘女郎照片示例詳解

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

[python][爬蟲]批量爬取【漫畫DB】的漫畫圖片

今天看漫畫的時候感覺用瀏覽器實在不爽，就寫個小程式爬了下來。順便安利一個漫畫軟體MComix，超級好用（Linux限定，Win可以用ComicViewer）

python爬蟲實踐爬取今日頭條街拍圖（參考了python3webspider和github上的程式碼）

import requests from urllib.parse import urlencode from requests import codes import os from hashlib import md5

Python爬取網頁資訊的示例

Python爬取網頁資訊的步驟以爬取英文名字網站（https://nameberry.com/）中每個名字的評論內容，包括英文名，使用者名稱，評論的時間和評論的內容為例。

Python爬取股票資訊，並可視化資料的示例

前言截止2019年年底我國股票投資者數量為15975.24萬戶,如此多的股民熱衷於炒股,首先拋開炒股技術不說,那麼多股票資料是不是非常難找,找到之後是不是看著密密麻麻的資料是不是頭都大了?