python爬取”頂點小說網“《純陽劍尊》的示例程式碼

阿新 • • 發佈：2020-10-19

爬取”頂點小說網“《純陽劍尊》

程式碼

import requests
from bs4 import BeautifulSoup
# 反爬
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML,\
  like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}

# 獲得請求
def open_url(url):
  response = requests.get(url,headers=headers)
  response.encoding = response.apparent_encoding
  html = response.text
  return html

# 提取標題
def get_title(url):
  soup = BeautifulSoup(url,'lxml')
  title_tag = soup.find('dd')
  title = '\n' + title_tag.h1.get_text() + '\n'
  return title

# 提取文字
def get_texts(url):
  soup2 = BeautifulSoup(url,'lxml')
  text_tags = soup2.find_all('dd',id="contents")
  return text_tags

# 儲存標題
def save_title(filename,title):
  with open(filename,'a+',encoding='utf-8') as file:
    file.write(title)

# 儲存文字
def save_text(filename,text):
  with open(filename,encoding='utf-8') as file:
    file.write(text)

# 主程式函式
def main():
  num = input('《純陽劍尊》你想要下載第幾章？（1-802）')
  num = int(num)
  number = 8184027 + num
  url = 'https://www.23us.so/files/article/html/15/15905/' + str(number) + '.html'
  filename = '純陽劍尊.txt'
  r = open_url(url)
  title = get_title(r)
  tags = get_texts(r)
  save_title(filename,title)
  for text_tag in tags:
    text = text_tag.get_text() + '\n'
    save_text(filename,text)
  print('第{}章已經下載完成！'.format(num))

if __name__ == '__main__':
  main()

爬取結果：

python爬取”頂點小說網“《純陽劍尊》的示例程式碼

以上就是python爬取”頂點小說網“《純陽劍尊》的示例程式碼的詳細內容，更多關於python 爬取頂點小說網的資料請關注我們其它相關文章！

python爬取”頂點小說網“《純陽劍尊》的示例程式碼

爬取”頂點小說網“《純陽劍尊》程式碼 import requests from bs4 import BeautifulSoup # 反爬

用Python爬取某蔬菜網的行情，分析底哪個地區的蔬菜便宜

前言夏季到來，合理飲食很關鍵。夏季的飲食講究清淡，多吃蔬菜有利於養生。那麼哪個地區的蔬菜批發價格要便宜一些呢?讓我們用Python爬取某蔬菜網的行情價格，來分析下，到底哪個地區的蔬菜，要更便宜一些。

python爬取拉勾網職位資訊-python相關職位

import requestsimport mathimport pandas as pdimport timefromlxml import etreeurl = \'https://www.lagou.com/jobs/positionAjax.json?px=default&needAddtionalResult=false\'headers = {\'Accept\': \"app

python爬取千庫網

url:https://i588ku.com/beijing/0-0-default-0-8-0-0-0-0-1/ 有水印但是點進去就沒了這裡先來測試是否有反爬蟲

Python爬取食品商務網蔬菜價格資料，看看蔬菜最近的價格情況

前言蔬菜是指可以做菜、烹飪成為食品的一類植物或菌類，蔬菜是人們日常飲食中必不可少的食物之一。近期，蔬菜價格有所上漲，引起廣泛關注。“雙節”將至，物價走勢如何？9月16日，國家發改委召開9月份例行

python爬取堆糖網每日精選圖片

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

python爬取天天基金網所有基金資料

多執行緒+代理池爬取天天基金網、股票資料(無需使用爬蟲框架) 簡介提到爬蟲，大部分人都會想到使用Scrapy工具，但是僅僅停留在會使用的階段。為了增加對爬蟲機制的理解，我們可以手動實現多執行緒的爬蟲過

Python爬取堆糖網優美古風頭像（附原始碼）

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

手把手教你用用Python爬取上道網的贊助公司名稱

一、前言上道網是一個手遊發行推薦與投融資交易平臺。平臺聚集手遊CP、手遊發行、手遊渠道、手遊外包，投資商以及IP授權

Python爬取獵聘網的資料進行分析

前言：一、選題的背景　　　近年來，越來越多的年輕人在尋找工作這個方面呢的事情上會出現各種問題，而好的工作非常難找，差的工作很多年輕人也不想做，所以我選擇做一份資料分析一下招聘網站上各個工作的情況。

用python爬取jk小姐姐照片慢慢看「本地直接下載版」

我這裡簡單把下載寫了下，直接執行程式碼就能下載，預設主下載目錄是D:\\bcy,一個使用者圖片一個資料夾，也可以自己修改檔案主資料夾，沒有資料夾會自動建立

python來爬取煎蛋網隨手拍小姐姐圖片

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

用 Python 爬取網易嚴選妹子內衣資訊，探究妹紙們的偏好

今天繼續來分析爬蟲資料分析文章，一起來看看網易嚴選商品評論的獲取和分析。

Python爬蟲 scrapy框架爬取某招聘網存入mongodb解析

建立專案 scrapy startproject zhaoping 建立爬蟲 cd zhaoping scrapy genspider hr zhaopingwang.com 目錄結構

Python爬蟲爬取煎蛋網圖片程式碼例項

這篇文章主要介紹了Python爬蟲爬取煎蛋網圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python爬蟲爬取筆趣網小說網站過程圖解

首先：文章用到的解析庫介紹 BeautifulSoup： Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。

python爬取高匿代理IP（再也不用擔心會進小黑屋了）

為什麼要用代理IP 很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去學習更加高深的知識。那麼針對這三類人，我給大家提供

Python爬蟲例項——scrapy框架爬取拉勾網招聘資訊

本文例項為爬取拉勾網上的python相關的職位資訊,這些資訊在職位詳情頁上,如職位名,薪資,公司名等等.

Python 爬取網易雲歌手的50首熱門作品

使用requests爬取網易雲音樂 Python程式碼： import json import os import time from bs4 import BeautifulSoup

04爬取拉勾網Python崗位分析報告

# 匯入需要的包import requestsimport time,randomfrom openpyxl import Workbookimport pymysql.cursors#@ 連線資料庫；# 這個是我本地上邊執行的程式，用來獲取代理伺服器。def get_proxy():try:PROXY_POOL_URL =

python爬取”頂點小說網“《純陽劍尊》的示例程式碼

相關推薦