python 爬蟲電影天堂簡單示例

阿新 • • 發佈：2022-05-19

前言

1. 爬蟲簡介

　　在一些實際專案操作過程中，可能會經常遇到爬蟲的需求，然後將獲得的資料進行處理或寫入資料庫。

　　爬蟲業務中經常設計到幾個開源庫，requests，bs4，pandas，pymysql

　　requests是用來根據url獲取相關的網頁資訊；

　　bs4主要是用來進行網頁的解析；

　　pandas用來處理一些資料；

　　pymysql主要用來操作資料庫，將必要的資料存入到目標資料庫。

2. 爬蟲簡單示例　

　　本次demo主要是以大家常用來下載電影的電影天堂網站來簡單地實操一下爬蟲業務，目的：獲取電影天堂中 2022新片精品中前7頁的電影網址和名稱。

　　2.1 確定相關的url

　　　　我們在點選了更多這個按鈕，並隨便點選了第2頁和第1頁，發現他們的url除了頁碼不一樣，其他部分都是一樣的，如下：

　　　　https://m.dytt8.net/html/gndy/dyzz/list_23_1.html 即.html 前面的數字代表當前的頁數。所以我們每一頁的url可以為

　　　　URL = "https://m.dytt8.net/html/gndy/dyzz/list_23_{}.html" ，然後通過format函式和for迴圈遍歷每一頁。

　　2.2 程式碼編寫　　　

　　import requests
　　from bs4 import BeautifulSoup

　　URL = "https://m.dytt8.net/html/gndy/dyzz/list_23_{}.html"
　　BASE_URL = "https://m.dytt8.net/"


　　def get_movie(url):
    　　response = requests.get(url)
    　　# print(response.headers)
    　　# print(response.content)
    　　text = response.content.decode("gbk")
    　　return text


　　def parser_movie(text):
    　　parser_after = BeautifulSoup(text, "html.parser")
    　　return parser_after


　　def find_movie(target_movie):
    　　movie = target_movie.find("div", class_="co_content8")
    　　back_movie = movie.find_all("a", class_="ulink")
    　　for each in back_movie:
        　　each_movie_url = each.get("href")
        　　each_movie_name = each.text
        　　print(BASE_URL + each_movie_url, each_movie_name)


　　if __name__ == "__main__":
    　　for i in range(1, 8):
        　　movie_final = get_movie(URL.format(i))
        　　parser_final = parser_movie(movie_final)
        　　find_movie_final = find_movie(parser_final)
        　　print("this is white line...........................................")

　　1. get_movie函式主要是用來獲取最原始未經處理的html資料，這裡我們可以通過print(response.content)來獲取header格式，如下圖所示：

　　可以知道，是gpk加解密的格式，那麼我們可以通過 text = response.content.decode("gbk") 來解密原生的html資料，可以避免亂碼的出現。

　　2. 在拿到解密後的html資料後，可以通過bs4中的BeautifulSoup模組來解析html text格式的資料並以html的標準格式存在，即類似於網站頁面，通過

　　開發工具進取的原始div等頁面格式，方便瀏覽資料的層次和格式並獲取需要的資料。

　　3. 拿到類似開發工具頁面的html資料後，就可以通過find或者find_all來獲取某一個層級的內容了。在這裡我們想要獲取每一個電影的url以及名稱，通過

　　對頁面的分析，發現它可以在"div", class_="co_content8" 下面 "a", class_="ulink"找到，通過get函式獲取url，通過text屬性獲取文字。

　 2.3 執行主程式碼，獲取最終結果

　　　執行主程式，獲取最終的結果如下圖所示：

結語

　　　未完待續......

python 爬蟲電影天堂簡單示例

前言 1. 爬蟲簡介　　在一些實際專案操作過程中，可能會經常遇到爬蟲的需求，然後將獲得的資料進行處理或寫入資料庫。

python爬蟲庫scrapy簡單使用例項詳解

最近因為專案需求，需要寫個爬蟲爬取一些題庫。在這之前爬蟲我都是用node或者php寫的。一直聽說python寫爬蟲有一手，便入手了python的爬蟲框架scrapy.

【Python爬蟲】一個簡單的網路爬蟲

網頁結構的相似性爬蟲的目的，是從網站中自動化的批量提取資料。首先嚐試完成以下操作:

Python爬蟲：編寫簡單爬蟲之新手入門

最近整理了一下python的基礎知識，大家一般對“爬蟲”這個詞，一聽就比較熟悉，都知道是爬一些網站上的資料，然後做一些操作整理，得到人們想要的資料，但是怎麼寫一個爬蟲程式程式碼呢？相信很多人是不會的

python爬蟲貓眼電影和電影天堂資料csv和mysql儲存過程解析

字串常用方法 # 去掉左右空格 \'hello world\'.strip()# \'hello world\' # 按指定字元切割

Python爬蟲實現的根據分類爬取豆瓣電影資訊功能示例

本文例項講述了Python爬蟲實現的根據分類爬取豆瓣電影資訊功能。分享給大家供大家參考，具體如下：

Python爬蟲爬取電影票房資料及圖表展示操作示例

本文例項講述了Python爬蟲爬取電影票房資料及圖表展示操作。分享給大家供大家參考，具體如下：

Python Scrapy框架：通用爬蟲之CrawlSpider用法簡單示例

本文例項講述了Python Scrapy框架：通用爬蟲之CrawlSpider用法。分享給大家供大家參考，具體如下：

Python爬蟲實現vip電影下載的示例程式碼

爬蟲目的實現對各大視訊網站vip電影的下載，因為第三方解析網站並沒有提供下載的渠道，因此想要實現電影的下載。

Python爬蟲框架：scrapy爬取迅雷電影天堂最新電影！

專案開始第一步仍然是建立scrapy專案與spider檔案切換到工作目錄兩條命令依次輸入

web爬蟲系列（一）- 爬取電影天堂迅雷地址

一、爬蟲介紹目前爬蟲框架層出不窮，當然很多公司也會根據自己的業務做二次開發，Java的有WebMagic和WebCollector等，Python的有PySpider和Scrapy等。不能說孰好孰壞，只能說根據自己的業務場景選擇不同框架，Pytho

構建爬蟲群很簡單，掌握 python 基礎功就能做到

關鍵詞：爬蟲，程式設計，python，批量檔案操作描述：目前準備爬取一家目標網站的公開資料，預測將累計發起百萬次 api 請求，每個爬蟲指令碼都是單程式、單執行緒。把想要爬取的資料，按關鍵欄位（如id）拆分多段

python之pymysql模組簡單應用示例程式碼

眾所周知，想要在python程式中執行SQL語句需要使用第三方模組：pymysql。下面，我將為大家簡述一下pymysql第三方庫的安裝到使用的大體流程。

redis資料庫及與python互動用法簡單示例

本文例項講述了redis資料庫及與python互動用法。分享給大家供大家參考，具體如下：

Python列表元素常見操作簡單示例

本文例項講述了Python列表元素常見操作。分享給大家供大家參考，具體如下：

python多繼承(鑽石繼承)問題和解決方法簡單示例

本文例項講述了python多繼承(鑽石繼承)問題和解決方法。分享給大家供大家參考，具體如下：

Python 日誌logging模組用法簡單示例

本文例項講述了Python 日誌logging模組用法。分享給大家供大家參考，具體如下：

Python 程序操作之程序間通過佇列共享資料，佇列Queue簡單示例

本文例項講述了Python 程序操作之程序間通過佇列共享資料，佇列Queue。分享給大家供大家參考，具體如下：

python生成器推導式用法簡單示例

本文例項講述了python生成器推導式用法。分享給大家供大家參考，具體如下：

Python 執行緒池用法簡單示例

本文例項講述了Python 執行緒池用法。分享給大家供大家參考，具體如下： # -*- coding:utf-8 -*-

python 爬蟲電影天堂簡單示例

前 言

1. 爬蟲簡介

2. 爬蟲簡單示例

結 語

相關推薦

前言

2. 爬蟲簡單示例　

結語