2021年最新python梨視訊爬取

阿新 • • 發佈：2021-11-21

話不多說，直接上程式碼，如果爬取程式碼失效了，可以留下言，我看到會改。

import requests
from lxml import etree
from multiprocessing.dummy import Pool
import re

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 SLBrowser/7.0.0.6241 SLBChan/8'
}

url = 'https://www.pearvideo.com/category_5'

page_text = requests.get(url, headers).text
tree = etree.HTML(page_text)
life_list = tree.xpath("//div[@class='vervideo-bd']/a/@href")

pool_len = len(life_list)
urls = []
for life in life_list:
    name_url = "https://www.pearvideo.com/" + life
    name_page_text = requests.get(name_url, headers = headers).text
    tree = etree.HTML(name_page_text)
    name = tree.xpath("//div[@id='poster']/img/@alt")[0]
    
    video_ip = re.findall('^video_(.*)', life)[0]
    detail_url= 'https://www.pearvideo.com/videoStatus.jsp?contId=' + video_ip

    headers = {
        'Referer': 'https://www.pearvideo.com/video_' + life,
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 SLBrowser/7.0.0.6241 SLBChan/8'
    }
    
    detail_page_text = requests.get(detail_url, headers = headers).text
    errorUrl = re.findall('"srcUrl":"(.*)"', detail_page_text)[0]
    reUrl = re.search('https://video.pearvideo.com/mp4/(.*?)/(.*?)/(.*?)-(.*)', errorUrl)
    
    url1 = 'https://video.pearvideo.com/mp4/'
    url2 = reUrl.group(1) + '/'
    url3 = reUrl.group(2) + '/'
    url4 = 'cont-' + video_ip + '-'
    url5 = reUrl.group(4)
    
    srcUrl = url1 + url2 + url3 + url4 + url5
    
    dic = {
        'name': name,
        'url': srcUrl
    }
    urls.append(dic)
        
def get_video_data(dic):
    url = dic['url']
    data = requests.get(url = url, headers = headers).content
    with open(dic['name'] + '.mp4', 'wb') as fp:
        fp.write(data)
        print(dic['name'], '下載成功')
        
pool = Pool(pool_len)
pool.map(get_video_data, urls)
pool.close()
pool.join()

　　

2021年最新python梨視訊爬取

話不多說，直接上程式碼，如果爬取程式碼失效了，可以留下言，我看到會改。

黑馬 python 5.0 完整版無加密百度雲網盤下載 2021年學習Python最新視訊教程

黑馬 python 5.0 完整版無加密2021年學習Python最新視訊教程加VX:1501511040 獲取下載地址。

Python如何實現爬取B站視訊

5月3日晚，央視在《新聞聯播》前播放了B站青年宣言片《後浪》，這是B站首次登陸央視黃金時段，今天在朋友圈陸續看到相關的視訊。最早用B站的同學都知道，B站是和A站以異曲同工的鬼畜視訊及動漫，進入到大眾視野的非主

2021年最新騰訊Java面經，Java菜鳥教程視訊

01 Java技術概覽 02Java開發工具及環境設定 03Java語言中的資料型別與運算子 04程式設計中的流程控制

Python scrapy增量爬取例項及實現過程解析

這篇文章主要介紹了Python scrapy增量爬取例項及實現過程解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python使用beautifulsoup4爬取酷狗音樂程式碼例項

這篇文章主要介紹了python使用beautifulsoup4爬取酷狗音樂程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python實現的爬取豆瓣電影資訊功能案例

本文例項講述了Python實現的爬取豆瓣電影資訊功能。分享給大家供大家參考，具體如下：

python實現的爬取電影下載連結功能示例

本文例項講述了python實現的爬取電影下載連結功能。分享給大家供大家參考，具體如下：

python+selenium定時爬取丁香園的新型冠狀病毒資料並製作出類似的地圖（部署到雲伺服器）

前言硬要說這篇文章怎麼來的，那得先從那幾個吃野味的人開始說起…… 前天睡醒：假期還有幾天；昨天睡醒：假期還有十幾天；今天睡醒：假期還有一個月…… 每天過著幾乎和每個假期一樣的宅男生活，唯一不同的是玩手機

Python基於pandas爬取網頁表格資料

以網頁表格為例：https://www.kuaidaili.com/free/ 該網站資料存在table標籤，直接用requests，需要結合bs4解析正則/xpath/lxml等，沒有幾行程式碼是搞不定的。

Python基於BeautifulSoup爬取京東商品資訊

今天小編利用美麗的湯來為大家演示一下如何實現京東商品資訊的精準匹配~~

Python Scrapy圖片爬取原理及程式碼例項

1.在爬蟲檔案中只需要解析提取出圖片地址，然後將地址提交給管道在管道檔案對圖片進行下載和持久化儲存

Python爬蟲例項——爬取美團美食資料

1.分析美團美食網頁的url引數構成 1）搜尋要點美團美食，地址：北京，搜尋關鍵詞：火鍋

python+selenium+bs4爬取百度文庫內文字 && selenium 元素可以定位到，但是無法點選問題 && pycharm多行縮排、左移

先說一下可能用到的一些python知識一、python中使用的是unicode編碼, 而日常文字使用各類編碼如:gbk utf-8 等等所以使用python進行文字讀寫操作時候經常會出現各種錯誤, 一般都是操作時沒有進行轉碼操作.而轉碼則需

2021年的Python 時間軸和即將推出的功能詳解

我們目前生活在Python 3.8的穩定時代，上週釋出了Python的最新穩定版本3.8.4。 Python 3.9已經處於其開發的beta階段，並且2020年7月3日預釋出了beta版本(3.9.0b4)，第五版beta預定於明天釋出。 3.9的第一個穩定版本預

Python爬蟲之爬取淘女郎照片示例詳解

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

B站分片視訊爬取

先確定視訊的獲取方式,通過瀏覽器抓包可以發現B站視訊是分片獲取的,並且先發起options預請求,在發起get請求獲取視訊資料,視訊和音訊檔案url路徑也有不同,下面定位兩個url連結位置

【Python】 requests 爬取部落格園內容AttributeError: 'NoneType' object has no attribute 'xpath'

本篇文章主要介紹requests獲取網頁內容出現 \'NoneType\' object has no attribute \'xpath\' 異常的解決思路

基於python requests selenium爬取excel vba過程解析

目的：基於辦公與網際網路隔離，自帶的office軟體沒有帶本地幫助工具，因此在寫vba程式時比較不方便(後來發現07有自帶，心中吐血，瞎折騰些什麼）。所以想到通過爬蟲在官方摘錄下來作為參考。

[python][爬蟲]批量爬取【漫畫DB】的漫畫圖片

今天看漫畫的時候感覺用瀏覽器實在不爽，就寫個小程式爬了下來。順便安利一個漫畫軟體MComix，超級好用（Linux限定，Win可以用ComicViewer）