python爬取小視訊——梨視訊

阿新 • • 發佈：2018-12-13

爬取梨視訊小視訊網址：http://www.pearvideo.com/ 工具：python3，pycharm，火狐瀏覽器（或谷歌瀏覽器）模組：requests，re，os， urllib.request，（如需控制爬取速度，可加入time模組。）

思路：

分析網站
獲取網頁原始碼
獲取視訊ID
拼接URL地址
獲取視訊播放地址
下載視訊

本文以下載科技類視訊為例，所以請求的網址為http://www.pearvideo.com/category_8 如果想下載體育類視訊，則更改請求網址：在這裡插入圖片描述

在這裡插入圖片描述

分析： 首先分析網站，開啟開發者工具（F12）用檢視器選中一個視訊，我們可以發現視訊的ID資訊。紅框內為視訊的id。在這裡插入圖片描述

開啟後，恰好是我們尋找的id。在這裡插入圖片描述

我們檢查網頁原始碼，檢視id，利用正則表示式獲取id。reg='<a href="(.*?)" class="vervideo-lilink actplay">' 在這裡插入圖片描述

獲取id後，我們獲取視訊播放地址。在此使用檢視器，檢視視訊，我們發現了一個視訊地址。複製後，在新的標籤頁中開啟，正是我們想要獲取的視訊。

在這裡插入圖片描述

在這裡插入圖片描述但是我們在網頁原始碼中，並沒有找到這個url地址。在控制檯中能找到，但是網頁原始碼中沒有，這是因為video標籤是通過js載入的。

我們還是獲取播放視訊頁面的網頁原始碼，使用正則表示式reg='ldUrl="",srcUrl="(.*?)"'

，進行匹配，可以在js中匹配到播放地址。我們還需要獲取視訊的標題。在這裡插入圖片描述

正則表示式：reg='<h1 class="video-tt">(.*?)</h1>'

下載視訊：建立資料夾，存取視訊if path not in os.listdir(): os.mkdir(path) 下載urllib.request.urlretrieve

完整程式碼：有註釋

import requests
import re
import os
import urllib.request

#下載視訊
def download():
    #獲取網頁原始碼
    url="http://www.pearvideo.com/category_8"
    #模擬瀏覽器去請求伺服器
    headers={
        'User-Agent':'Mozilla / 5.0(Windows NT 10.0;WOW64;rv:62.0) Gecko / 20100101Firefox / 62.0',
    }
    #狀態碼
    html=requests.get(url,headers=headers)
    #print(html.text)

    #獲取視訊id   .*？匹配所有
    reg='<a href="(.*?)" class="vervideo-lilink actplay">'
    video_id=re.findall(reg,html.text)
    #print(video_id)

    #拼接URL地址
    video_url=[]#接收拼接好的url
    starturl='http://www.pearvideo.com'+''
    for vid in video_id:
        newurl=starturl+'/'+vid
        #print(newurl)
        video_url.append(newurl)



        #獲取視訊播放地址
        for purl in video_url:
            html=requests.get(purl,headers=headers)
            reg='ldUrl="",srcUrl="(.*?)"'
            playurl=re.findall(reg,html.text)
            #print(playurl)
            #獲取視訊標題
            reg='<h1 class="video-tt">(.*?)</h1>'
            video_name=re.findall(reg,html.text)
            #print(video_name[0])

            #下載視訊
            print('正在下載視訊%s'%video_name)

            path='video'
            if path not in os.listdir():
                os.mkdir(path)
            filepath=path+"/%s"%video_name[0]+'.mp4'
            #下載
            urllib.request.urlretrieve(playurl[0],filepath)

download()

執行結果，獲取到視訊. 在這裡插入圖片描述

python爬取小視訊——梨視訊

爬取梨視訊小視訊網址：http://www.pearvideo.com/ 工具：python3，pycharm，火狐瀏覽器（或谷歌瀏覽器）模組：requests，re，os， urllib.request，（如需控制爬取速度，可加入time模組。）思路：

Python-爬取校花網視訊(單執行緒和多執行緒版本)

一、參考文章 python爬蟲爬取校花網視訊，單執行緒爬取爬蟲----爬取校花網視訊，包含多執行緒版本上述兩篇文章都是對校花網視訊的爬取，由於時間相隔很久了，校花網上的一些視訊已經不存在了，因此上

python爬取下載b站視訊

python爬蟲系列：上一篇 python爬取圖蟲網相簿今天突然來了興趣想要爬取下載b站視訊，話不多說，說幹就幹。 Usage 下載倉庫 [email protected]:inspurer/PythonSpider.git 或者直接下載:https://git

Python 爬取愛奇藝視訊二十五萬條資料分析為什麼李誕不值得了？

在《 Python 爬取愛奇藝 52432 條資料分析誰才是《奇葩說》的焦點人物？ )》這篇文章中，我們從愛奇藝爬取了 5 萬多條評論資料，並對一些關鍵資料進行了分析，由此總結出了一些明面上看不到的資料，並將其直觀地展現了出來，資料分析的妙處即在於此。

使用python爬取抖音app視訊

記錄一下如何用python爬取app資料，本文以爬取抖音視訊app為例。程式設計工具：pycharmapp抓包工具：mitmproxyapp自動化工具：appium執行環境：windows10思路：假設已經配置好我們所需要的工具1、使用mitmproxy對手機app抓包獲取我

python爬取抖音APP視訊教程

本文講述爬取抖音APP視訊資料（本文未完，後面還有很多地方優化總結）公眾號回覆：抖音即可獲取原始碼 python爬蟲人工智慧大資料（公眾號） 1、APP抓包教程，需要用到fiddler 2、尋找返回使用者aweme_count和uid資料的介面進入我

利用Python爬取YouTube上的視訊播放地址

開啟www.youtube.com, 隨便選擇一個topic（我這裡選的是lion king），再過濾選擇時長小於4分鐘右鍵檢視原始碼資訊紅色框內的就是視訊的地址，利用正則表示式，很容易的就可

百行程式碼，python爬取小姐姐網100G套圖，別流鼻血，身體重要！

前言最近在做監控相關的配套設施，發現很多指令碼都是基於Python的。很早之前就聽說其大名，人生苦短，我學Python，這並非一句戲言。隨著人工智慧、機器學習、深度學習的崛起，目前市面上大部分的人工智慧的程式碼大多使用Python 來編寫。所以人工智

python爬取無水印抖音小姐姐視訊(2018最新,含Pyqt客戶端)

各位小夥伴，之前一段時間迷上了抖音小姐姐視訊，但是下載的視訊都有水印，於是自己用Python 寫了個爬取小姐姐視訊的工具，大家可以直接拷貝到自己編譯器上執行。此外，我還利用pyqt5寫了個操作介面，這樣可以方便不懂程式碼的人使用。後面程式碼我都會一一貼上來。備註

如何利用Python快速爬取B站全站視訊資訊

B 站我想大家都熟悉吧，其實 B 站的爬蟲網上一搜一大堆。不過紙上得來終覺淺，絕知此事要躬行，我碼故我在。最終爬取到資料總量為 760萬條。準備工作首先開啟 B 站，隨便在首頁找一個視訊點選進去。常規操作，開啟開發者工具。這次是目標是通過爬取 B 站提供的 api 來獲取視訊資

使用python爬蟲,批量爬取抖音app視訊

使用python爬蟲,批量爬取抖音app視訊（requests+Fiddler+appium）抖音很火，樓主使用python隨機爬取抖音視訊，並且無水印下載，人家都說天下沒有爬不到的資料，so，樓主決定試試水，純屬技術愛好，分享給大家。。 1.樓主首先使用Fiddler4來抓取手機抖音

如何用Python快速爬取B站全站視訊資訊

B站我想大家都熟悉吧，其實 B 站的爬蟲網上一搜一大堆。不過紙上得來終覺淺，絕知此事要躬行，我碼故我在。最終爬取到資料總量為 760萬條。準備工作首先開啟 B 站，隨便在首頁找一個視訊點選進去。常規操作，開啟開發者工具。這次是目標是通過爬取 B 站提供的 api 來獲取視訊資訊，不去解析網頁

python爬取視訊段段子視覺化介面

Python的用途大家都知道，主要是用來爬蟲，對於的進行分析處理。我這個呢，主要是給大家分享一個爬取視訊段子視覺化下載的方法。望各位道友能夠喜歡。視覺化主要用到一個Tkinter庫，大家需要去下載安裝，這個庫很好下載的，網上就用，這裡小編就不多說了。爬

Python 3.X爬取抖音所有視訊

今天閒著沒事刷抖音，看到好多好看的小姐姐，突然想到把抖音裡好看好玩的視訊都下載來多方便看省的一會一個廣告，一會一個推送的。我先是用fiddler抓包工具進行了抖音app的抓包， fiddler的使用：https://blog.csdn.net/lyd135

Python爬取愛奇藝VIP視訊

但是這個網站只提供了線上解析視訊的功能，沒有提供下載介面，如果想把視訊下載下來，我們就可以利用網路爬蟲進行抓包，將視訊下載下來。二、實戰升級分析方法相同，我們使用Fiddler進行抓包：我們可以看到，有用的請求並不多，我們逐條分析。我們先看第一個請求返回的資訊。可以看到第一個

用python爬取某視訊網站彈幕

文章以bilibili的《變態王子與不笑貓》（這是一部正常的日漫，請放心觀看）為例，爬取該番劇下所有視訊的彈幕。困難的地方主要在尋找視訊的cid上，確實花了點時間，最好找到了也有點恍然大悟，再就是請求彈幕的連結地址，也需要去所有請求裡找，耐心很重要。最後，採用多執行緒

python 爬取視訊學習

程式碼中使用的BeautifulSoup 的select，也可使用 find和find_all re.findall中req為正則表示式 urllib.request.urlretrieve()#將視訊複製入檔案中 import requests import r

python爬取網站m3u8視訊，將ts解密成mp4，合併成整體視訊

一些網站會提供m3u8視訊地址，以供下載觀看。或者一些網站經過分析後發現是使用m3u8格式進行播放的，這時使用m3u8的地址連結就可以下載到相應的視訊。一、關於m3u8：（https://blog.csdn.net/baidu_34418350/article/details

Python爬蟲---爬取抖音短視訊

[TOC] ##前言最近一直想要寫一個抖音爬蟲來批量下載抖音的短視訊，但是經過幾天的摸索我發現了一個很嚴重的問題......抖音實在是難爬！從一開始的網頁分析中就有著很多的坑，但是這幾天的摸索也不是一無所獲，我鼓搗出來了一個問題版的抖音爬蟲（操作較為複雜），所以我也想通過這篇部落格來記錄下我分析網頁的過程，

Python爬蟲訓練：爬取酷燃網視訊資料

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理專案目標爬取酷燃網視訊資料 https://krcom.cn/ 環境 Python3.6 pycharm 爬蟲程式碼 import pprint

python爬取小視訊——梨視訊

相關推薦