python+fiddler下載vip視訊 && ts視訊可合併

阿新 • • 發佈：2020-08-02

如果你只想線上看視訊可以去看這篇部落格：python實現通過指定瀏覽器免費觀看vip視訊

先看一下我們程式執行的結果

我們要解析的介面就是（就是這個“介面+視訊地址”可以解析出vip視訊，但是你只能看，不能下載，這裡我們講怎麼去通過python下載它）

self.api = 'http://jx.idc126.net/jx/?url='

1、我們開啟fiddler抓包工具，然後開啟解析視訊頁面，對其進行抓包

2、我們通過分析fiddler抓取的資料包可以找出來一個post請求的資料包，它的響應資料裡面有一個m3u8檔案

3、這個檔案是幹什麼的呢，我們下載下來看看（或者你可以不下載，通過request來得到它）

下面給出一部分

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-MEDIA-SEQUENCE:0
#EXT-X-TARGETDURATION:13
#EXT-X-PLAYLIST-TYPE:VOD
#EXTINF:11.960,
00_m0034ealtm7.321004.1.ts?index=0&start=0&end=11960&brs=0&bre=1346643&ver=4&token=417e80a5285647da52a3ce86f2f3de94
#EXTINF:11.640,
01_m0034ealtm7.321004.1.ts?index=1&start=11960&end=23600&brs=1346644&bre=2687835&ver=4&token=b873fda12617909f994f8047cb8e6153
 
#EXTINF:11.520,
02_m0034ealtm7.321004.1.ts?index=2&start=23600&end=35120&brs=2687836&bre=4974103&ver=4&token=150a9d4990a7730f645144382b2fa55f
#EXTINF:10.240,
03_m0034ealtm7.321004.1.ts?index=3&start=35120&end=45360&brs=4974104&bre=8842955&ver=4&token=9eeb5378d61d9f2b1abbc0e001d4412c
 
#EXTINF:10.040,
04_m0034ealtm7.321004.1.ts?index=4&start=45360&end=55400&brs=8842956&bre=11803391&ver=4&token=47a6828e844862815e2e5ac8420dbe17

4、很懵，不知道這是什麼，那我們先去看看抓取到的視訊資料包，你把它的請求頭在瀏覽器中開啟就會下載一個ts檔案，這是一個視訊檔案

它不全，只是視訊的一部分（幾十秒，或十幾秒）

5、我們可以從上圖中看到這樣的視訊資料包不止一個，那麼這個時候就很難受了，一個視訊十幾秒，難不成一個大視訊我們分成無數的小視訊去看（oh！no！）

這個時候我就在想了，可以可以把多個ts視訊合併成一個，答案是可以（yes！yes！yes！）

既然這樣，我們就可以通過“ab”方式去到所有ts小視訊寫入視訊內容到一個mp4檔案裡面

這樣的話我們就去看看這些ts小視訊的url有沒有什麼規律（正常思維嘛^_^）

https://omts.tc.qq.com/moviets.tc.qq.com/ARF0VZJeyV4IhDCMh--Punp_e4JRrfixSD6F4zRjVKCM/uwMROfz2r5xhIaQXGdGnC2df64gZXNTMZvhtgq7maR8xuHpV/dSIdb30WOoG1mXzTAY4_dppqT81rMbPF0VeWLtyDlV_netQkbPmwLbZo-p30yJ8n3nObUSaqJGp_xD0NfrgEdzFdufZ7QHmSIJYX5qb7rB_gpg8YCNg8--j3ycIpD1aEKGK5kwCq70Ok9SlXSAhZsg/00_m0034ealtm7.321004.1.ts?index=0&start=0&end=11960&brs=0&bre=1346643&ver=4&token=417e80a5285647da52a3ce86f2f3de94 HTTP/1.1

https://omts.tc.qq.com/moviets.tc.qq.com/ARF0VZJeyV4IhDCMh--Punp_e4JRrfixSD6F4zRjVKCM/uwMROfz2r5xhIaQXGdGnC2df64gZXNTMZvhtgq7maR8xuHpV/dSIdb30WOoG1mXzTAY4_dppqT81rMbPF0VeWLtyDlV_netQkbPmwLbZo-p30yJ8n3nObUSaqJGp_xD0NfrgEdzFdufZ7QHmSIJYX5qb7rB_gpg8YCNg8--j3ycIpD1aEKGK5kwCq70Ok9SlXSAhZsg/01_m0034ealtm7.321004.1.ts?index=1&start=11960&end=23600&brs=1346644&bre=2687835&ver=4&token=b873fda12617909f994f8047cb8e6153 HTTP/1.1

https://omts.tc.qq.com/moviets.tc.qq.com/ARF0VZJeyV4IhDCMh--Punp_e4JRrfixSD6F4zRjVKCM/uwMROfz2r5xhIaQXGdGnC2df64gZXNTMZvhtgq7maR8xuHpV/dSIdb30WOoG1mXzTAY4_dppqT81rMbPF0VeWLtyDlV_netQkbPmwLbZo-p30yJ8n3nObUSaqJGp_xD0NfrgEdzFdufZ7QHmSIJYX5qb7rB_gpg8YCNg8--j3ycIpD1aEKGK5kwCq70Ok9SlXSAhZsg/02_m0034ealtm7.321004.1.ts?index=2&start=23600&end=35120&brs=2687836&bre=4974103&ver=4&token=150a9d4990a7730f645144382b2fa55f HTTP/1.1

6、視訊連結很長，這裡怎麼找我就不去說了，直接說結果

上面視訊連結前部分都一樣，後半部分不同，但是後半部分來自於上面的那個m3u8檔案中（找了半天，呼~~~~~）

7、這個時候我們就要去找一下視訊連結前半部分在哪，這裡還是說結果

視訊連結前半部分就是m3u8檔案的前半部分連結（很牛掰！！！）

8、找到現在可以說只要能獲取m3u8檔案和連結，那麼所有問題都無了

那麼我們就去分析一下m3u8這個檔案連結在哪搞出來的

沒錯！就是最開始的post請求的響應文字

那麼我們就去搞這個post請求的請求頭

#post請求的url地址
POST http://jx.idc126.net/jx/api.php#post請求的引數

url=https%3A%2F%2Fv.qq.com%2Fx%2Fcover%2Fmzc00200fdthd81.html&referer=&ref=0&time=1596331710&type=&other=aHR0cHM6Ly92LnFxLmNvbS94L2NvdmVyL216YzAwMjAwZmR0aGQ4MS5odG1s&ios=

分析一下這個url（你可以多找幾個這樣的post請求對比著看）

我們的url引數就是我們要看的vip視訊地址，time的值在“解析介面+vip視訊地址”這個網頁的html中，other的值不變就行

其實也不用問怎麼找出來的，就一直找，，，，沒什麼說的

找完了，在程式中構造一個data的資料，然後一步一步進行就行

post+data----->m3u8連結+檔案--------->搞出視訊連結前半部分+後半部分--------->講多個ts視訊用ab方式寫入一個檔案

程式碼（愛奇藝/騰訊視訊/優酷/芒果/土豆/樂視的播放連結都可以）：

import requests,re,json,sys

class video_downloader():
    def __init__(self, url):
        self.headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
        }
        self.get_name(url)
        # self.server = 'https://omts.tc.qq.com/'
        self.api = 'http://jx.idc126.net/jx/?url='
        self.get_url_api = 'http://jx.idc126.net/jx/api.php'
        self.url = url.split('#')[0]
        self.target = self.api + self.url
        self.s = requests.session()

    """
    函式說明:獲取key、time、url等引數
    Parameters:
        無
    Returns:
        無
    Modify:
        2017-09-18
    """
    def get_name(self,url):
        res = requests.get(url, headers=self.headers)
        res.encoding = res.apparent_encoding
        html = res.text
        pattern1 = '<title>(.*?)</title>'
        self.name = re.search(pattern1, html).group(1)

    def get_key(self):
        req = self.s.get(url=self.target)
        req.encoding = 'utf-8'
        html = req.text
        pattern1 = "url':'(.*?)'"
        self.param_url = re.search(pattern1, html, re.S)
        limit = 0
        if limit == 5:
            sys.exit(0)
        if self.param_url == None:
            self.get_key()
            limit = limit+1
        else:
            self.param_url = self.param_url.group(1)
        pattern2 = "time':'(.*?)'"
        self.param_time = re.search(pattern2, html, re.S)
        if self.param_time == None:
            self.get_key()
            limit = limit+1
        else:
            self.param_time = self.param_time.group(1)

    """
    函式說明:獲取視訊地址
    Parameters:
        無
    Returns:
        video_url - 視訊存放地址
    Modify:
        2017-09-18
    """
    def get_url(self):
        data = {
            'time': self.param_time,
            'other': 'aHR0cHM6Ly92LnFxLmNvbS94L2NvdmVyL216YzAwMjAwZmR0aGQ4MS5odG1s',
            'url': self.param_url,
            'type': '',
            'ref': '0'
        }
        req = self.s.post(url=self.get_url_api,data=data)
        req.encoding = req.apparent_encoding
        #print(req.text)
        self.down_pre_url = json.loads(req.text)['url']
        self.down_pre_url = self.down_pre_url.replace('\\','')
        req = self.s.get(self.down_pre_url)
        html = req.text
        # print(html)
        pattern1 = ',.(.*?)#'
        res = re.finditer(pattern1, html, re.S)
        self.update_url()
        print('視訊{}已開始下載.......'.format(self.name))
        for i in res:
            # print(i.group(1))
            self.get_down_vedio(i.group(1))
            self.down_vedio()
        print('視訊{}下載完成！！！'.format(self.name))

        '''
        pattern1 = ',.(.*?)#'
        url_old = re.search(pattern1, html, re.S).group(1)
        index = url_old.find('start')
        url_new = url_old[0:index + 6] + '1' + url_old[index + 7:len(url_old)]
        print(self.down_pre_url)
        print(url_new)
        return url_new'''

    def get_down_vedio(self,down_suf_url):
        # print(self.down_pre_url[0:aim + 1])
        self.vedio_url = self.down_pre_url+down_suf_url
        # print(self.vedio_url)

    def update_url(self):
        aim = 0
        for i in range(0, len(self.down_pre_url) - 5):
            if self.down_pre_url[i - 1] == '/':
                aim = i - 1
        self.down_pre_url = self.down_pre_url[0:aim + 1]

    def down_vedio(self):
        film = requests.get(self.vedio_url, headers=self.headers).content
        with open(self.name+'.mp4', 'a+b') as f:
            f.write(film)

if __name__ == '__main__':
     url = 'https://v.qq.com/x/cover/mzc00200fdthd81.html'  #vip視訊連結
     vd = video_downloader(url)
     vd.get_key()
     vd.get_url()

# https://v.qq.com/x/cover/mzc00200fdthd81.html  
# http://www.iqiyi.com/w_19rqswhlx9.html?vfm=m_103_txsp

python+fiddler下載vip視訊 && ts視訊可合併

如果你只想線上看視訊可以去看這篇部落格：python實現通過指定瀏覽器免費觀看vip視訊

基於python實現FTP檔案上傳與下載操作（ftp&sftp協議）

前言 FTP(File Transfer Protocol)是檔案傳輸協議的簡稱。用於Internet上的控制檔案的雙向傳輸。同時，它也是一個應用程式（Application）。使用者可以通過它把自己的PC機與世界各地所有執行FTP協議的伺

python kafka 多執行緒消費者&手動提交例項

官方文件：https://kafka-python.readthedocs.io/en/master/apidoc/KafkaConsumer.html import threading

Python&&GDAL實現NDVI的計算方式

很短的幾句程式碼，可是我卻花了很長的時間才寫出來，因為array那裡的除法運算結果老是不對，正常在-1-1之間的。從別的資料摘來處理NDVI計算的array程式碼處，出現了很多問題，可能它用了什麼優化計算的函式，但是結

Python turtle畫相簿&&畫姓名例項

*****看一下我定義的change（）和run（）函式****** 繪圖座標體系：作用：設定主窗體的大小和位置

Python爬蟲實現vip電影下載的示例程式碼

爬蟲目的實現對各大視訊網站vip電影的下載，因為第三方解析網站並沒有提供下載的渠道，因此想要實現電影的下載。

【Python】第4章-17&#160;水仙花數（20 分）

水仙花數是指一個N位正整數（N≥3），它的每個位上的數字的N次冪之和等於它本身。例如：153=1×1×1+5×5×5+3×3×3。

python+selenium+bs4爬取百度文庫內文字 && selenium 元素可以定位到，但是無法點選問題 && pycharm多行縮排、左移

先說一下可能用到的一些python知識一、python中使用的是unicode編碼, 而日常文字使用各類編碼如:gbk utf-8 等等所以使用python進行文字讀寫操作時候經常會出現各種錯誤, 一般都是操作時沒有進行轉碼操作.而轉碼則需

Metal拍攝視訊&Metal處理視訊

使用AVFoundation可以拍攝視訊，Avplayer播放視訊。如果使用Metal取處理視訊的話需要把視訊的每一幀去處理然後顯示，

python的re模組一些方法 && Tkinter圖形介面設計 && 終止python執行函式 && python讀寫檔案 && python一旦給字串賦值就不能單獨改變某個字元，除非重新給變數賦值

Tkinter圖形介面設計見：https://www.cnblogs.com/pywjh/p/9527828.html#radiobutton 終止python執行函式：

python = 賦值順序 && C++ side effect

title: python = 賦值順序 && C++ side effect date: 2020-03-17 15:00:00 categories: [python][c++]

python yield && scrapy yield

title: python yield &&scrapy yield date: 2020-03-17 16:00:00 categories: python tags: 語法 yield 關鍵字用於生成器。 yield在scrapy中的運用。

記資料匯出&&bold物件轉json&&下載判斷資料狀態碼

起因就是要做一個數據匯出的功能，今天提了個bug就是沒有資料的時候後端資料code碼返回的4001，前端沒有判斷直接做了下載處理，結果直接把錯誤資訊下載了下來。

二分查詢訓練(python&&leetCode)

題目一：2020.08.29 [003] 魔術索引 1.題目描述在陣列A[0...n-1]中，有所謂的魔術索引，滿足條件 A[i] = i 。給定一個有序整數陣列，編寫一種方法找出魔術索引，若有的話，在陣列A中找出一個魔術索引，如果沒有，則

如何用python抓取vip加密視訊和1400篇文章的故事

如何用python抓取vip加密視訊和1400篇文章的故事學習pyhton之前，我學的東西比較多，比較雜，有C、C++、JAVA、還有PHP，真正愛上python差不多在三年前，一次用於幫朋友抓取文章和VIP視訊的背後，從此一發不

python 好久不用，基礎重拾系列（1，讀取word（.doc&&.docx）2，批量轉換.doc為.docx字尾 3，相對地址轉絕對地址）

直接給程式碼，因為註釋已經很詳細了。 1 #讀取docx中的文字程式碼示例 2 import docx

Python 簡易下載m3u8 視訊

import requests,re import sys,time import os import numpy as np import glob work_dir = os.getcwd() #print(work_dir)

普通下載 && Vue檔案圖片下載處理

一般的下載,也就a標籤加個連結地址,標籤內加個download屬性.當地址是後端提供時:可通過建立a標籤, 隨即給a便籤附下載連結,檔名和屬性, 最後再建立點選效果,最後清楚生成的a標籤.再則是圖片地址提供:可以通過Base64加

python寫入資料庫時出現UnicodeEncodeError: &#039;latin-1&#039; codec can`t encode characters in...錯誤

用python的requests向資料庫或者wiki等線上辦公網站寫入帶中文的json資料時，出現如題所示錯誤，是因為編碼問題

python 批量下載bilibili視訊的gui程式

執行效果：完整程式碼： # !/usr/bin/python # -*- coding:utf-8 -*- # time: 2019/07/02--08:12 __author__ = \'Henry\'

python+fiddler下載vip視訊 && ts視訊可合併

相關推薦