記錄一個不同的流媒體網站實現方法，和用Python爬蟲爬它的坑

阿新 • • 發佈：2020-04-04

今天找到一片電影，想把它下載下來。

先開Networks工具分析一下：

初步分析發現，視訊載入時會拉取TS格式的檔案，推測這是一個m3u8的索引，記錄著幾百段TS檔案，這樣方便快進時載入。

但是實際分析m3u8檔案時，發現這並不是一個有效的索引檔案，應該只是載入一個形式，實際的handler在其他地方：

但這樣分析js太麻煩了。通過幾次嘗試，發現了規律：視訊檔名是由y8TL59oh4680xxx.ts組成的，xxx是序號，這樣就簡單多了！

把之前爬音樂檔案的爬蟲改一改，得到這樣一個程式：

import requests
import os
import re
from tkinter import Tk
from tkinter.simpledialog import askinteger, askfloat, askstring
from tkinter.filedialog import askopenfilename, askopenfilenames, asksaveasfilename, askdirectory
from tkinter.messagebox import showinfo, showwarning, showerror

def downloadSong(SongID, FileName):
    headers = {"user-agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36"}
    r = requests.get("https://www.mmicloud.com/20190406/I1RrJf8s/2000kb/hls/y8TL59oh" + str(SongID) + ".ts",headers=headers);
    #print("State:")
    #print(r)
    filepath=os.path.join(str(SongID) + ".ts")
    with open(filepath,"wb") as file:
        file.write(r.content)
    print(SongID)

for i in range(4680000, 4680900):
    downloadSong(i, str(i))

這個程式迴圈爬取檔名從y8TL59oh4680000.ts到y8TL59oh4680899.ts的900個視訊檔案。

程式中的迴圈最大值之所以定在4680900，是因為我發現影片有860多段，於是就多下載一些，如果下載不了就是下完了，出錯倒也無所謂。

讓他開始執行，看起來工作良好，有在順利的下載檔案：

於是我就放下手頭的事，先休息去了。過了大約半個小時，他已經下載了300多個檔案了：

我就放下心來，這個爬蟲應該是沒什麼問題了，於是我就用VSCode寫了一些程式碼。當我再次看到工作列時，爬蟲已經不見了！

我再次啟動爬蟲，過了一會又會有同樣的問題！難道是變數i溢位了？試著debug一下，把i的範圍縮小試試：

import requests
import os
import re
from tkinter import Tk
from tkinter.simpledialog import askinteger, askfloat, askstring
from tkinter.filedialog import askopenfilename, askopenfilenames, asksaveasfilename, askdirectory
from tkinter.messagebox import showinfo, showwarning, showerror

def downloadSong(SongID, FileName):
    headers = {"user-agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36"}
    r = requests.get("https://www.mmicloud.com/20190406/I1RrJf8s/2000kb/hls/y8TL59oh4680" + str(SongID) + ".ts",headers=headers);
    #print("State:")
    #print(r)
    filepath=os.path.join(str(SongID) + ".ts")
    with open(filepath,"wb") as file:
        file.write(r.content)
    print(SongID)

for i in range(566, 900):
    downloadSong(i, str(i))

經過debug，發現程式應該是沒有問題，只是因為控制檯視窗最小化時，爬蟲會被記憶體回收掉，所以導致了程式退出。

折騰了半天！

我換成用IDLE編輯器自帶的Run Modules，有普通視窗的話就不容易被回收掉把：

過了一陣子，爬蟲終於把檔案爬完了。一看資料夾，又出問題了：

檔名不一致！

還記得之前我們debug的時候把變數i的範圍改小了嗎？這就是原因！

那好吧，選中所有名字長的檔案，右鍵，重新命名，命名成a，然後檔案就可以自動命名為a (1), a (2), a (3), a (4), a (5), ...這樣。

問題。。解決了？

我拿著這些命名為a (1), a (2), a (3), a (4), a (5), ...的檔案去轉碼，合併，來來回回整了一個小時多。當合並之後，才發現，

檔案順序全是亂的！！！

啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊天煞的Windows！！！！！！！！！！

沒辦法，有氣出不來，只好繼續寫程式碼。。。

還好我留了一份沒有重新命名過的資料夾，那就用python寫一個批量重新命名程式吧：

import os
PROJECT_DIR_PATH = os.path.dirname(os.path.abspath(os.path.abspath(__file__)))
DIR_PATH = os.path.join(PROJECT_DIR_PATH, 'data')
files = os.listdir(DIR_PATH)
for filename in files:
    name, suffix = os.path.splitext(filename)
    new_name = os.path.join(DIR_PATH, name[4:7])
    old_name = os.path.join(DIR_PATH, filename)
    os.rename(old_name, new_name)

把檔案目錄改成這樣，就可以使用上面的程式了：

爽爽快快的執行完程式，發現命名是成功了，但字尾名沒有了。。。

失誤失誤！再寫一個補救程式：

import os
PROJECT_DIR_PATH = os.path.dirname(os.path.abspath(os.path.abspath(__file__)))
DIR_PATH = os.path.join(PROJECT_DIR_PATH, 'data')
files = os.listdir(DIR_PATH)
for filename in files:
    name, suffix = os.path.splitext(filename)
    new_name = os.path.join(DIR_PATH, filename + ".ts")
    old_name = os.path.join(DIR_PATH, filename)
    os.rename(old_name, new_name)

心驚膽戰的執行完，目錄終於正常了：

然後又是轉碼、合併，又是一個多小時。最後，總算拿到了勝利的果實：

太難了！

下載這篇電影花費了我一整天的時間。上午和中午找片源，下午寫程式碼+寫爬蟲+爬資源，晚上還得操心重新命名和轉碼的問題，這中間都夠我看6-7片電影了。ε=(´ο｀*)))唉。。。

不多說了，電影只能明天看了。各位，晚安！

記錄一個不同的流媒體網站實現方法，和用Python爬蟲爬它的坑

今天找到一片電影，想把它下載下來。先開Networks工具分析一下：初步分析發現，視訊載入時會拉取TS格式的檔案，推測這是一個m3u8的索引，記錄著幾百段TS檔案，這樣方便快進時載入。但是實際分析m3u8檔案時，發現這並不是一個有效的索引檔案，應該只是載入一個形式，實際的h

Android 下不同格式字型的實現方法

從師兄那裡看到了android 介面不同格式字型的實現方法，記錄下來以便以後檢視。首先在Android Studio中建立assets資料夾，在assets資料夾下建立fonts資料夾，然後將字型檔案.ttf檔案拷貝至fonts資料夾下。在android studio中建立a

利用nginx與nginx-rtmp-module搭建流媒體伺服器實現直播

轉自：https://www.cnblogs.com/suiyuewuxin/p/7256972.html 使用環境是centos 7.0+nginx；可以實現簡單的流媒體服務。先下載nginx-rtmp-module拓展： nginx-rtmp-module的官方github地址：h

一個介面有多個實現類，當呼叫介面中的方法時，如何判定用的是哪個實現類

一、簡單例子： 1. 直接new一個例項，這樣肯定知道用的哪個例項2. 定義介面型別的變數，用某個例項去初始化。。。這樣也是肯定知道用的哪個例項一般我們用第二種方式有一個好處，如果以後要改動，那麼只需要修改其引用的例項,改動較少!舉個例子：A介面，A1，A2，A3實現A

基於EasyNVR攝像機無外掛直播流媒體伺服器實現類似於單點登入功能的免登入直播功能

提出問題 EasyNVR是一套攝像機無外掛直播的流媒體伺服器軟體，他可以接入各種各樣的攝像機，再經過轉化統一輸出無外掛化直播的RTMP、HLS、HTTP-FLV流，同時，EasyNVR為了資料安全，提供了鑑權功能，可以配置成只有登入後才能直播觀看：但這個時候問題又來了，很多企

obs nginx-rtmp-module搭建流媒體伺服器實現直播 ding

歡迎大家來此瀏覽，希望大家一塊在此學習，共同交流進步。接下來我就簡單跟大家介紹一下利用nginx來搭建流媒體伺服器。我選擇的是騰訊雲伺服器 1、下載nginx-rtmp-module：使用命令： git clone https://github.com/

使用ffmpeg迴圈推流(迴圈讀取視訊檔案)推送EasyDSS RTMP流媒體伺服器的方法

需求在做EasyDSS開發時，總是在測試推流效果。有時候，我們想使用OBS進行推流測試，也可以，這很好。以及其他RTMP推流工具。但是，別忘了，還有ffmpeg這個神器。ffmpeg可以獲取各種視訊流，並推送給EasyDSS RTMP流媒體伺

基於Rtmp協議的流媒體直播實現

最近需要實現一個類似於視訊直播這樣的功能，很幸運的是，在網上找到了兩篇博文，寫的不錯，省了很多時間精力，在此感謝博主的分享,原博文的地址在下方。由於博主的文章較長且散，我在此對程式碼進行了整理和打包

無配置WCF客戶端的一個簡單到令人髮指的實現方法

因為專案比較大，介面一大堆，同時也是為了模組間完全解耦（只依賴Common），只能是採用多個WCF服務類庫的方案。這樣帶來的問題就是上帝都不知道在配置檔案中到底需要配置多少個Endpoint！理論上是一個模組一個Endpoint，但問題是沒有人知道今後這個系統會有哪些模組。

記錄一個io流引起的tcp連續傳輸阻塞問題

tcp客戶端通過位元組陣列傳輸一個圖片到服務端，服務端陣列接收並寫到本地檔案；重點是Client繼續傳送資料流到Server端。然後產生了問題：客戶端程式碼： public class Client { public static void main(Str

【Nginx】如何使用Nginx搭建流媒體伺服器實現直播？看完這篇我會了！！

## 寫在前面 > 最近幾年，直播行業比較火，無論是傳統行業的直播，還是購物、遊戲、教育，都在涉及直播。作為在網際網路行業奮鬥了多年的小夥伴，你有沒有想過如果使用Nginx搭建一套直播環境，那我們該如何搭建呢？別急，接下來，我們就一起使用Nginx來搭建一套直播環境。 ## 安裝Nginx **注

navigate是Router類的一個方法，主要用來跳轉路由。

res spa 不變 dex avi cell 方法 plain 當前 navigate是Router類的一個方法，主要用來跳轉路由。 1 2 3 4 5 6 7 8 9 interface NavigationExtras { relativeTo

CSS響應式：根據分辨路加載不同CSS的幾個方法，親測可用

響應 col 但是 max-width width media 總結屏幕 link 有時候你需要把同一個頁面在手機和pc同時打開，其中有一個辦法就是判斷不同分辨路加載不同的css 小編總結了幾種分別加載css的方法： 1.比較復雜的使用js判斷加載不同css （親

SSH開發 | 配合自定義註解和 Stratus攔截器，實現方法級粒度用戶鑒權

struts OS action gin 所有具體實現 getmethod red nal 1.提要　　本文是小小商城-SSH版的細節詳解系列之一，項目 github：https://github.com/xenv/S-mall-ssh 本文代碼大部分在 gith

用django框架開發一個B2C購物網站的基本流程和用到的知識點總結1

value 後端開發 .site elf pan 直接基本 inter mobile 開發流程開發模式采用前後端分離模式，作為後端開發人員我們只關註後端業務邏輯開發：省略項目框架搭建文件的配置部分。。。。一：用戶部分在項目開發中我們要用到用戶模型類User,Dj

案例1：寫一個壓縮字符串的方法，例如aaaabbcxxx，則輸出a4b2c1x3。

取字符串 ++ 單個字符 int return tst ast zip stat public static String zipString(String str){ 　　String result = "";//用於拼接新串的變量　　char last = str.c

發現一個js格式化輸出時間的方法，很好很強大

引用自龍恩0707的部落格 Date.prototype.format = function(fmt) { var o = { "M+" : this.getMonth()+1, //月份 "d+

女朋友發了一個化妝速成的視訊給我！我用Python實現了倒放！嘿嘿

現在的各種動圖層出不窮，深受大家喜歡，今天給大家介紹一個可以把gif動圖倒放的python程式，先來看下效果。女朋友這裡就不貼出來給大家看了，萬一你們都喜歡我女朋友了咋辦！還是得藏好！就給一個成功的例子給大家kanyix &

Netty+Android搭建一個簡易聊天室（實現群聊和私聊）

零，前言 JRBM專案中無論是好友私聊，公開聊天室，還是比賽平臺都需要用到長連線，之前沒有接觸過網路通訊等知識，更別說框架了，因此直接上手netty確實有些困難，在前期主要是在b站上看（https://www.bilibili.com/video/av26415011）這個

如何搭建一個簡單的表白網站（Django，win10，雲伺服器，pycharm）

一、前言這個網站是我為商英176班的shiny寫的，2018年11月我已經深深喜歡上她了，打算在拍畢業照（2018.12.06）前跟她告白。由於專業上的自尊，我想用IT來告白。但是，一開始花了很多時間在python的GU

記錄一個不同的流媒體網站實現方法，和用Python爬蟲爬它的坑

檔案順序全是亂的！！！

相關推薦