用python把B站舞蹈區視訊爬下來，並打包成可以直接執行的exe檔案

阿新 • • 發佈：2021-12-21

一、寫在前面

1、關於音訊視訊合併

因為小破站的音訊和視訊畫面是分開的 (番劇也是一樣的)，正常爬下來是這樣。

額，這麼截圖，小姐姐的臉都變形了…
本來還是挺好看的一姑娘，算了不管她。

所以我們需要額外的去安裝一個軟體FFmpeg用來合成視訊，然後配置環境變數就可以了。

軟體和安裝過程我都放在網盤了，大家任意自取。

網盤連結：FFmpeg安裝包及安裝方法
提取碼：qwer

2、關於打包exe檔案

這是我打包好的樣子

正常打包後是沒有我這個圖示的，圖示在打包的時候可以一起改了。

打包exe請移步：Python實現打包exe可執行程式

二、過程結果

合成過程

合成成功

這個封面著實不給力，大家自己去試的時候，換一個吧…

三、程式碼實現

首先匯入模組

import requests  # 資料請求模組  第三方模組 pip install requests
import re  # 正則表示式 內建模組 不需要安裝
import pprint  # 格式化輸出模組
import json  # 序列化和反序列化
import subprocess
import os

傳送請求以及獲取資料函式

#單引號/雙引號/三引號括起來的內容是字串資料。
#三引號也可以作為註釋，多行程式碼註釋。
def get_response(html_url):
     
"""
    :param html_url:  請求的url地址
    :return: 返回請求伺服器返回的響應資料
    """
    # 在傳送請求之前, 需要進行偽裝 headers 請求頭
    # user-agent 瀏覽器基本標識 使用者代理  基本偽裝 反反爬的手段
    # 出現 403 加防盜鏈 referer  告訴伺服器, 我們傳送請求的url地址 是從哪裡跳轉過來的
    headers = {
        'referer': 'https://search.bilibili.com/',
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36 
'
    }
    response = requests.get(url=html_url, headers=headers)  # 請求程式碼
    # <Response [200]>  物件response響應物件  200 狀態碼 表示請求成功
    # 404 >>> 你所撥打的電話是空號 >>> 網址出錯
    # 403 >>> 你所撥打的電話不在服務區 >>> 你沒有訪問許可權
    # 100-500 300還行
    return response

獲取視訊標題 / 音訊 url地址 / 視訊畫面url地址

def get_video_info(html_url):
    """
    :param html_url:  視訊的詳情頁
    :return: 視訊標題 / 音訊 url地址 / 視訊畫面url地址
    """
    response = get_response(html_url=html_url)
    # response.text 獲取響應體的文字資料
    # print(response.text) 獲取html字串資料
    # 只要你可以看到資料 就可以下載 進行批量下載
    # 解析資料 提取視訊標題 re正則表示式 css選擇器 xpath(解析方式)  bs4 parsel lxml (解析模組) jsonpath 主要提取json資料
    # ['【4K美女】此視訊禁止曹賊入內~~'] 正則表示式提取的資料內容 返回都是列表資料型別 [0] 列表 索引取值
    # 通過re正則表示式裡面findall 方法 提取資料內容  '<h1 title="(.*?)" class="video-title">' 我想要的提取資料
    # 想要的內容用括號括起來 .*? 可以匹配任意字元(除了換行符以外\n)   從 response.text 裡面查詢資料
    title = re.findall('<h1 title="(.*?)" class="video-title">', response.text)[0].replace(' ', '')  # 標題
    title = re.sub(r'[/\*:"?<>|]', '', title)
    html_data = re.findall('<script>window.__playinfo__=(.*?)</script>', response.text)[0]  # 播放資訊的
    # html_data 是什麼樣的資料型別 <class 'str'>
    # 為了更加方便提取資料,  可以字串資料 轉換成 字典資料型別
    # print(type(response.text))
    # print(title)
    # print(html_data)
    # pprint.pprint(html_data)
    # print(type(html_data))
    json_data = json.loads(html_data)
    # 根據冒號左邊的內容, 提取冒號右邊的內容  鍵值對取值
    # 註冊賬號 電話號碼 或者 身份證號碼 數字個數是多的吧 然後不能瞎填
    audio_url = json_data['data']['dash']['audio'][0]['baseUrl']
    video_url = json_data['data']['dash']['video'][0]['baseUrl']
    video_info = [title, audio_url, video_url]
    # pprint.pprint(json_data)
    # print(audio_url)
    # print(video_url)
    return video_info

儲存資料函式

def save(title, audio_url, video_url):
    """
    :param title: 視訊標題
    :param audio_url:  音訊url
    :param video_url:  視訊畫面url
    :return:
    """
    # 儲存音訊 視訊資料 獲取二進位制資料內容
    # 403 沒有訪問的許可權
    # Python視訊教程、原始碼、電子書、軟體、解答、學習路線圖、加群 924040232

    audio_content = get_response(html_url=audio_url).content
    video_content = get_response(html_url=video_url).content
    # 英文符號
    with open(title + '.mp3', mode='wb') as f:
        f.write(audio_content)
    with open(title + '.mp4', mode='wb') as f:
        f.write(video_content)
    print(title, '儲存成功~~~')

資料的合併

def merge_data(video_name):
    print('視訊合成開始:', video_name)
    cmd = f"ffmpeg -i {video_name}.mp4 -i {video_name}.mp3 -c:v copy -c:a aac -strict experimental {video_name}output.mp4"
    # print(cmd)
    subprocess.run(cmd, shell=True)
    print('視訊合成結束:', video_name)
    os.remove(f'{video_name}.mp4')
    os.remove(f'{video_name}.mp3')

如果執行沒儲存，但是沒有下載結果的話，就是你的環境變數沒設定好，我們把合併程式的檔案路徑放上去就行了。

cmd = f"C:\\ffmpeg\\bin\\ffmpeg -i

獲取某一個up主所有視訊bv號

def get_video_id(html_url):
    """
    :param html_url:  視訊資訊資料包
    :return:
    """
    json_data = get_response(html_url).json()['data']['list']['vlist']
    bv_id_list = [i['bvid'] for i in json_data]
    return bv_id_list

主函式

def main(html_url):
    """
    :param bv_id: bv號
    :return:
    """
    bv_id_list = get_video_id(html_url)
    for index  in bv_id_list:
        url = f'https://www.bilibili.com/video/{index}'
        video_info = get_video_info(url)  # [title, audio_url, video_url]
        save(video_info[0], video_info[1], video_info[2])
        merge_data(video_info[0])


if __name__ == '__main__':
    for page in range(1, 5):
        url = f'https://api.bilibili.com/x/space/arc/search?mid=81595107&ps=30&tid=0&pn={page}&keyword=&order=pubdate&jsonp=jsonp'
        main(url)

兄弟們悠著點，看多了遭不住。

兄弟們，學廢了嗎？
覺得還行的話，記得三連哈~

用python把B站舞蹈區視訊爬下來，並打包成可以直接執行的exe檔案

一、寫在前面 1、關於音訊視訊合併因為小破站的音訊和視訊畫面是分開的 (番劇也是一樣的)，正常爬下來是這樣。額，這麼截圖，小姐姐的臉都變形了…本來還是挺好看的一姑娘，算了不管她。

中國聯通 / 國家電網等官方號開始在 B 站舞蹈區整活

要說現在最受年輕人喜愛，且流量站在國內網際網路天花板的社群，無疑是咱們最熟悉的 B 站了。

化身宅舞 up 主：為了拯救 B 站舞蹈區，各大國企紛紛出道當偶像

為了拯救 B 站舞蹈區，中國聯通、中國移動、中國電信、招商銀行決定出道成為偶像！

【視覺化分析案例】用python分析B站Top100排行榜資料

目錄一、資料來源二、資料讀取三、資料概覽四、資料清洗五、視覺化分析 5.1 相關性分析（Correlation）

Python如何把指令碼編譯成可執行exe檔案

學Python那麼久了，才知道自己不會把指令碼編譯成可執行exe檔案。這是昨天以為小夥伴告訴我的，為了幫她解決這個問題，我今天特意寫了這一篇文章。相信肯定不止我的小夥伴不會，也許某個角落也藏著一個你。

詞雲圖是怎麼做出來的？Python爬取B站視訊彈幕，並做成詞雲圖

前言今天介紹一個獲取B站資料的Python擴充套件庫-bilibili_api 可以獲取的資料包括：

ffmpeg+Python實現B站MP4格式音訊與視訊的合併示例程式碼

安裝官網下載 http://ffmpeg.org/ 選擇需要的版本在這個網址下載ffmpeg，https://github.com/BtbN/FFmpeg-Builds/releases

Python下載b站視訊

import subprocess from pprint import pprint import requests import re, json url = \'https://www.bilibili.com/video/BV1JL411G7u1?spm_id_from=333.999.0.0\'

用Python把20年的GDP、人口以及房價資料進行了視覺化

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

震驚！小夥竟然用python找出了馬大師視訊中的名場面

此文轉載自：https://blog.csdn.net/kimol_justdo/article/details/110152915#commentBox 震驚！小夥竟然用python找出了馬大師視訊中的名場面

陳睿：今年 5 月，超 7855 萬用戶在 B 站學習

6 月 3 日，第九屆中國網路視聽大會在成都開幕。在論壇上，嗶哩嗶哩（以下簡稱“B 站”）董事長兼 CEO 陳睿表示，B 站成長的過程，就是不斷尋找視訊新增量的過程，隨著技術的進步和視訊的普及，越來越多的內容和服務

B站英文教學視訊的字幕獲取學習必看！

前言最近在B站看一些純英文的課程，視訊課程有的是純中文字幕的，有的是純英文字幕的。由於英文的重要性，一份字幕的文件在我們觀看後，留著日後粗略再讀是很有益處的。但是為了得到這個英文字幕走了許多彎路。最開

【免費程式】精仿B站原始碼/Bilibili視訊網站原始碼+自動採集360視訊

本資源可免費獲取，請至尾部讀閱！精仿B站原始碼+自動採集360視訊精仿嗶哩嗶哩還原度高達90%

B站 UP 主因視訊造假向拼多多致歉，涉事賬號被封禁 30 天

11 月 27 日訊息，嗶哩嗶哩在今日釋出關於 UP 主“開箱嚶嚶怪”的處罰公告。公告顯示，經查實，該 UP 主 6 月 10 日釋出的視訊《花 760 元在 PDD 買了臺蘋果 X，開箱後我直接哭了》為不實內容，已第一時間下架了該視

B站遊戲區年度盤點 LOL過去十年仍熱度不減

昨日（1月7日），嗶哩嗶哩官方舉辦的2021年度遊戲大賞正式落下帷幕，遊戲大賞上不僅包含遊戲獎項的頒發，還有諸多遊戲新作預告等資訊公佈，此外，嗶哩嗶哩官方還公佈2021年遊戲區年度盤點，一起來看看吧！

B站遊戲區專項整治：打擊販賣遊戲外掛、偷跑洩密、拉踩引戰等行為

3 月 30 日訊息，今天B站官方賬號釋出《關於打擊遊戲區不良言論及稿件的專項整治公告》，將重點整治宣傳販賣遊戲外掛、拆包偷跑、洩密等侵權等行為。公告原文：為落實國家網信辦統一部署的“清朗・打擊流量造假、黑

【2022.04.19】QQ機器人好用外掛——檢測B站動態併合成成圖片，傳送給群內

專案地址：Colter23/bilibili-dynamic-mirai-plugin: 低延遲檢測B站動態/直播的mirai-console外掛 (github.com)

python cv2獲取視訊第一幀，並轉碼

安裝Python庫sudo pip install opencv-python 或者sudo pip install opencv-python -i https://pypi.douban.com/simple/

B站與BBC達成戰略合作，將聯合出品《綠色星球》等紀錄片內容

10 月 19 日訊息嗶哩嗶哩（以下簡稱 “B 站”）與 BBC Studios 聯合宣佈達成長期戰略合作。雙方將在多部紀錄片的內容共制及 IP 衍生開發等領域，展開一系列深入合作。

用 Python 實現朋友圈中的九宮格圖片，讓你的朋友圈從此逼格提升

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

用python把B站舞蹈區視訊爬下來，並打包成可以直接執行的exe檔案

一、寫在前面

1、關於音訊視訊合併

2、關於打包exe檔案

二、過程結果

三、程式碼實現

相關推薦