python專案實戰：基於opencv、pyaudio和ffmpeg的錄影小程式

阿新 • • 發佈：2020-12-11

一、前言

開發前的準備：

需要用到的第三方庫：opencv-python、wave、pyaudio、ffmpy3（這4個庫都可以通過pip工具直接安裝）
額外的工具（用來合成音訊和視訊）：ffmpeg
ffmpeg下載下載地址：

官網：https://www.ffmpeg.org/
Github地址：https://github.com/FFmpeg/FFmpeg
百度網盤連結：https://pan.baidu.com/s/1UBcoXy6v3XG8oz0GuMKd8w 提取碼：90ow
上面3個地址來源於此文章：https://www.cnblogs.com/Neeo/articles/11677715.html

參考：

此錄影小程式的程式碼參考了以下文章：
https://www.jianshu.com/p/a401466f3c9d
https://blog.csdn.net/pythonlaodi/article/details/109222790
https://cloud.tencent.com/developer/news/147840
https://www.cnblogs.com/Neeo/articles/11677715.html
https://ffmpy3.readthedocs.io/en/latest/examples.html

聲音的取樣頻率：https://baike.baidu.com/item/%E9%87%87%E6%A0%B7%E9%A2%91%E7%8E%87/1494233

二、過程分析

採用多執行緒的方式開始錄製畫面和錄製聲音：
執行緒一：呼叫opencv開啟攝像頭並把畫面儲存至視訊
執行緒二：呼叫pyaudio開啟麥克風進行錄音
呼叫wave模組將音訊資料儲存至wav檔案。
用ffmpeg將音訊和視訊合成為一個視訊。

1.呼叫opencv開啟攝像頭並把畫面儲存至視訊

# 初始化攝像頭
self.cap = cv.VideoCapture(1)
if not self.cap.isOpened():
    print('攝像頭開啟失敗')
    
# 初始化 cv.VideoWriter()類，用來儲存視訊
w, h = int(self.cap. 
get(cv.CAP_PROP_FRAME_WIDTH)), int(self.cap.get(cv.CAP_PROP_FRAME_HEIGHT))
fourCC = cv.VideoWriter_fourcc('X', 'V', 'I', 'D')
self.out = cv.VideoWriter(filename+'.avi', fourCC, fps=30, frameSize=(w, h))

這裡要注意的是在cv.VideoWriter()類例項化的時候，fps設為30。fps指的是儲存視訊的幀率大小，剛開始我設定為20的時候，發現最後錄製的畫面時長比音訊的時長要長，並且音訊和視訊是對不上的。如果你們也出現這種狀況，嘗試修改一下fps的值。

開始錄製畫面，當按下鍵盤s的時候結束錄製：

while True:
    isOpened,frame = self.cap.read()
    if not isOpened:
        break
    self.out.write(frame)
    cv.imshow('frame',frame)

    if cv.waitKey(1) == ord('s'):
        self.flag_read = False
        break

2.呼叫pyaudio開啟麥克風進行錄音


self.NUM_SAMPLES = 1000  # 錄音時緩衝區的幀數。
self.my_buf = b''  # 用bytes型別儲存音訊內容
pa = PyAudio()
self.stream = pa.open(format=paInt16, channels=self.channels, rate=self.framerate, input=True,
                      frames_per_buffer=self.NUM_SAMPLES)
# 引數frames_per_buffer：Specifies the number of frames per buffer.指定每個緩衝區的幀數。

def collect_mp3(self):
    """
    錄音
    """
    while self.flag_read:
        string_audio_data = self.stream.read(self.NUM_SAMPLES)
        self.my_buf += string_audio_data
    self.stream.close()

3.呼叫wave模組將音訊資料儲存至wav檔案。

self.framerate = 32000  # 取樣頻率
self.channels = 1  # 聲道
self.sampWidth = 2  # 量化位數（byte單位）

def save_wave_file(self):
    """
    寫入檔案
    """
    with wave.open(self.filename + '.wav', 'wb') as wf:
        wf.setnchannels(self.channels)
        wf.setsampwidth(self.sampWidth)
        wf.setframerate(self.framerate)
        wf.writeframes(self.my_buf)
    print('音訊寫入完成.')

4.用ffmpeg將音訊和視訊合成為一個視訊。

from ffmpy3 import FFmpeg
FFmpeg(inputs={f'{self.filename}.avi':None, f'{self.filename}.wav':None},
               outputs={f'{self.filename}.mp4':'-c:v h264 -c:a ac3'}).run()

ffmpy3是用來驅動ffmpeg程式的，所以電腦上一定要先安裝ffmpeg，安裝完成之後最好將ffmpeg.exe檔案所在路徑新增到系統環境變數。
ffmpeg的下載地址在文章開頭。

三、完整程式碼

# Author:FuJLiny
# CSDN blog homepage:https://blog.csdn.net/FujLiny
# ------version 1-1,Update time:2020/12/6------
import os
import threading
import time
import wave
from pyaudio import PyAudio,paInt16
import cv2 as cv
from ffmpy3 import FFmpeg


class VCR:
    def __init__(self,filename):
        """
        :param filename: 檔名（不帶字尾）
        """
        self.filename = filename
        if os.path.exists(filename+'.mp4'):
            os.remove(filename+'.mp4')

        self.framerate = 32000  # 取樣頻率
        self.NUM_SAMPLES = 1000  # 錄音時緩衝區的幀數。
        self.channels = 1  # 聲道
        self.sampWidth = 2  # 量化位數（byte單位）
        self.my_buf = b''  # 用bytes型別儲存音訊內容
        self.flag_read = True

        self.cap = cv.VideoCapture(1)
        if not self.cap.isOpened():
            print('攝像頭開啟失敗')
        w, h = int(self.cap.get(cv.CAP_PROP_FRAME_WIDTH)), int(self.cap.get(cv.CAP_PROP_FRAME_HEIGHT))
        fourCC = cv.VideoWriter_fourcc('X', 'V', 'I', 'D')
        self.out = cv.VideoWriter(filename+'.avi', fourCC, fps=30, frameSize=(w, h))

        pa = PyAudio()
        self.stream = pa.open(format=paInt16, channels=self.channels, rate=self.framerate, input=True,
                              frames_per_buffer=self.NUM_SAMPLES)
        # 引數frames_per_buffer：Specifies the number of frames per buffer.指定每個緩衝區的幀數。

    def save_wave_file(self):
        """
        寫入檔案
        """
        with wave.open(self.filename+'.wav','wb') as wf:
            wf.setnchannels(self.channels)
            wf.setsampwidth(self.sampWidth)
            wf.setframerate(self.framerate)
            wf.writeframes(self.my_buf)
        print('音訊寫入完成.')

    def collect_mp3(self):
        """
        錄音
        """
        while self.flag_read:
            string_audio_data = self.stream.read(self.NUM_SAMPLES)
            self.my_buf += string_audio_data
        self.stream.close()

    def collect_mp4(self):
        """
        攝像頭畫面錄製
        :return:
        """
        font = cv.FONT_HERSHEY_COMPLEX
        txt = 'Video start when you press the space key.'
        while True:
            isOpened, frame = self.cap.read()
            if not isOpened:
                break
            cv.putText(frame,txt,(30,150),font,0.8,(0,0,255),1)
            cv.imshow('frame', frame)
            if cv.waitKey(1) == ord(' '):
                break

        print('畫面錄製開始……')
        threading.Thread(target=self.collect_mp3).start()
        while True:
            isOpened,frame = self.cap.read()
            if not isOpened:
                break
            self.out.write(frame)
            cv.imshow('frame',frame)

            if cv.waitKey(1) == ord('s'):
                # 按下鍵盤s結束錄製
                self.flag_read = False
                break
        self.out.release()
        self.cap.release()
        cv.destroyAllWindows()

    def runMain(self):
        """
        啟動位置
        """
        threading.Thread(target=self.collect_mp4).start()
        while self.flag_read:
            time.sleep(1)

        print('準備將音訊寫入檔案……')
        self.save_wave_file()

        print('準備將音訊和視訊進行合成……')
        # subprocess.Popen(f'ffmpeg -i {self.filename}.avi -i {self.filename}.wav {self.filename}.mp4')
        FFmpeg(inputs={f'{self.filename}.avi':None, f'{self.filename}.wav':None},
               outputs={f'{self.filename}.mp4':'-c:v h264 -c:a ac3'}).run()
        print('合成成功，程式結束。')


if __name__ == '__main__':
    v = VCR(filename='my_audio')
    v.runMain()

python專案實戰：基於opencv、pyaudio和ffmpeg的錄影小程式

技術標籤：pythonffmpegopencvpython 一、前言開發前的準備：需要用到的第三方庫：opencv-python、wave、pyaudio、ffmpy3（這4個庫都可以通過pip工具直接安裝）額外的工具（用來合成音訊和視訊）：ffmpeg ffmp

長城汽車：基於檸檬、坦克和咖啡智慧三大技術品牌車型佔比 75.1%

3 月 10 日訊息，長城汽車產銷資料顯示，2 月，長城汽車銷售新車 70,792 輛，其中海外銷售 6,037 輛。今年 1-2 月，長城汽車 15 萬元以上車型銷量佔比提升至 15.5%，智慧化車型佔比提升至 88.1%。據介紹，基於檸檬、

專案實戰：Qt+Ffmpeg+OpenCV相機程式(開啟攝像頭、支援多種攝像頭、解析度調整、翻轉、旋轉、亮度調整、拍照、錄影、回放圖片、回放錄影)

若該文為原創文章，未經允許不得轉載原博主部落格地址：https://blog.csdn.net/qq21497936原博主部落格導航：https://blog.csdn.net/qq21497936/article/details/102478062本文章部落格地址：https://blog.csdn.net

Python GUI專案實戰：主窗體的介面設計與實現

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

專案實戰：Qt+Arm+Fpga醫療腎鏡（又名內窺鏡）（實時影像、凍結、拍照、白平衡、九宮格、錄影、背光調整、硬體光源調整、光源手動自動調整、物理按鍵）

若該文為原創文章，轉載請註明原文出處本文章部落格地址：https://blog.csdn.net/qq21497936/article/details/111241205長期持續帶來更多專案與技術分享，諮詢請加QQ:21497936、微信：yangsir198808紅胖子(紅模仿)

專案實戰：Qt多段Y軸折線圖框架（雙Y軸段折線、支援拽拖、浮動遊標顯示X值各段Y值、支援大量實時顯示下位機資料）

若該文為原創文章，轉載請註明原文出處本文章部落格地址：https://blog.csdn.net/qq21497936/article/details/111660400長期持續帶來更多專案與技術分享，諮詢請加QQ:21497936、微信：yangsir198808紅胖子(紅模仿)的

專案實戰：Qt中英文輸入軟鍵盤（支援Qt4、Qt5、觸控和鍵鼠混合輸入等）

需求 1. 全屏軟鍵盤； 2. 輸入英文； 3. 輸入中文； 4. 支援觸控、鍵盤和輸入混合輸入； 5. 目前有黑色系面板； 6. Qt4和Qt5區分2個版本；

Python語法進階（3）- 綜合專案實戰：抽獎系統

common/consts.py 1 # coding:utf-8 2 3 ROLES=[\'admin\',\'normal\'] 4 FIRSTLEVEL=[\'level1\',\'level2\',\'level3\',\'level4\']

Python爬蟲實戰：爬取美團美食資料

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲實戰：爬取淘女郎照片

本篇目標抓取淘寶MM的姓名，頭像，年齡抓取每一個MM的資料簡介以及寫真圖片

Python爬蟲實戰：爬取小姐姐最近的聽歌曲目

前言作為網易雲村的深度使用者，網易雲音樂應該是我除了微信外開啟時間最長的 App 了。並不是應為網易雲上面的歌曲多，而是因為那些走心的評論。邊聽歌邊刷評論，感覺就像是走進了他人的人生之中，從另外一種意義來

Python爬蟲實戰：爬取首都醫科大學文章

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

vue專案實戰：element-ui上傳元件 upload的原始碼改造

``` 基於專案需求需要把上傳成功的檔案圖示logo區別對待好一眼知道哪個檔案是ppt、哪個是圖片、哪個是word 哪個是文字txt等檔案型別；由於element-ui 的upload元件原始碼是寫死的此時需要copy一份原始碼稍加改造即可

Python爬蟲實戰：自動化登入網站，爬取商品資料

前言隨著網際網路時代的到來，人們更加傾向於網際網路購物。某東又是電商行業的巨頭，在某東平臺中有很多商家資料。今天帶大家使用python+selenium工具獲取這些公開的商家資料

實戰：基於NumPy的股價統計分析應用

目錄基於NumPy的股價統計分析應用構造資料讀取資料應用計算成交量加權平均價格計算最大值和最小值計算極差計算中位數計算方差計算股票收益率、年波動率及月波動率

Python爬蟲實戰：抓取京東蘋果手機評價

目錄 1. 網站分析 2. 示例程式碼 3. 注意事項 1. 網站分析很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去學習更加

271 第九篇：BBS專案02：基於角色許可權管理：rbac具體程式碼實現

1、settings 1 \"\"\" 2 Django settings for day80 project. 3 4 Generated by \'django-admin startproject\' using Django 1.11.6.

270 第九篇：BBS專案01：基於角色許可權管理：rbac設計分析以及具體細節

BBS部落格園專案完整程式碼日後上傳。這裡只寫一下web專案裡的許可權問題。說起許可權我們大家都知道，不一樣的角色會有不一樣的許可權。比如就像學生管理系統一樣，管理員，老師，學生之間的許可權都是不一樣的，那

機器學習：基於OpenCv和pthon的智慧影象處理

技術標籤：python 機器學習：基於OpenCv和pthon的智慧影象處理 chapter1影象基礎知識

python專案實戰：基於opencv、pyaudio和ffmpeg的錄影小程式

一、前言

二、過程分析

1.呼叫opencv開啟攝像頭並把畫面儲存至視訊

2.呼叫pyaudio開啟麥克風進行錄音

3.呼叫wave模組將音訊資料儲存至wav檔案。

4.用ffmpeg將音訊和視訊合成為一個視訊。

三、完整程式碼

相關推薦