JavaCV的攝像頭實戰之七：推流(帶聲音)

阿新 • • 發佈：2022-04-19

歡迎訪問我的GitHub

這裡分類和彙總了欣宸的全部原創(含配套原始碼)：https://github.com/zq2599/blog_demos

本篇概覽

本文是《JavaCV的攝像頭實戰》的第七篇，在《JavaCV的攝像頭實戰之五：推流》一文中，咱們將攝像頭的內容推送到媒體伺服器，再用VLC成功播放，相信聰明的您一定覺察到了一縷瑕疵：沒有聲音
雖然《JavaCV的攝像頭實戰》系列的主題是攝像頭處理，但顯然音視訊健全才是最常見的情況，因此就在本篇補全前文的不足吧：編碼實現攝像頭和麥克風的推流，並驗證可以成功遠端播放音視訊

關於音訊的採集和錄製

本篇的程式碼是在《JavaCV的攝像頭實戰之五：推流》

原始碼的基礎上增加音訊處理部分
編碼前，咱們先來分析一下，增加音訊處理後具體的程式碼邏輯會有哪些變化
只儲存視訊的操作，與儲存音訊相比，步驟的區別如下圖所示，深色塊就是新增的操作：
相對的，在應用結束時，釋放所有資源的時候，音視訊的操作也比只有視訊時要多一些，如下圖所示，深色就是釋放音訊相關資源的操作：
為了讓程式碼簡潔一些，我將音訊相關的處理都放在名為AudioService的類中，也就是說上面兩幅圖的深色部分的程式碼都在AudioService.java中，主程式使用此類來完成音訊處理
接下來開始編碼

開發音訊處理類AudioService

首先是剛才提到的AudioService.java，主要內容就是前面圖中深色塊的功能，有幾處要注意的地方稍後會提到：

package com.bolingcavalry.grabpush.extend;

import lombok.extern.slf4j.Slf4j;
import org.bytedeco.ffmpeg.global.avcodec;
import org.bytedeco.javacv.FFmpegFrameRecorder;
import org.bytedeco.javacv.FrameRecorder;
import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.DataLine;
import javax.sound.sampled.TargetDataLine;
import java.nio.ByteBuffer;
import java.nio.ByteOrder;
import java.nio.ShortBuffer;
import java.util.concurrent.ScheduledThreadPoolExecutor;
import java.util.concurrent.TimeUnit;

/**
 * @author willzhao
 * @version 1.0
 * @description 音訊相關的服務
 * @date 2021/12/3 8:09
 */
@Slf4j
public class AudioService {

    // 取樣率
    private final static int SAMPLE_RATE = 44100;

    // 音訊通道數，2表示立體聲
    private final static int CHANNEL_NUM = 2;

    // 幀錄製器
    private FFmpegFrameRecorder recorder;

    // 定時器
    private ScheduledThreadPoolExecutor sampleTask;

    // 目標資料線，音訊資料從這裡獲取
    private TargetDataLine line;

    // 該陣列用於儲存從資料線中取得的音訊資料
    byte[] audioBytes;

    // 定時任務的執行緒中會讀此變數，而改變此變數的值是在主執行緒中，因此要用volatile保持可見性
    private volatile boolean isFinish = false;

    /**
     * 幀錄製器的音訊引數設定
     * @param recorder
     * @throws Exception
     */
    public void setRecorderParams(FrameRecorder recorder) throws Exception {
        this.recorder = (FFmpegFrameRecorder)recorder;

        // 位元速率恆定
        recorder.setAudioOption("crf", "0");
        // 最高音質
        recorder.setAudioQuality(0);
        // 192 Kbps
        recorder.setAudioBitrate(192000);

        // 取樣率
        recorder.setSampleRate(SAMPLE_RATE);

        // 立體聲
        recorder.setAudioChannels(2);
        // 編碼器
        recorder.setAudioCodec(avcodec.AV_CODEC_ID_AAC);
    }

    /**
     * 音訊取樣物件的初始化
     * @throws Exception
     */
    public void initSampleService() throws Exception {
        // 音訊格式的引數
        AudioFormat audioFormat = new AudioFormat(SAMPLE_RATE, 16, CHANNEL_NUM, true, false);

        // 獲取資料線所需的引數
        DataLine.Info dataLineInfo = new DataLine.Info(TargetDataLine.class, audioFormat);

        // 從音訊捕獲裝置取得其資料的資料線，之後的音訊資料就從該資料線中獲取
        line = (TargetDataLine)AudioSystem.getLine(dataLineInfo);

        line.open(audioFormat);

        // 資料線與音訊資料的IO建立聯絡
        line.start();

        // 每次取得的原始資料大小
        final int audioBufferSize = SAMPLE_RATE * CHANNEL_NUM;

        // 初始化陣列，用於暫存原始音訊取樣資料
        audioBytes = new byte[audioBufferSize];

        // 建立一個定時任務，任務的內容是定時做音訊取樣，再把取樣資料交給幀錄製器處理
        sampleTask = new ScheduledThreadPoolExecutor(1);
    }

    /**
     * 程式結束前，釋放音訊相關的資源
     */
    public void releaseOutputResource() {
        // 結束的標誌，避免取樣的程式碼在whlie迴圈中不退出
        isFinish = true;
        // 結束定時任務
        sampleTask.shutdown();
        // 停止資料線
        line.stop();
        // 關閉資料線
        line.close();
    }

    /**
     * 啟動定時任務，每秒執行一次，採集音訊資料給幀錄製器
     * @param frameRate
     */
    public void startSample(double frameRate) {

        // 啟動定時任務，每秒執行一次，採集音訊資料給幀錄製器
        sampleTask.scheduleAtFixedRate((Runnable) new Runnable() {
            @Override
            public void run() {
                try
                {
                    int nBytesRead = 0;

                    while (nBytesRead == 0 && !isFinish) {
                        // 音訊資料是從資料線中取得的
                        nBytesRead = line.read(audioBytes, 0, line.available());
                    }

                    // 如果nBytesRead<1，表示isFinish標誌被設定true，此時該結束了
                    if (nBytesRead<1) {
                        return;
                    }

                    // 取樣資料是16位元，也就是2位元組，對應的資料型別就是short，
                    // 所以準備一個short陣列來接受原始的byte陣列資料
                    // short是2位元組，所以陣列長度就是byte陣列長度的二分之一
                    int nSamplesRead = nBytesRead / 2;
                    short[] samples = new short[nSamplesRead];

                    // 兩個byte放入一個short中的時候，誰在前誰在後？這裡用LITTLE_ENDIAN指定拜訪順序，
                    ByteBuffer.wrap(audioBytes).order(ByteOrder.LITTLE_ENDIAN).asShortBuffer().get(samples);
                    // 將short陣列轉為ShortBuffer物件，因為幀錄製器的入參需要該型別
                    ShortBuffer sBuff = ShortBuffer.wrap(samples, 0, nSamplesRead);

                    // 音訊幀交給幀錄製器輸出
                    recorder.recordSamples(SAMPLE_RATE, CHANNEL_NUM, sBuff);
                }
                catch (FrameRecorder.Exception e) {
                    e.printStackTrace();
                }
            }
        }, 0, 1000 / (long)frameRate, TimeUnit.MILLISECONDS);
    }
}

上述程式碼中，有兩處要注意：

重點關注recorder.recordSamples，該方法將音訊存入了mp4檔案
定時任務是在一個新執行緒中執行的，因此當主執行緒結束錄製後，需要中斷定時任務中的while迴圈，因此新增了volatile型別的變數isFinish，幫助定時任務中的程式碼判斷是否立即結束while迴圈

改造原本推流時只推視訊的程式碼

接著是對《JavaCV的攝像頭實戰之五：推流》一文中RecordCamera.java的改造，為了不影響之前章節在github上的程式碼，這裡我新增了一個類RecordCameraWithAudio.java，內容與RecordCamera.java一模一樣，接下來咱們來改造這個RecordCameraWithAudio類
先增加AudioService型別的成員變數：

	// 音訊服務類
    private AudioService audioService = new AudioService();

接下來是關鍵，initOutput方法負責幀錄製器的初始化，現在要加上音訊相關的初始化操作，並且還要啟動定時任務去採集和處理音訊，如下所示，AudioService的三個方法都在此呼叫了，注意定時任務的啟動要放在幀錄製器初始化之後：

    @Override
    protected void initOutput() throws Exception {
        // 例項化FFmpegFrameRecorder，將SRS的推送地址傳入
        recorder = FrameRecorder.createDefault(RECORD_ADDRESS, getCameraImageWidth(), getCameraImageHeight());

        // 降低啟動時的延時，參考
        // https://trac.ffmpeg.org/wiki/StreamingGuide)
        recorder.setVideoOption("tune", "zerolatency");
        // 在視訊質量和編碼速度之間選擇適合自己的方案，包括這些選項：
        // ultrafast,superfast, veryfast, faster, fast, medium, slow, slower, veryslow
        // ultrafast offers us the least amount of compression (lower encoder
        // CPU) at the cost of a larger stream size
        // at the other end, veryslow provides the best compression (high
        // encoder CPU) while lowering the stream size
        // (see: https://trac.ffmpeg.org/wiki/Encode/H.264)
        // ultrafast對CPU消耗最低
        recorder.setVideoOption("preset", "ultrafast");
        // Constant Rate Factor (see: https://trac.ffmpeg.org/wiki/Encode/H.264)
        recorder.setVideoOption("crf", "28");
        // 2000 kb/s, reasonable "sane" area for 720
        recorder.setVideoBitrate(2000000);

        // 設定編碼格式
        recorder.setVideoCodec(avcodec.AV_CODEC_ID_H264);

        // 設定封裝格式
        recorder.setFormat("flv");

        // FPS (frames per second)
        // 一秒內的幀數
        recorder.setFrameRate(getFrameRate());
        // Key frame interval, in our case every 2 seconds -> 30 (fps) * 2 = 60
        // 關鍵幀間隔
        recorder.setGopSize((int)getFrameRate()*2);

        // 設定幀錄製器的音訊相關引數
        audioService.setRecorderParams(recorder);

        // 音訊取樣相關的初始化操作
        audioService.initSampleService();

        // 幀錄製器開始初始化
        recorder.start();

        // 啟動定時任務，採集音訊幀給幀錄製器
        audioService.startSample(getFrameRate());
    }

output方法儲存原樣，只處理視訊幀（音訊處理在定時任務中）

    @Override
    protected void output(Frame frame) throws Exception {
        if (0L==startRecordTime) {
            startRecordTime = System.currentTimeMillis();
        }

        // 時間戳
        recorder.setTimestamp(1000 * (System.currentTimeMillis()-startRecordTime));

        // 存檔
        recorder.record(frame);
    }

釋放資源的方法中，增加了音訊資源釋放的操作：

    @Override
    protected void releaseOutputResource() throws Exception {
        // 執行音訊服務的資源釋放操作
        audioService.releaseOutputResource();

        // 關閉幀錄製器
        recorder.close();
    }

至此，將攝像頭視訊和麥克風音訊推送到媒體伺服器的功能已開發完成，再寫上main方法，表示推流十分鐘：

    public static void main(String[] args) {
        new RecordCameraWithAudio().action(600);
    }

執行main方法，等到控制檯輸出下圖紅框的內容時，表示正在推送中：
在另一臺電腦上用VLC軟體開啟剛才推流的地址rtmp://192.168.50.43:21935/hls/camera，稍等幾秒鐘後開始正常播放，影象聲音都正常（注意不能用當前電腦播放，否則麥克風採集的是VLC播放的聲音了）：
用VLC自帶的工具檢視媒體流資訊，如下圖，可見視訊流和音訊流都能正常識別：
開啟媒體伺服器自身的監控頁面，如下圖，可以看到各項實時資料：
至此，咱們已完成了音視訊推流的功能，（有點像直播的樣子了），得益於JavaCV的強大，整個過程是如此的輕鬆愉快，接下來請繼續關注欣宸原創，《JavaCV的攝像頭實戰》系列還會呈現更多豐富的應用；

原始碼下載

《JavaCV的攝像頭實戰》的完整原始碼可在GitHub下載到，地址和連結資訊如下表所示(https://github.com/zq2599/blog_demos)：

名稱	連結	備註
專案主頁	https://github.com/zq2599/blog_demos	該專案在GitHub上的主頁
git倉庫地址(https)	https://github.com/zq2599/blog_demos.git	該專案原始碼的倉庫地址，https協議
git倉庫地址(ssh)	[email protected]:zq2599/blog_demos.git	該專案原始碼的倉庫地址，ssh協議

這個git專案中有多個資料夾，本篇的原始碼在javacv-tutorials資料夾下，如下圖紅框所示：
javacv-tutorials裡面有多個子工程，《JavaCV的攝像頭實戰》系列的程式碼在simple-grab-push工程下：

歡迎關注部落格園：程式設計師欣宸

學習路上，你不孤單，欣宸原創一路相伴...

JavaCV的攝像頭實戰之七：推流(帶聲音)

歡迎訪問我的GitHub 這裡分類和彙總了欣宸的全部原創(含配套原始碼)：https://github.com/zq2599/blog_demos

樂位元組Java8核心特性實戰之五：Stream（流）

說起流，我們會想起手機，電腦組裝流水線，物流倉庫商品包裝流水線等等。如果把手機 ,電腦,包裹看做最終結果的話,那麼加工商品前的各種零部件就可以看做資料來源，而中間一系列的加工作業操作，就可以看做流的處理

SpringCloud學習之七：使用Spring Cloud Sleuth實現微服務跟蹤

使用Spring Cloud Sleuth實現微服務跟蹤 Spring Cloud版本：Hoxton.SR5 1. 簡介 Spring Cloud Sleuth為Spring Cloud提供了分散式跟蹤的解決方案，它大量借用了Google Dapper、Twitter Zipkin和Apache HTrace的設計

樂位元組-Java8核心實戰之三：函式式介面

Java8 引入 Lambda 表示式，允許開發者將函式當成引數傳遞給某個方法，或者把程式碼本身當作資料進行處理。使用 Lambda 表示式，使得應用變得簡潔而緊湊。很多語言（Groovy、Scala 等）從設計之初就支援 Lambda 表示

樂位元組Java8核心特性實戰之四：方法引用

Java8 中引入方法引用新特性，用於簡化應用物件方法的呼叫，方法引用是用來直接訪問類或者例項的已經存在的方法或者構造方法。方法引用提供了一種引用而不執行方法的方式，它需要由相容的函式式介面構成的目標型別

《SeleniumBasic 3.141.0.0 - 在VBA中操作瀏覽器》系列文章之七：模擬滑鼠和鍵盤操作

SeleniumBasic中的Actions類可以實現滑鼠和鍵盤操作。方法列表如下其中標記為橙色的是鍵盤方面的操作。標記綠色的Create方法是建立行為時必須要執行的。

印表機故障轉移叢集之七：部署印表機叢集

單擊服務和應用程式，右邊的配置服務或應用程式選擇分配給檔案伺服器的儲存磁碟，G

PHP學習之七：高階OOP特性：克隆和繼承

一、PHP5.3 不支援的高階OOP特性　　1、方法過載　　2、操作符過載　　3、多重繼承

微信小程式 “萬利商城”實戰之十：商品列表頁的加入購物車功能實現

加入購物車功能的基本實現是這樣的：使用者點選“加入購物車” ，小程式將該商品資訊傳送到伺服器記錄下來，

Flink處理函式實戰之二：ProcessFunction類

歡迎訪問我的GitHub https://github.com/zq2599/blog_demos 內容：所有原創文章分類彙總及配套原始碼，涉及Java、Docker、Kubernetes、DevOPS等；

vue2.x搭建saas專案系列之七：API介面及常量、基礎資料統一維護

技術標籤：vue2.xvuesaas專案架構此篇幅主要介紹、我們是如何做API介面及常量統一維護，如有不足和建議請留言，在此感謝，專案目前階段還處在少年，一直在迭代

Flink處理函式實戰之五：CoProcessFunction(雙流處理)

歡迎訪問我的GitHub https://github.com/zq2599/blog_demos 內容：所有原創文章分類彙總及配套原始碼，涉及Java、Docker、Kubernetes、DevOPS等；

Pandas入門之七：迭代

已信任 Jupyter 伺服器: 本地 Python 3: Not Started [4] import pandas as pd import numpy as np df = pd.DataFrame({

《原神攻略》機關棋譚靈妙之局單推流思路

《原神》機關棋譚靈妙之局中單推流就是整個關卡中只用一種元素的機關的打法，那麼單推流該怎麼使用呢？現在為大家帶來“QY權”分享的《原神》機關棋譚靈妙之局單推流思路，希望對大家有所幫助。

kubebuilder實戰之五：operator編碼

歡迎訪問我的GitHub https://github.com/zq2599/blog_demos 內容：所有原創文章分類彙總及配套原始碼，涉及Java、Docker、Kubernetes、DevOPS等；

DL4J實戰之六：圖形化展示訓練過程

歡迎訪問我的GitHub 這裡分類和彙總了欣宸的全部原創(含配套原始碼)：https://github.com/zq2599/blog_demos

[書目20211212]圖靈原創·流程的永恆之道：工作流及BPM技術的理論、規範、模式及最佳實踐(圖靈出品

第1章　流程入門1．1　流程的定義1．2　流程管理思想及方法論的歷史1．2．1　科學管理與流程管理思想萌芽1．2．2　資訊科技驅動的流程自動化1．2．3　業務流程再造1．2．4　業務流程為主導的管理思想1．2．5　BPM

處理流之二：轉換流的使用

1.轉換流：屬於字元流 InputStreamReader：將一個位元組的輸入流轉換為字元的輸入流OutputStreamWriter：將一個字元的輸出流轉換為位元組的輸出流2.作用：提供位元組流與字元流之間的轉換

JUnit5學習之七：引數化測試(Parameterized Tests)進階

轉載（好喜歡這篇，把我當下的問題都解決了~）本篇概覽本文是《JUnit5學習》系列的第七篇，前文咱們對JUnit5的引數化測試(Parameterized Tests)有了基本瞭解，可以使用各種資料來源控制測試方法多次執行，今天

.Net6+Furion+Sqlsugar+SenparcSdk開發微信公眾號系列之七：生成帶引數的二維碼

一、說明為了滿足使用者渠道推廣分析和使用者帳號繫結等場景的需要，公眾平臺提供了生成帶引數二維碼的介面。使用該介面可以獲得多個帶不同場景值的二維碼，使用者掃描後，公眾號可以接收到事件推送。使用介面過程中

JavaCV的攝像頭實戰之七：推流(帶聲音)

歡迎訪問我的GitHub

本篇概覽

關於音訊的採集和錄製

開發音訊處理類AudioService

改造原本推流時只推視訊的程式碼

原始碼下載

歡迎關注部落格園：程式設計師欣宸

相關推薦