ffmpeg-音訊編碼

阿新 • • 發佈：2019-02-09

簡單記錄一下個人做語音聊天時使用的ffmpeg音訊編碼。

我們可以

1.使用ffmpeg將PCM編碼得到想要的格式的資料輸出到記憶體中，然後自己實現流媒體協議或者使用自己的RPC。

2.使用ffmpeg的avio_open直接推流,ffmpeg幫我們實現了http rtmp rtp 協議。

簡單說下編碼輸出到記憶體的流程：

編碼並推流的流程：

直接上程式碼

#ifndef _IEncode_H
#define _IEncode_H

#include "util.h"

extern "C" {

#include <libavcodec/avcodec.h>
#include <libavformat/avformat.h>
#include <libavutil/opt.h>
};

struct AudioParams {

	int sampleRate;
	int channels;
	enum AVSampleFormat fmt;
	long long bitRate;
	AVCodecID id;
	int64_t channel_layout;

	AudioParams() : sampleRate(-1), channels(-1), channel_layout(-1),
		fmt(AVSampleFormat::AV_SAMPLE_FMT_NONE), bitRate(-1),
		id(AVCodecID::AV_CODEC_ID_NONE)
	{
	}

	AudioParams(const AudioParams& audioParams)
	{
		*this = audioParams;
	}

	AudioParams& operator=(const AudioParams& audioParams)
	{
		this->sampleRate = audioParams.sampleRate;
		this->channels = audioParams.channels;
		this->fmt = audioParams.fmt;
		this->bitRate = audioParams.bitRate;
		this->id = audioParams.id;
		this->channel_layout = audioParams.channel_layout;
		return *this;
	}
};

class IEncode
{

public:

	explicit IEncode();

	virtual int init() = 0;
	int inputData(uint8_t* data, size_t size);
	int getNextOutPacketData(bool &hasData);

	int getBufSize() const;
	AudioParams getAudioParams()const;

	virtual ~IEncode();

protected:

	AudioParams audioParams;
	AVCodec* codec;
	AVCodecContext* ctx;
	AVFrame *frame;
	void *samples;
	int bufferSize;
	AVPacket avpkt;

	AVStream *out_stream;

	void setFrameParam(AVFrame *frame, AVCodecContext* ctx);

	virtual void release() = 0;
	virtual int writeFrame(AVPacket avpkt) = 0;
};


#endif // !_IEncode_H

#ifndef _IEncode_MEM_H
#define _IEncode_MEM_H

#include "IEncode.h"

class IEncode_mem : public IEncode
{

public:

	typedef void(*writeOutDataFunc)(void *opaque, uint8_t *buf, int buf_size);

public:

	explicit IEncode_mem();

	int init() override;

	void setAudioParams(const AudioParams& audioParams);
	void setWritePacketFuncCB(writeOutDataFunc func);
	void setOutputObj(void *outObj);

	~IEncode_mem();

private:

	void* outObj;
	writeOutDataFunc writeData;

	int checkParams()const;
	int checkCodec(AVCodecID id)const;
	int checkSampleFmt(AVCodec *codec, enum AVSampleFormat sample_fmt)const;
	int writeFrame(AVPacket avpkt) override;
	void release() override;
};


#endif // !_IEncode_MEM_H

#ifndef _IEncode_URL_H
#define _IEncode_URL_H

#include "IEncode.h"
#include <string>

class IEncode_url : public IEncode
{

public:

	explicit IEncode_url();

	int init() override;
	void setUrl(const std::string& url);

	~IEncode_url();

private:

	AVOutputFormat *ofmt;
	AVFormatContext *ofmtCtx;
	AVFormatContext *ifmtCtx;

	std::string url;
	int frameIndex;
	AVRational time_base1;

private:

	void timeOffset(AVPacket& pkt);
	void close();
	void release() override;
	int writeFrame(AVPacket avpkt) override;
};

#endif // !_IEncode_URL_H

#include "IEncode.h"
#include "error.h"
#include "log.h"

IEncode::IEncode() :
	codec(nullptr), ctx(nullptr),
	samples(nullptr), bufferSize(0),
	frame(nullptr), out_stream(nullptr)
{

}

IEncode::~IEncode()
{
	codec = nullptr;
	ctx = nullptr;
	samples = nullptr;
	frame = nullptr;
	bufferSize = 0;
}

void IEncode::setFrameParam(AVFrame *frame, AVCodecContext* ctx)
{
	frame->nb_samples = ctx->frame_size;
	frame->format = ctx->sample_fmt;
	frame->channel_layout = ctx->channel_layout;
}

int IEncode::getBufSize() const
{
	return bufferSize;
}

int IEncode::inputData(uint8_t* data, size_t size)
{
	if (data == nullptr)
		return Error::ERROR_INPUT_NULL_DATA;

	int got_output = 0;
	av_init_packet(&avpkt);
	avpkt.data = NULL;
	avpkt.size = 0;

	memcpy(samples, data, size);

	int ret = avcodec_encode_audio2(ctx, &avpkt, frame, &got_output);

	if (ret < 0)
	{
		release();
		return Error::ERROR_ENCODEING_FRAME;
	}

	if (got_output)
	{
		Error error = Error::ERROR_NONE;
		if (writeFrame(avpkt) < 0)
		{
			error = Error::ERROR_WRITE_FRAME;
		}
		av_packet_unref(&avpkt);
		return error;
	}
	return Error::ERROR_NONE;
}

int IEncode::getNextOutPacketData(bool &hasData)
{
	int count = 0;
	hasData = false;
	int fog_frame = 0;

	int ret = avcodec_encode_audio2(ctx, &avpkt, nullptr, &fog_frame);
	if (ret < 0)
	{
		release();
		hasData = false;
		return Error::ERROR_ENCODEING_FRAME;
	}
	if (fog_frame)
	{
		Error error = Error::ERROR_NONE;
		hasData = true;
		if (writeFrame(avpkt) < 0) 
		{
			error = Error::ERROR_WRITE_FRAME;
		}
		av_packet_unref(&avpkt);
		return error;
	}

	return Error::ERROR_NONE;
}

AudioParams IEncode::getAudioParams()const
{
	return audioParams;
}

#include "IEncode_mem.h"
#include "error.h"
#include "log.h"

IEncode_mem::IEncode_mem():
	outObj(nullptr), writeData(nullptr)
{
}

IEncode_mem::~IEncode_mem()
{
	release();
}

int IEncode_mem::init()
{
	Error error = (Error)checkParams();
	if (Error::ERROR_NONE != error)
		return error;

	codec = avcodec_find_encoder(audioParams.id);
	if (!codec)
		return Error::ERROR_NO_CODEC_SUPPORT;

	ctx = avcodec_alloc_context3(codec);
	if (!ctx)
		return Error::ERROR_AVCODEC_CONTEXT;

	ctx->bit_rate = audioParams.bitRate;
	ctx->sample_fmt = audioParams.fmt;
	ctx->sample_rate = audioParams.sampleRate;
	ctx->channels = audioParams.channels;
	ctx->channel_layout = audioParams.channel_layout;

	if (avcodec_open2(ctx, codec, NULL) < 0)
		return Error::ERROR_OPEN_CODEC;

	frame = av_frame_alloc();
	if (!frame)
	{
		avcodec_close(ctx);
		av_free(ctx);
		return Error::ERROR_FRAME_ALLOCATE;
	}

	setFrameParam(frame, ctx);

	bufferSize = av_samples_get_buffer_size(
		NULL,
		ctx->channels,
		ctx->frame_size,
		ctx->sample_fmt,
		0
	);

	if (bufferSize < 0)
	{
		av_frame_free(&frame);
		avcodec_close(ctx);
		av_free(ctx);
		return Error::ERROR_CANT_GET_BUFF_SIZE;
	}

	samples = av_malloc(bufferSize);
	if (!samples)
	{
		av_frame_free(&frame);
		avcodec_close(ctx);
		av_free(ctx);
		return Error::ERROR_ALLOCATE_SAMPLES_BUF;
	}

	int ret = avcodec_fill_audio_frame(frame, ctx->channels, ctx->sample_fmt,
		(const uint8_t*)samples, bufferSize, 0);
	if (ret < 0)
	{
		release();
		return Error::ERROR_SETUP_FRAME;
	}

	return Error::ERROR_NONE;
}

int IEncode_mem::writeFrame(AVPacket avpkt)
{
	if (writeData)
		writeData(outObj, avpkt.data, avpkt.size);
	return 0;
}

void IEncode_mem::setWritePacketFuncCB(writeOutDataFunc func)
{
	this->writeData = func;
}

void IEncode_mem::setOutputObj(void *outObj)
{
	this->outObj = outObj;
}

void IEncode_mem::setAudioParams(const AudioParams& audioParams)
{
	this->audioParams = audioParams;
}

int IEncode_mem::checkParams() const
{
	Error error = (Error)checkCodec(audioParams.id);
	if (Error::ERROR_NONE != error)
		return error;
	error = (Error)checkSampleFmt(avcodec_find_encoder(audioParams.id), audioParams.fmt);
	if (Error::ERROR_NONE != error)
		return error;
	return error;
}

int IEncode_mem::checkCodec(AVCodecID id)const
{
	AVCodec *codec = avcodec_find_encoder(id);
	if (!codec)
	{
		return Error::ERROR_NO_CODEC_SUPPORT;
	}
	return Error::ERROR_NONE;
}

int IEncode_mem::checkSampleFmt(AVCodec *codec, enum AVSampleFormat sample_fmt)const
{
	const enum AVSampleFormat *p = codec->sample_fmts;
	while (*p != AV_SAMPLE_FMT_NONE)
	{
		if (*p == sample_fmt)
			return Error::ERROR_NONE;
		p++;
	}
	return Error::ERROR_SAMPLEFMT;
}


void IEncode_mem::release()
{
	if (samples)
		av_freep(&samples);
	if (frame)
		av_frame_free(&frame);
	if (ctx)
	{
		avcodec_close(ctx);
		av_free(ctx);
	}
}

#include "IEncode_url.h"
#include "error.h"
#include "log.h"

IEncode_url::IEncode_url() :
	url(""),frameIndex(0),
	ofmt(nullptr), ofmtCtx(nullptr), ifmtCtx(nullptr)
{

}

IEncode_url::~IEncode_url()
{
	close();
	frameIndex = 0;
}

int IEncode_url::init()
{
	int ret = 0;

	ret = avformat_open_input(&ifmtCtx, url.c_str(), nullptr, nullptr);
	if (ret < 0)
	{
		ifmtCtx = nullptr;
		return Error::ERROR_FORMAT_OPEN_INPUT;
	}

	if (0 > avformat_alloc_output_context2(&ofmtCtx, nullptr, nullptr, url.c_str()))
	{
		release();
		return Error::ERROR_ENCODE_URL;
	}

	ofmt = ofmtCtx->oformat;

	AVStream *in_stream = nullptr;
	for (unsigned int i = 0; i < ifmtCtx->nb_streams; i++)
	{

		in_stream = ifmtCtx->streams[i];

		audioParams.sampleRate = in_stream->codecpar->sample_rate;
		audioParams.bitRate = in_stream->codecpar->bit_rate;
		audioParams.fmt = AV_SAMPLE_FMT_FLTP;
		audioParams.id = in_stream->codecpar->codec_id;
		audioParams.channels = in_stream->codecpar->channels;
		time_base1 = in_stream->time_base;
		out_stream = avformat_new_stream(ofmtCtx, in_stream->codec->codec);
		if (!out_stream)
		{
			release();
			return Error::ERROR_ALLOCATE_STREAM;
		}
		ret = avcodec_copy_context(out_stream->codec, in_stream->codec);
		if (ret < 0)
		{
			release();
			return Error::ERROR_COPY_CONTEXT;
		}
		out_stream->codec->codec_tag = 0;
		if (ofmtCtx->oformat->flags & AVFMT_GLOBALHEADER)
			out_stream->codec->flags |= CODEC_FLAG_GLOBAL_HEADER;
	}
	ctx = out_stream->codec;
	avformat_close_input(&ifmtCtx);

	if (!(ofmt->flags & AVFMT_NOFILE))
	{
		ret = avio_open(&ofmtCtx->pb, url.c_str(), AVIO_FLAG_WRITE);
		if (ret < 0)
		{
			release();
			return Error::ERROR_AVIO_OPEN;
		}
	}

	avformat_write_header(ofmtCtx, nullptr);

	ctx->sample_fmt = AV_SAMPLE_FMT_FLTP;
	codec = avcodec_find_encoder((AVCodecID)audioParams.id);
	av_opt_set(ctx->priv_data, "tune", "zerolatency", 0);

	if (!codec)
	{
		release();
		return Error::ERROR_NO_CODEC_SUPPORT;
	}
	if (avcodec_open2(ctx, codec, NULL) < 0)
	{
		release();
		return Error::ERROR_OPEN_CODEC;
	}

	frame = av_frame_alloc();
	if (!frame)
	{
		release();
		return Error::ERROR_FRAME_ALLOCATE;
	}

	setFrameParam(frame, ctx);

	bufferSize = av_samples_get_buffer_size(
		NULL,
		ctx->channels,
		ctx->frame_size,
		ctx->sample_fmt,
		0
	);

	if (bufferSize < 0)
	{
		release();
		return Error::ERROR_CANT_GET_BUFF_SIZE;
	}

	samples = av_malloc(bufferSize);
	if (!samples)
	{
		release();
		return Error::ERROR_ALLOCATE_SAMPLES_BUF;
	}

	ret = avcodec_fill_audio_frame(frame, ctx->channels, ctx->sample_fmt,
		(const uint8_t*)samples, bufferSize, 0);
	if (ret < 0)
	{
		release();
		return Error::ERROR_SETUP_FRAME;
	}

	return Error::ERROR_NONE;
}

int IEncode_url::writeFrame(AVPacket avpkt)
{
	timeOffset(avpkt);
	return av_write_frame(ofmtCtx, &avpkt);
}

void IEncode_url::setUrl(const std::string& url)
{
	this->url = url;
}

void IEncode_url::timeOffset(AVPacket& avpkt)
{	
	avpkt.pts = av_rescale_q((frameIndex++)*frame->nb_samples, AVRational{ 1, ctx->sample_rate }, ctx->time_base);
	avpkt.dts = avpkt.pts;
	avpkt.pos = -1;
}

void IEncode_url::close()
{
	if (ofmtCtx)
	{
		av_write_trailer(ofmtCtx);
	}
	release();
}

void IEncode_url::release()
{
	if (ifmtCtx)
	{
		avformat_close_input(&ifmtCtx);
	}
	if (ofmtCtx)
	{
		avformat_close_input(&ofmtCtx);
	}
	if (samples)
	{
		av_freep(&samples);
	}
	if (frame)
	{
		av_frame_free(&frame);
	}
}

這裡我做了去掉延遲的處理：

av_opt_set(ctx->priv_data, "tune", "zerolatency", 0);

ffmpeg-音訊編碼

簡單記錄一下個人做語音聊天時使用的ffmpeg音訊編碼。我們可以 1.使用ffmpeg將PCM編碼得到想要的格式的資料輸出到記憶體中，然後自己實現流媒體協議或者使用自己的RPC。 2.使用ffmpeg的avio_open直接推流,ffmpeg幫我們實現了http rtm

最簡單的基於FFMPEG的音訊編碼器（PCM編碼為AAC

本文介紹一個最簡單的基於FFMPEG的音訊編碼器。該編碼器實現了PCM音訊取樣資料編碼為AAC的壓縮編碼資料。編碼器程式碼十分簡單，但是每一行程式碼都很重要。通過看本編碼器的原始碼，可以瞭解FFMPEG音訊編碼的流程。本程式使用最新版的類庫（編譯時間為2014.5.6），開發平

ffmpeg的那點小事兒--編譯ffmpeg同時支援libx264（視訊編碼）和libfdk（音訊編碼）

ffmpeg的那點小事兒--編譯ffmpeg同時支援libx264（視訊編碼）和libfdk（音訊編碼）主要是shell指令碼編寫上的問題，直接上指令碼程式碼 #!/bin/bash #1、首先：定義下載的庫名稱 source="ffmpeg-4.0.2" #2、其次：定義".h/

基於FFMPEG的音訊編碼器

編碼模組編碼模組是編碼存放在FIFO中的資料，然後udp輸出，具體的資料流向圖如下：編碼模組資料流向圖編碼前，為32位雙聲道48KHz的PCM資料，因為ffmpeg MP2編碼器所支援的PCM資料為16位，所以需要PCM重取樣。

ffmpeg實時編碼解碼部分代碼

分代 pac rgb ng- cte qpi truct tcp conn 程序分為編碼端和解碼端，兩端通過tcp socket通信，編碼端一邊編碼一邊將編碼後的數據發送給解碼端。解碼端一邊接收數據一邊將解碼得到的幀顯示出來。代碼中的編碼端編碼的是實時屏幕截圖

iOS音視訊—FFmepg基礎知識：命令列工具使用&封裝格式&視訊編碼音訊編碼資料瞭解&視訊畫素音訊取樣資料格式

iOS音視訊相關目錄 FFmepg基礎知識封裝格式 1、封裝格式：mp4、mov、flv、wmv等等… 2、作用：視訊流+音訊流按照格式進行儲存在一個檔案中 3、MPEG2-TS格式：傳輸流，又稱TS、TP、MPEG-TS或M2T，用於音效、影象與資料的通訊協議。屬於

(十四) x264視訊編碼、faac音訊編碼、rtmpdump推流

#include "hjcommon.hpp" #include "x264.h" #include "rtmp.h" #include "faac.h" extern "C" { #include "queue.h" } // video static x

STM32的音訊編碼與在PC端的解碼

STM32的音訊編碼與在PC端的解碼簡介 STM32F4移植編碼 PC移植解碼結尾簡介能看到這篇文章的基本上都是有迫切需求的人，話不多說，切入正題編解碼庫：Spee

關於人們感知與數字視音訊編碼的關係入門-視覺篇01.

眾所周知，視音訊的數字化是為惹方便人們更好地記錄視聽而被人們所折騰出來的一門技術。既然主要是為惹人們而服務的，在我們的探究過程中就水到渠成地首先偏向於貼合人們所設計惹。本文主要是從生理角度上淺談一下人們與數字視音訊編碼的關係w。針對人類視覺系統，我們可以從光學、色度學、視覺生

android平臺下音訊編碼之編譯LAME庫轉碼PCM為MP3

ffmpeg實踐學習目錄音訊概述一般來說音訊的裸資料格式就是脈衝編碼調製(PCM)資料。描述一段PCM資料一般需要以下幾個概念：量化格式(sampleFormat)、取樣率(sampleRate)、聲道數(channel)。以CD的音質為例：量化格式為

FFmpeg 264編碼示例

示例程式碼： encoder_work::encoder_work() { mWidth = 0; mHeight = 0; mFPS = 0; mYSize = 0; mUVSize = 0; mPTS = 0; mFmtCtx = NULL;

新版ffmpeg PCM編碼到AAC，swr_convert轉換取樣精度，稍微修改相容PCM編碼為G711A及MP3，記錄下。

#include "stdafx.h" #include <stdio.h> #include <iostream> using namespace std; extern "C" { #include "libavformat/avformat.h" #incl

Opus 音訊編碼正式標準化

轉載自:http://linuxtoy.org/archives/opus-accepted-as-a-new-standard-audio-codec.html Opus 由 Mozilla 和 Xiph.org 主導開發，得到了 Skype 和 Broadcom 的幫助。它完美融合了 Skype 的

各種音訊編碼方式的對比

內容簡介：文章介紹了PCM編碼、WMA編碼、ADPCM編碼、LPC編碼、MP3編碼、AAC編碼、CELP編碼等，包括優缺點對比和主要應用領域。 PCM編碼(原始數字音訊訊號流) 型別：Audio 制定者：ITU-T 所需頻寬：1411.2 Kbps 特性：音源資訊完整，

（轉載）有關音訊編碼的知識與技術引數

自然界中的聲音非常複雜，波形極其複雜，通常我們採用的是脈衝程式碼調製編碼，即PCM編碼。PCM通過抽樣、量化、編碼三個步驟將連續變化的模擬訊號轉換為數字編碼。1、什麼是取樣率和取樣大小（位/bit）？　　聲音其實是一種能量波，因此也有頻率和振幅的特徵，頻率對應於時間軸線，振幅對應於電平軸線。波是無限光滑的，絃

音訊編碼技術G.729與G.711

VoIP中G.729與G.711的部分資料由於用上了VoIP閘道器裝置，在設定介面裡關於語音壓縮的設定裡有5種標準可選，分別是G.711-uLaw、G.711-aLaw、G.723-53k、G.723-63k、G729，G.711和G.729是企業VoIP部署中非常流行的兩種編解碼器。與通過G.729編

ffmpeg音訊濾鏡

音訊濾鏡分離聲道1 轉碼（原始檔沒問題可以省略） ffmpeg -i jy.ts -vcodec h264 -acodec aac jy1.ts2 取一個聲道 ffmpeg -i jy1.ts -af "pan=stereo|c0=FL|c1=FL" -c:v copy

G711 G729音訊編碼總結

g723.1頻寬5.3k或6.3kbit/s，g729是8kbit/s,比g729略低，但是噪音要比g729大一些,並且演算法延遲是g729的2倍多g711頻寬64kbit，但是演算法延遲為0。因為G711來說比較簡單，在有線環境下使用也沒什麼大問題，但是在小頻寬下G729是不錯的選擇。

AMR音訊編碼器概述及檔案格式分析

全稱Adaptive Multi-Rate，自適應多速率編碼，主要用於移動裝置的音訊，壓縮比比較大，但相對其他的壓縮格式質量比較差，由於多用於人聲，通話，效果還是很不錯的。AMR-WB應用於EDGE、3G可充分體現其優勢。足夠的傳輸頻寬保證AMR-WB可採用從6.6kb/s到23.85kb/s共九種編網

ffmpeg 音訊轉amr

其編譯方法； chmod 755 opencore-amr-0.1.3.tar.gz //改變檔案操作許可權 tar -xzvf opencore-amr-0.1.3.tar.gz //解壓檔案 cd openco

ffmpeg-音訊編碼

相關推薦