視音訊資料處理入門:AAC音訊碼流解析
=====================================================
視音訊資料處理入門系列文章:
=====================================================
本文繼續上一篇文章的內容,介紹一個音訊碼流處理程式。音訊碼流在視訊播放器中的位置如下所示。
本文中的程式是一個AAC碼流解析程式。該程式可以從AAC碼流中分析得到它的基本單元ADTS frame,並且可以簡單解析ADTS frame首部的欄位。通過修改該程式可以實現不同的AAC碼流處理功能。
原理
AAC原始碼流(又稱為“裸流”)是由一個一個的ADTS frame組成的。他們的結構如下圖所示。
程式碼
整個程式位於simplest_aac_parser()函式中,如下所示。/** * 最簡單的視音訊資料處理示例 * Simplest MediaData Test * * 雷霄驊 Lei Xiaohua * [email protected] * 中國傳媒大學/數字電視技術 * Communication University of China / Digital TV Technology * http://blog.csdn.net/leixiaohua1020 * * 本專案包含如下幾種視音訊測試示例: * (1)畫素資料處理程式。包含RGB和YUV畫素格式處理的函式。 * (2)音訊取樣資料處理程式。包含PCM音訊取樣格式處理的函式。 * (3)H.264碼流分析程式。可以分離並解析NALU。 * (4)AAC碼流分析程式。可以分離並解析ADTS幀。 * (5)FLV封裝格式分析程式。可以將FLV中的MP3音訊碼流分離出來。 * (6)UDP-RTP協議分析程式。可以將分析UDP/RTP/MPEG-TS資料包。 * * This project contains following samples to handling multimedia data: * (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data. * (2) Audio sample data handling program. It contains several examples to handle PCM data. * (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream. * (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream. * (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream. * (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet. * */ #include <stdio.h> #include <stdlib.h> #include <string.h> int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size){ int size = 0; if(!buffer || !data || !data_size ){ return -1; } while(1){ if(buf_size < 7 ){ return -1; } //Sync words if((buffer[0] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) ){ size |= ((buffer[3] & 0x03) <<11); //high 2 bit size |= buffer[4]<<3; //middle 8 bit size |= ((buffer[5] & 0xe0)>>5); //low 3bit break; } --buf_size; ++buffer; } if(buf_size < size){ return 1; } memcpy(data, buffer, size); *data_size = size; return 0; } int simplest_aac_parser(char *url) { int data_size = 0; int size = 0; int cnt=0; int offset=0; //FILE *myout=fopen("output_log.txt","wb+"); FILE *myout=stdout; unsigned char *aacframe=(unsigned char *)malloc(1024*5); unsigned char *aacbuffer=(unsigned char *)malloc(1024*1024); FILE *ifile = fopen(url, "rb"); if(!ifile){ printf("Open file error"); return -1; } printf("-----+- ADTS Frame Table -+------+\n"); printf(" NUM | Profile | Frequency| Size |\n"); printf("-----+---------+----------+------+\n"); while(!feof(ifile)){ data_size = fread(aacbuffer+offset, 1, 1024*1024-offset, ifile); unsigned char* input_data = aacbuffer; while(1) { int ret=getADTSframe(input_data, data_size, aacframe, &size); if(ret==-1){ break; }else if(ret==1){ memcpy(aacbuffer,input_data,data_size); offset=data_size; break; } char profile_str[10]={0}; char frequence_str[10]={0}; unsigned char profile=aacframe[2]&0xC0; profile=profile>>6; switch(profile){ case 0: sprintf(profile_str,"Main");break; case 1: sprintf(profile_str,"LC");break; case 2: sprintf(profile_str,"SSR");break; default:sprintf(profile_str,"unknown");break; } unsigned char sampling_frequency_index=aacframe[2]&0x3C; sampling_frequency_index=sampling_frequency_index>>2; switch(sampling_frequency_index){ case 0: sprintf(frequence_str,"96000Hz");break; case 1: sprintf(frequence_str,"88200Hz");break; case 2: sprintf(frequence_str,"64000Hz");break; case 3: sprintf(frequence_str,"48000Hz");break; case 4: sprintf(frequence_str,"44100Hz");break; case 5: sprintf(frequence_str,"32000Hz");break; case 6: sprintf(frequence_str,"24000Hz");break; case 7: sprintf(frequence_str,"22050Hz");break; case 8: sprintf(frequence_str,"16000Hz");break; case 9: sprintf(frequence_str,"12000Hz");break; case 10: sprintf(frequence_str,"11025Hz");break; case 11: sprintf(frequence_str,"8000Hz");break; default:sprintf(frequence_str,"unknown");break; } fprintf(myout,"%5d| %8s| %8s| %5d|\n",cnt,profile_str ,frequence_str,size); data_size -= size; input_data += size; cnt++; } } fclose(ifile); free(aacbuffer); free(aacframe); return 0; }
上文中的函式呼叫方法如下所示。
simplest_aac_parser("nocturne.aac");
結果
本程式的輸入為一個AAC原始碼流(裸流)的檔案路徑,輸出為該碼流中ADTS frame的統計資料,如下圖所示。下載
Simplest mediadata test
專案主頁
開源中國:http://git.oschina.net/leixiaohua1020/simplest_mediadata_test
CSDN下載地址:http://download.csdn.net/detail/leixiaohua1020/9422409
本專案包含如下幾種視音訊資料解析示例:
(1)畫素資料處理程式。包含RGB和YUV畫素格式處理的函式。
(2)音訊取樣資料處理程式。包含PCM音訊取樣格式處理的函式。
(3)H.264碼流分析程式。可以分離並解析NALU。
(4)AAC碼流分析程式。可以分離並解析ADTS幀。
(5)FLV封裝格式分析程式。可以將FLV中的MP3音訊碼流分離出來。
(6)UDP-RTP協議分析程式。可以將分析UDP/RTP/MPEG-TS資料包。
雷霄驊 (Lei Xiaohua)
http://blog.csdn.net/leixiaohua1020
相關推薦
視音訊資料處理入門:AAC音訊碼流解析
=====================================================視音訊資料處理入門系列文章:=====================================================本文繼續上一篇文章的內容,介紹一個音
視音訊資料處理入門:PCM音訊取樣資料處理
=====================================================視音訊資料處理入門系列文章:=====================================================上一篇文章記錄了RGB/YUV視訊畫素
視音訊資料處理入門:UDP-RTP協議解析
=====================================================視音訊資料處理入門系列文章:=====================================================本文介紹網路協議資料的處理程式。網路
視音訊資料處理入門:FLV封裝格式解析
=====================================================視音訊資料處理入門系列文章:=====================================================前兩篇文章介紹了音訊碼流處理程式和視
視音訊資料處理入門 AAC音訊碼流解析
=====================================================視音訊資料處理入門系列文章:=====================================================本文繼續上一篇文章的內容,介紹一個音訊
視音訊資料處理入門 FLV封裝格式解析
=====================================================視音訊資料處理入門系列文章:=====================================================前兩篇文章介紹了音訊碼流處理程式和視訊
視音頻數據處理入門:FLV封裝格式解析
tail rip 主頁 typedef gda ack print 地址 視頻 ===================================================== 視音頻數據處理入門系列文章: 視音頻數據處理入門:RGB、YUV像素數據處理 視音頻數
吳裕雄 資料探勘與分析案例實戰(4)——python資料處理工具:Pandas
# 匯入模組import pandas as pdimport numpy as np # 構造序列gdp1 = pd.Series([2.8,3.01,8.99,8.59,5.18])print(gdp1)# 取出gdp1中的第一、第四和第五個元素print('行號風格的序列:\n',gdp1[[0,3,
Python004-資料處理示例:以某個資料(欄位)為基準從資料中獲取不同的欄位行數
資料來源樣式如下所示: 需求: 讀取文字,以第一列為基準參考系,每個基準僅輸出滿足需要條數的資料;不滿足,全部輸出。 比如,基準為 6236683970000018780,輸出條數要求為 5。若文字中含有 6236683970000018780 多於
Linux ALSA音訊框架分析二:linux音訊子系統介紹
Phonon是KDE 4的多媒體API 。Phonon提供一個穩定的API允許KDE 4獨立於任何一個聲音系統伺服器如xine。Phonon讓各種後端提供介面給開發者所謂的"引擎";每個引擎運作在一個具體的後端。每個後端都可讓Phonon控制基本功能,如播放、暫停和搜尋。Phonon也支援更高層次的功能
資料處理不等式:Data Processing Inequality
我是在差分隱私下看到的,新解決方案的可用性肯定小於原有解決方案的可用性,也就是說資訊的後續處理只會降低所擁有的資訊量。 那麼如果這麼說的話為什麼還要做特徵工程呢,這是因為該不等式有一個巨大的前提就是資料處理方法無比的強大,比如很多的樣本要分類,我們做特徵提取後,SVM效果很好 ,但是如果用DNN之類
iOS音訊學習筆記一:常見音訊封裝格式及編碼格式
(1) pcm格式 pcm是經過話筒錄音後直接得到的未經壓縮的資料流 資料大小=取樣頻率*取樣位數*聲道*秒數/8 取樣頻率一般是22k或者44k,位數一般是8位或者16位,聲道一般是單聲道或者雙聲道 pcm屬於編碼格式,就是一串由多個樣本值組成的資料流, 本身沒有任何頭資
大規模資料處理利器:BloomFilter
#include <stdio.h>#include <stdlib.h>#include <string.h>unsigned int jshash(const char *s, unsigned size);unsigned int sdbmhash(const ch
Python空間資料處理2: GDAL柵格影象格式轉換
在《GDAL讀寫遙感影象》中,有提到了GDAL支援多種資料格式,那麼,如何對這些格式進行相互轉換呢? 這其實非常簡單,僅在寫影象時稍加修改即可。例如,當我需要將某種柵格影象轉換為img格式時,只需將《GDAL讀寫遙感影象》中的程式碼進行以下修改: 第42行
分散式資料處理框架:Apache Beam
1簡介 大資料時代中,資料從簡單的批處理,擴充套件到實時處理、流處理。起初的MapReduce處理模式早已獨木難支。此外,大資料處理技術也是百花齊放,如 HBase、Hive、Kafka、Spark、Flink 等,對開發者而言,想要將其全部熟練運用幾乎是一項不可能完成的任
Python空間資料處理1: GDAL讀寫遙感影象
GDAL是空間資料處理的開源包,支援多種資料格式的讀寫。遙感影象是一種帶大地座標的柵格資料,遙感影象的柵格模型包含以下兩部分的內容: 柵格矩陣:由正方形或者矩形柵格點組成,每個柵格點所對應的數值為該點的像元值,在遙感影象中用於表示地物屬性值;遙感影象有單波段與多波段,波段表
Spark(一)—— 大資料處理入門
一、Spark介紹 Apache Spark is a fast and general-purpose cluster computing system. It provides high-level APIs in Java, Scala, Python and R, and an optimized
IOS資料處理及版本特性-NSKeyedArchiver儲存和解析
建立一個繼承自物件的類可被序列化和反序列化,這樣的話就可以歸檔到磁碟中火網路中 import Foundation class UserModel: NSObject , NSCoding { var name:NSString! va
大資料處理系統都有哪些?(流式計算系統)
我們在上一篇文章中給大家介紹了批處理系統以及迭代計算系統。這兩種方法都是比較抽象的,我們在這篇文章中給大家介紹一種Facebook經常使用的流式計算系統,希望這篇文章能夠給大家帶來幫助。 流式計算系統就是因為流式計算具有很強的實時性,需要對應用源源不斷產生的資料實時進行處理,使資料不積壓、不丟失,常用於
C語言入門:將ASCII碼轉化為字元
#include “stdio.h” void main () { char c1; c1= 對應字元ASCII碼的十進位制的值,比如!就要在這裡輸33,左右不需要加括號引號; printf("%c ",c1); } 32以前的無法輸出是正常的 ASCII表