1. 程式人生 > >視音訊資料處理入門 AAC音訊碼流解析

視音訊資料處理入門 AAC音訊碼流解析

               

=====================================================

視音訊資料處理入門系列文章:

=====================================================

本文繼續上一篇文章的內容,介紹一個音訊碼流處理程式。音訊碼流在視訊播放器中的位置如下所示。

本文中的程式是一個AAC碼流解析程式。該程式可以從AAC碼流中分析得到它的基本單元ADTS frame,並且可以簡單解析ADTS frame首部的欄位。通過修改該程式可以實現不同的AAC碼流處理功能。

原理

AAC原始碼流(又稱為“裸流”)是由一個一個的ADTS frame組成的。他們的結構如下圖所示。

其中每個ADTS frame之間通過syncword(同步字)進行分隔。同步字為0xFFF(二進位制“111111111111”)。AAC碼流解析的步驟就是首先從碼流中搜索0x0FFF,分離出ADTS frame;然後再分析ADTS frame的首部各個欄位。本文的程式即實現了上述的兩個步驟。

程式碼

整個程式位於simplest_aac_parser()函式中,如下所示。
/** * 最簡單的視音訊資料處理示例 * Simplest MediaData Test * * 雷霄驊 Lei Xiaohua * [email protected] * 中國傳媒大學/數字電視技術 * Communication University of China / Digital TV Technology * http://blog.csdn.net/leixiaohua1020 * * 本專案包含如下幾種視音訊測試示例: *  (1)畫素資料處理程式。包含RGB和YUV畫素格式處理的函式。 *  (2)音訊取樣資料處理程式。包含PCM音訊取樣格式處理的函式。 *  (3)H.264碼流分析程式。可以分離並解析NALU。 *  (4)AAC碼流分析程式。可以分離並解析ADTS幀。 *  (5)FLV封裝格式分析程式。可以將FLV中的MP3音訊碼流分離出來。 *  (6)UDP-RTP協議分析程式。可以將分析UDP/RTP/MPEG-TS資料包。 * * This project contains following samples to handling multimedia data: *  (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data. *  (2) Audio sample data handling program. It contains several examples to handle PCM data. *  (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream. *  (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream. *  (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream. *  (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet. * */
#include <stdio.h>#include <stdlib.h>#include <string.h>int getADTSframe(unsigned char* buffer, int buf_size, unsigned char* data ,int* data_size)int size = 0if(!buffer || !data || !data_size ){  return -1; } while(1){  if(buf_size  < 7 ){   return -1;  }  //Sync words  if((buffer[0
] == 0xff) && ((buffer[1] & 0xf0) == 0xf0) ){   size |= ((buffer[3] & 0x03) <<11);     //high 2 bit   size |= buffer[4]<<3;                //middle 8 bit   size |= ((buffer[5] & 0xe0)>>5);        //low 3bit   break;  }  --buf_size;  ++buffer; } if(buf_size < size){  return 1; } memcpy(data, buffer, size); *data_size = size; return 0;}int simplest_aac_parser(char *url)int data_size = 0int size = 0int cnt=0int offset=0//FILE *myout=fopen("output_log.txt","wb+"); FILE *myout=stdoutunsigned char *aacframe=(unsigned char *)malloc(1024*5); unsigned char *aacbuffer=(unsigned char *)malloc(1024*1024); FILE *ifile = fopen(url, "rb"); if(!ifile){  printf("Open file error");  return -1; } printf("-----+- ADTS Frame Table -+------+\n"); printf(" NUM | Profile | Frequency| Size |\n"); printf("-----+---------+----------+------+\n"); while(!feof(ifile)){  data_size = fread(aacbuffer+offset, 1, 1024*1024-offset, ifile);  unsigned char* input_data = aacbuffer;  while(1)  {   int ret=getADTSframe(input_data, data_size, aacframe, &size);   if(ret==-1){    break;   }else if(ret==1){    memcpy(aacbuffer,input_data,data_size);    offset=data_size;    break;   }   char profile_str[10]={0};   char frequence_str[10]={0};   unsigned char profile=aacframe[2]&0xC0;   profile=profile>>6;   switch(profile){   case 0: sprintf(profile_str,"Main");break;   case 1: sprintf(profile_str,"LC");break;   case 2: sprintf(profile_str,"SSR");break;   default:sprintf(profile_str,"unknown");break;   }   unsigned char sampling_frequency_index=aacframe[2]&0x3C;   sampling_frequency_index=sampling_frequency_index>>2;   switch(sampling_frequency_index){   case 0: sprintf(frequence_str,"96000Hz");break;   case 1: sprintf(frequence_str,"88200Hz");break;   case 2: sprintf(frequence_str,"64000Hz");break;   case 3: sprintf(frequence_str,"48000Hz");break;   case 4: sprintf(frequence_str,"44100Hz");break;   case 5: sprintf(frequence_str,"32000Hz");break;   case 6: sprintf(frequence_str,"24000Hz");break;   case 7: sprintf(frequence_str,"22050Hz");break;   case 8: sprintf(frequence_str,"16000Hz");break;   case 9: sprintf(frequence_str,"12000Hz");break;   case 10: sprintf(frequence_str,"11025Hz");break;   case 11: sprintf(frequence_str,"8000Hz");break;   default:sprintf(frequence_str,"unknown");break;   }   fprintf(myout,"%5d| %8s|  %8s| %5d|\n",cnt,profile_str ,frequence_str,size);   data_size -= size;   input_data += size;   cnt++;  }    } fclose(ifile); free(aacbuffer); free(aacframe); return 0;}
上文中的函式呼叫方法如下所示。
simplest_aac_parser("nocturne.aac");

結果

本程式的輸入為一個AAC原始碼流(裸流)的檔案路徑,輸出為該碼流中ADTS frame的統計資料,如下圖所示。

下載

Simplest mediadata test

專案主頁開源中國:http://git.oschina.net/leixiaohua1020/simplest_mediadata_testCSDN下載地址:http://download.csdn.net/detail/leixiaohua1020/9422409本專案包含如下幾種視音訊資料解析示例: (1)畫素資料處理程式。包含RGB和YUV畫素格式處理的函式。 (2)音訊取樣資料處理程式。包含PCM音訊取樣格式處理的函式。 (3)H.264碼流分析程式。可以分離並解析NALU。 (4)AAC碼流分析程式。可以分離並解析ADTS幀。 (5)FLV封裝格式分析程式。可以將FLV中的MP3音訊碼流分離出來。 (6)UDP-RTP協議分析程式。可以將分析UDP/RTP/MPEG-TS資料包。雷霄驊 (Lei Xiaohua)[email protected]://blog.csdn.net/leixiaohua1020