1. 程式人生 > >音視頻處理之基礎知識20180131

音視頻處理之基礎知識20180131

基礎知識 歌曲 audit 運動 紅色 精度 分辨率 通道 blog

1.視頻播放器的原理
編碼好的音視頻流叫碼流
2.信息查看工具

3.封裝格式
1).MPEG2_TS格式
沒有文件頭,文件損壞一部分也能播放
2).FLV格式
包含文件頭,文件丟掉了頭部或者說文件損壞了就不能播放
4.視頻編碼數據
視頻編碼的作用
將視頻像素數據(RGB,YUV等)壓縮成為視頻碼流,從而降低視頻的數據量
視頻編碼分析工具
Elecard Stream Eye查看視頻編碼格式(也叫碼流分析工具,可分析h264)
紅色的表示I幀,藍色的表示P幀,綠色的表示B幀,方塊表示宏塊的劃分方式,劃分為16x16的小塊,每塊都有不同的類型(用不同的顏色標識)
左側坐標表示數據量
I幀不依賴其他的幀,只壓縮當前畫面的數據。
P幀只會存和紅色框(運動矢量)不一樣的信息,和前面I幀不一樣的信息。
B幀還會存和綠色框(運動矢量,和後面不一樣的)不一樣的信息,會參考前後的幀

H264格式簡介
數據由大小不固定的NALU構成
最常見的情況下,1個NALU存儲了1幀畫面的壓縮編碼後的數據。

5.音頻編碼數據
將音頻采樣數據(pcm等)壓縮成為音頻碼流,從而降低音頻的數據量

aac格式
類似h264的地位,目前大多數都是使用aac格式

6.視頻像素數據
最為常用的是YUV420,YUV格式像素數據查看工具yuv player
ps:BMP文件中存儲的就是RGB格式的像素數據。
YUV格式簡介
相關實驗表明,人眼堆亮度銘感但對色度不敏感。所以可以將亮度信息和色度信息分離,
並堆色度信息采用更狠一點的壓縮方案,從而提高壓縮效率。也就是說YUV格式的像素數據
也是壓縮的。
YUV格式中,Y只包含亮度信息,而UV只包含色度信息。
以YUV420P為例,首先存儲了整張圖像的Y信息,然後存儲整張圖像的U信息(數據量只有Y的一半)
,最後存儲了整張圖像的V信息(數據量只有Y的一半)
YUV格式沒有保持文件頭信息,也就是沒有保持寬,高等信息,所以需要自己配置才能正常播放

7.音頻采樣數據
保存了音頻中每個采樣點的值。
假定采樣率為44100HZ(1s采樣44100次,絕大多數用這個采樣率,由人耳所能聽到頻率的音取兩倍,為何取兩倍由抽樣定理得到 防止混疊效應),采樣精度為16bit(一個采樣值大小),左右聲道(立體聲,2倍數據)
則一首4分鐘的PCM格式(采樣數據,完全無損)的歌曲體積為:
4*60*44100*2*2=42.3MB

音頻采樣數據查看工具:Adobe Audition
采樣數據,即PCM格式數據,同樣沒有文件頭信息,所以同樣需要設置采樣率,分辨率(采樣精度),通道等信息

PCM格式簡介
單聲道的情況下按照順序存儲每個采樣點的數據。
雙聲道的情況下按照左右,左右的順序存儲每個采樣點兩個聲道的數據
pcm格式其實就是由一個個幅值不同的采樣點組成,而一個采樣點放大來看就是一個方波。

音視頻處理之基礎知識20180131