1. 程式人生 > >視訊編解碼概念:時間戳DTS和PTS的相關分析

視訊編解碼概念:時間戳DTS和PTS的相關分析

基本概念:

I frame :幀內編碼幀 又稱intra picture,I 幀通常是每個 GOP(MPEG 所使用的一種視訊壓縮技術)的第一個幀,經過適度地壓縮,做為隨機訪問的參考點,可以當成圖象。I幀可以看成是一個影象經過壓縮後的產物。

P frame: 前向預測編碼幀 又稱predictive-frame,通過充分將低於影象序列中前面已編碼幀的時間冗餘資訊來壓縮傳輸資料量的編碼影象,也叫預測幀;

B frame: 雙向預測內插編碼幀 又稱bi-directional interpolated prediction frame,既考慮與源影象序列前面已編碼幀,也顧及源影象序列後面已編碼幀之間的時間冗餘資訊來壓縮傳輸資料量的編碼影象,也叫雙向預測幀;

PTS:Presentation Time Stamp。PTS主要用於度量解碼後的視訊幀什麼時候被顯示出來

DTS:Decode Time Stamp。DTS主要是標識讀入記憶體中的bit流在什麼時候開始送入解碼器中進行解碼。

在沒有B幀存在的情況下DTS的順序和PTS的順序應該是一樣的。

IPB幀的不同:

I frame:自身可以通過視訊解壓演算法解壓成一張單獨的完整的圖片。

P frame:需要參考其前面的一個I frame 或者B frame來生成一張完整的圖片。

B frame:則要參考其前一個I或者P幀及其後面的一個P幀來生成一張完整的圖片。

兩個I frame之間形成一個GOP,在x264中同時可以通過引數來設定bf的大小,即:I 和p或者兩個P之間B的數量。

通過上述基本可以說明如果有B frame 存在的情況下一個GOP的最後一個frame一定是P.

DTS和PTS的不同:

DTS主要用於視訊的解碼,在解碼階段使用.PTS主要用於視訊的同步和輸出.在display的時候使用.在沒有B frame的情況下.DTS和PTS的輸出順序是一樣的.

例子:

下面給出一個GOP為15的例子,其解碼的參照frame及其解碼的順序都在裡面:

如上圖:I frame 的解碼不依賴於任何的其它的幀.而p frame的解碼則依賴於其前面的I frame或者P frame.B frame的解碼則依賴於其前的最近的一個I frame或者P frame 及其後的最近的一個P frame.


FFmpeg裡有兩種時間戳:DTS(Decoding Time Stamp)和PTS(Presentation Time Stamp)。 顧名思義,前者是解碼的時間,後者是顯示的時間。要仔細理解這兩個概念,需要先了解FFmpeg中的packet和frame的概念。

FFmpeg中用AVPacket結構體來描述解碼前或編碼後的壓縮包,用AVFrame結構體來描述解碼後或編碼前的訊號幀。 對於視訊來說,AVFrame就是視訊的一幀影象。這幀影象什麼時候顯示給使用者,就取決於它的PTS。DTS是AVPacket裡的一個成員,表示這個壓縮包應該什麼時候被解碼。 如果視訊裡各幀的編碼是按輸入順序(也就是顯示順序)依次進行的,那麼解碼和顯示時間應該是一致的。可事實上,在大多數編解碼標準(如H.264或HEVC)中,編碼順序和輸入順序並不一致。 於是才會需要PTS和DTS這兩種不同的時間戳。

PTS - Presentation Timestamp,播放的時間戳。

DTS - Decompress Timestamp, 解碼的時間戳。

這2個概念經常出現在音訊視訊編碼和播放中,其實際意義是,PTS是真正錄製和播放的時間戳,而DTS是解碼的時間戳。對於普通的無B幀視訊(H264 Baseline或者VP8),PTS/DTS應該是相等的,因為沒有延遲編碼。對於有B幀的視訊,I幀的PTS依然等於DTS, P幀的PTS>DTS, B楨的PTS<DTS。PTS/DTS的初始值,一般來源於錄製的視訊的頻率,按照h264的設定是90HZ, 所以PTS/DTS到毫秒的轉換公式是:
ms=pts/90.對於需要以ms為單位的視訊播放器(比如Flash Player),按照pts/90轉換到ms就可以正常播放了。


--------------------- 
作者:SoaringLee_fighting 
來源:CSDN 
原文:https://blog.csdn.net/SoaringLee_fighting/article/details/70941896 
版權宣告:本文為博主原創文章,轉載請附上博文連結!