1. 程式人生 > >變換編碼的一些概念理解

變換編碼的一些概念理解

影象變換編碼是指將以空間域中畫素形式描述的影象轉換至變換域,以變換系數的形式加以表示。

大部分影象是平坦區域和內容變換緩慢的區域,即大部分是直流和低頻,高頻比較少,所以適當的變換可以使影象能量在空間域的分散分佈轉換為在變換域的相對集中分佈,以達到去除冗餘的目的,結合量化,“z”掃描和熵編碼等其他編碼技術,可以獲得對影象資訊的有效壓縮。

DCT變換的基本思路是將影象分解為8×8的子塊或16×16的子塊,並對每一個子塊進行單獨的DCT變換,然後對變換結果進行量化、編碼。隨著子塊尺寸的增加,演算法的複雜度急劇上升,因此,實用中通常採用8×8的子塊進行變換,但採用較大的子塊可以明顯減少影象分塊效應。

目前DCT是構成主流緩和編碼框架的一項基本技術,因為DCT變換形式與輸入訊號無關且存在快速實現演算法,HEVC沿用了H264的整數DCT,並進行了不同尺寸變換形式推廣,此外,為適應不同預測方式下殘差的分佈情況,HEVC還引入了DST離散正弦變換。

傅立葉變換表明,任何訊號都能表示為多個不同振幅和頻率的正弦波和餘弦波訊號的疊加,如果採用的是餘弦就是餘弦變換,若輸入訊號是離散的就是離散餘弦變換。

下圖給出了二維8*8DCT基影象,其中左上角小影象表示水平和垂直空間頻率均為0時的基影象,在任一方向都木有灰度值的變化;其餘小影象分別對應於不同水平和垂直空間頻率的基影象,如基影象右下角小影象對應於最高的水平和垂直頻率,這裡畫素灰度在水平和垂直方向發生連續變化,so,離散餘弦變換可以解釋為:將任一8*8畫素塊表示為下圖的64個基影象的加權和,其權值即為對應位置的DCT係數。

HEVC使用了4種不同尺寸的整數DCT,分別為4*4、8*8、16*16、32*32