1. 程式人生 > 其它 >深入探索視訊幀中的顏色空間—— RGB 和 YUV

深入探索視訊幀中的顏色空間—— RGB 和 YUV

接觸前端音視訊之後,需要掌握大量音視訊和多媒體相關的基礎知識。在使用 FFmpeg + WASM 進行視訊幀提取時,涉及到視訊幀和顏色編碼等相關概念。本文將對視訊幀中的顏色空間進行介紹。

視訊幀

​ 對於視訊,我們都知道是由一系列的畫面在一個較短的時間內(通常是 1/24 或 1/30 秒)不停地下一個畫面替換上一個畫面形成連貫的畫面變化。這些畫面稱之為視訊幀。

​ 對於視訊幀,在現代視訊技術裡面,通常都是用 RGB 顏色空間或者 YUV 顏色空間的畫素矩陣來表示。在 ffmpeg 裡面,我們可以看到原始碼libavutil/pixfmt.h中定義了一系列畫素格式,絕大部分都是 RGB 和 YUV 顏色空間型別的。

enum AVPixelFormat {
  // ... 省略部分不怎麼重要的型別
  ///< planar YUV 4:2:0, 12bpp, (1 Cr & Cb sample per 2x2 Y samples)
  AV_PIX_FMT_YUV420P,

  ///< packed YUV 4:2:2, 16bpp, Y0 Cb Y1 Cr
  AV_PIX_FMT_YUYV422,

  ///< planar YUV 4:2:2, 16bpp, (1 Cr & Cb sample per 2x1 Y samples)
  AV_PIX_FMT_YUV422P,

  ///< packed YUV 4:2:2, 16bpp, Cb Y0 Cr Y1
  AV_PIX_FMT_UYVY422,

  ///< planar YUV 4:4:4, 24bpp, (1 Cr & Cb sample per 1x1 Y samples)
  AV_PIX_FMT_YUV444P,

  ///< planar YUV 4:4:0 (1 Cr & Cb sample per 1x2 Y samples)
  AV_PIX_FMT_YUV440P,

  ///< packed RGB 8:8:8, 24bpp, RGBRGB...
  AV_PIX_FMT_RGB24,
  ///< packed RGB 8:8:8, 24bpp, BGRBGR...
  AV_PIX_FMT_BGR24,
  
  ///< packed ARGB 8:8:8:8, 32bpp, ARGBARGB...
  AV_PIX_FMT_ARGB,
  ///< packed RGBA 8:8:8:8, 32bpp, RGBARGBA...
  AV_PIX_FMT_RGBA,
  ///< packed ABGR 8:8:8:8, 32bpp, ABGRABGR...
  AV_PIX_FMT_ABGR,
  ///< packed BGRA 8:8:8:8, 32bpp, BGRABGRA...
  AV_PIX_FMT_BGRA,

  ///< packed RGB 5:6:5, 16bpp, (msb)   5R 6G 5B(lsb), big-endian
  AV_PIX_FMT_RGB565BE,
  ///< packed RGB 5:6:5, 16bpp, (msb)   5R 6G 5B(lsb), little-endian
  AV_PIX_FMT_RGB565LE,
  ///< packed RGB 5:5:5, 16bpp, (msb)1X 5R 5G 5B(lsb), big-endian   , X=unused/undefined
  AV_PIX_FMT_RGB555BE,
  ///< packed RGB 5:5:5, 16bpp, (msb)1X 5R 5G 5B(lsb), little-endian, X=unused/undefined
  AV_PIX_FMT_RGB555LE,

  ///< packed BGR 5:6:5, 16bpp, (msb)   5B 6G 5R(lsb), big-endian
  AV_PIX_FMT_BGR565BE,
  ///< packed BGR 5:6:5, 16bpp, (msb)   5B 6G 5R(lsb), little-endian
  AV_PIX_FMT_BGR565LE,
  ///< packed BGR 5:5:5, 16bpp, (msb)1X 5B 5G 5R(lsb), big-endian   , X=unused/undefined
  AV_PIX_FMT_BGR555BE,
  ///< packed BGR 5:5:5, 16bpp, (msb)1X 5B 5G 5R(lsb), little-endian, X=unused/undefined
  AV_PIX_FMT_BGR555LE,
    
}
複製程式碼

每個型別的註釋開頭要麼是packed要麼是planar,YUV 型別後跟著三個數字 4:2:0、4:2:2、4:4:4 等等,這些都表示什麼?帶著這些疑問,開始搜尋資料研究學習 RGB 和 YUV 顏色空間相關和畫素格式的概念。

RGB 和 YUV

RGB 和 YUV 都是顏色空間的一種。RGB 是目前運用最廣的顏色系統之一,在現代顯示器上基本都是採用 RGB 顏色標準。RGB 的原理是把顏色分為紅、綠、藍三個通道,每個通道按照不同比例混合來描述一個顏色。YUV 是用一個亮度分量和兩個色度分量來描述一個顏色,Y表示亮度,U和V表示色度。YUV 的最大特點是將亮度資訊和色彩資訊分離,沒有了色彩資訊依舊可以顯示一張完整的黑白圖片。

RGB

對於前端開發者來說,在 CSS 中經常會用到 RGB 或 RGBA 的顏色數值,RGB 格式非常好理解,R、G、B 分別表示紅綠藍三個通道的值。RGB 格式根據儲存的位數可以分為 16 位格式 、 24 位格式 和 32 位格式。在 FFmpeg 的原始碼中也可以看到 16bpp、24bpp 和 32bpp 的註釋說明。(因為記憶體的位元組順序有大端序和小端序區別,RGB 可能被表達為 BGR 順序,本質上是一樣的)

16 位格式主要是 RGB555 和 RGB565 兩種表達方式。RGB555 是每個通道分量佔 5 位,空出一位不用。RGB565 則顧名思義,R 和 B 通道佔 5 位,G 通道佔 6 位。

# RGB555
XRRR RRGG GGGB BBBB

# RGB565
RRRR RGGG GGGB BBBB
複製程式碼

24位格式和32位格式我們最常用到,RGB24 表示每個顏色通道分量佔 8 位,共 24 位。RGB32 表示除了每個顏色通道分量佔8位外,還有8位用於表示透明通道,又稱RGBA或ARGB等。

# RGB24
RRRR RRRR GGGG GGGG BBBB BBBB

# RGB32
RRRR RRRR GGGG GGGG BBBB BBBB AAAA AAAA
複製程式碼

YUV

YUV是一種彩色編碼系統,主要用在視訊、圖形處理流水線中 (pipeline)。相對於 RGB 顏色空間,設計 YUV 的目的就是為了編碼、傳輸的方便,減少頻寬佔用和資訊出錯。

YUV 編碼系統是 Y’UV、YUV、YCbCr、YPbPr 等色彩空間的統稱。由於歷史關係,Y’UV、YUV 主要用在彩色電視中,用於模擬訊號表示。YCbCr 則用於數字視訊、影象的壓縮和傳輸,如 MPEG、JPEG。由於數字訊號的普及,目前 YUV 大多數時候指的是 YCbCr。

與 RGB 的轉換

對於顯示器來說,顯示影象都是用 RGB 格式,所以需要先把 YUV 格式轉換成 RGB。

從 YUV 轉換到 RGB 有公式:

R = Y + 1.13983 * V
G = Y - 0.39465 * U - 0.58060 * V
B = Y + 2.03211 * U
複製程式碼

從 RGB 轉換到 YUV 的公式:

Y = 0.299 * R + 0.587 * G + 0.114 * B
U = -0.14713 * R - 0.28886 * G + 0.436 * B
V = 0.615 * R - 0.51499 * G - 0.10001 * B
複製程式碼

取樣

對於單個畫素來說,畫素資料都是由 Y/U/V 三個通道的資料來組成。但對於一整張圖片來說,資料儲存不一定是每個畫素資料按順序排列,在電視訊號傳播過程中,由於儲存和傳送的限制,訊號處理中會減少部分資訊來降低負荷。基於前提人眼對色度的敏感度不及亮度的敏感度,因此可以壓縮色度同時可以極小化對影象表達的影響。YUV444、YUV422、YUV420 這些 YUV 後面跟數字的表示 YUV 的取樣方式。YUV 格式主流的取樣方式主要有 YUV 4:4:4 、YUV 4:2:2 、YUV 4:2:0。(這裡的取樣可以簡單理解為從原始 RGB 影象轉換成 YUV 影象的過程)

視訊系統的抽樣系統中通常用一個三分比值表示:J:A:B(例如4:2:2),形容一個以J個畫素寬及兩個畫素高的概念上區域。

    • J:水平抽樣引用(概念上區域的寬度)。通常為4。
    • A:在 J 個畫素第一行中的色度抽樣數目。
    • B:在 J個畫素第二行中的額外色度抽樣數目。
YUV 4:4:4 取樣

YUV 444 取樣又稱全取樣,意思是每個Y分量使用一個UV分量,得到的影象和原始RGB影象的大小是一樣的。

YUV 4:2:2 取樣

YUV 4:2:2 的意思是 Y 分量和 UV 分量按 2:1 的比例取樣,每兩個 Y 分量共享一個 UV 分量。這麼就有一半的畫素點的資料大小是原來的 1/3,則整個影象的大小就會是原影象大小的 2/3。

YUV 4:2:0 取樣

YUV 4:2:0 是目前比較常用的視訊幀採用的格式。字面理解就是對第一行畫素,Y 分量和 UV 分量按 2:1 的比例進行取樣,第二行畫素不採樣 UV 分量。取樣示意圖如下:

儲存格式

在上述程式碼註釋中,開頭不是 planar 就是 packed。planar 和 packed 表示的是圖片資料的儲存格式。

Packed

Packed 格式簡單理解就是每個通道分量連續交替儲存。RGB 格式基本都是 Packed 格式,因為資料排列都是 RGBRGBRGBRGB... 。YUV 中常見的 packed 方式儲存的格式有 YUYV 格式 和 UYVY 格式,這兩種都是基於 YUV 4:2:2 取樣的格式。

    • YUYV

      排列順序舉例Y0U0Y1V0 Y2U2Y3V2,Y0 和 Y1 共享 U0V0 分量,Y2 和 Y3 共享 U2V2 分量。

    • UYVU

      排列順序舉例U0Y0V0Y1 U2Y2V2Y3,跟 YUYV 差異在於 UV 分量放在前面。

Planar

Planar 平面格式,指先連續儲存所有畫素點的 Y 分量,再儲存 U 分量,最後才是 V 分量。典型的例子有 I420(視訊中最常用),基於 YUV 4:2:0 取樣格式。以 4 * 4 畫素為例,排列方式如下:

每四個 Y 分量共享一個 UV 分量,共享關係如圖所示。

後記

在查閱資料 YUV 相關資料的時候,發現有太多的格式型別,但原理都差不多一樣。可想而知在數字訊號發展過程沒有統一標準各種方案滿天飛的時代是多麼的混亂。

FFmpeg 提供了 yuv 轉換成 rgb 的方法,但查閱原始碼發現是基於 CPU 運算的。yuv 和 rgb 的轉換公式可以表達成矩陣相乘的形式

根據一切可以寫成矩陣相乘的運算都可以利用 GPU 來加速原則,後續繼續研究使用 GPU 加速 YUV 轉換成 RGB 的方法,提高在業務側落地時的效能。

注:本文講述的格式全部使用每個畫素位置8位的方式來編碼Y頻道,並使用每樣例8位的方式來編碼每個U或V色度樣例。但是,大多數YUV格式平均使用的每畫素位數都少於24位,這是因為它們包含的U和V樣例比Y樣例要少。

更多資料:

http://www.360doc.com/content/09/0223/15/59579_2623401.shtml

http://blog.csdn.net/fyang2007/archive/2009/08/21/4470078.aspx

1簡介

RGB是按三基色加光系統的原理來描述顏色,而YUV則是按照亮度,色差的原理來描述顏色。

其中YCbCr則是在世界數字組織視訊標準研製過程中作為ITU - R BT1601建議的一部分,其實是YUV經過縮放和偏移的翻版。其中Y與YUV中的Y含義一致, Cb , Cr同樣都指色彩,只是在表示方法上不同而已。在YUV家族中, YCbCr是在計算機系統中應用最多的成員,其應用領域很廣泛,JPEGMPEG均採用此格式。一般人們所講的YUV大多是指YCbCr。YCbCr有許多取樣格式,如4∶4∶4 , 4∶2∶2 , 4∶1∶1和4∶2∶0。

2 YUV取樣

YUV的優點之一是,色度頻道的取樣率可比Y通道低,同時不會明顯降低視覺質量。有一種表示法可用來描述Y、U、V的取樣頻率比例,為A:B:C。

l 4:4:4表示色度頻道沒有下采樣。每畫素32位。

l 4:2:2表示2:1的水平下采樣,沒有垂直下采樣。對於每兩個U樣例或V樣例,每個掃描行都包含四個Y樣例。每畫素16位。

l 4:2:0表示2:1的水平下采樣和2:1的垂直下采樣。每畫素16位or每畫素12位。

l 4:1:1表示4:1的水平下采樣。此格式不常用。

YUV格式分為打包格式和平面格式。在打包格式中,YUV足見儲存在一個數組中。畫素被組織到了一些巨畫素組中,巨畫素組的佈局取決於格式。在平面格式中,三者則是作為三個單獨的平面進行儲存。

2.1 4:4:4格式,每畫素32位

這是一個打包格式。其中每個畫素都被編碼為四個連續位元組,如fourcc碼的AYUV,其組織順序如下所示。其中A的位元組包含了alpha的值。

示例:

下面的四個畫素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

存放的碼流為: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

2.2 4:2:2格式,每畫素16位

支援兩個4:2:2格式,fourcc碼如下:

l YUY2

l UYVY

兩個都是打包格式,其中每個巨畫素都是編碼為四個連續位元組的兩個畫素。這樣會使得色度水平取樣乘以係數2。

YUY2

UYVY

示例:

下面的四個畫素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

存放的碼流為: Y0 U0 Y1 V1 Y2 U2 Y3 V3

映射出畫素點為:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

2.3 4:2:0格式,每畫素16位

IMC1

IMC3

示例:

下面八個畫素為:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

[Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

存放的碼流為:Y0 U0 Y1 Y2 U2 Y3 Y5 V5 Y6 Y7 V7 Y8

映射出的畫素點為:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

[Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

3 YUV444 to RGB24

這裡只討論YUV4:4:4與RGB24之間的轉換。要將4:2:0或4:2:2YUV轉換為RGB,建議先將YUV資料轉換為4:4:YUV,然後再轉換為RGB。

轉換公式:

Clip()表示剪輯到(0,255)中。

一、概念

  1.什麼是RGB?

對一種顏色進行編碼的方法統稱為“顏色空間”或“色域”。用最簡單的話說,世界上任何一種顏色的“顏色空間”都可定義成一個固定的數字或變數。RGB(紅、綠、藍)只是眾多顏色空間的一種。採用這種編碼方法,每種顏色都可用三個變數來表示-紅色綠色以及藍色的強度。記錄及顯示彩色影象時,RGB是最常見的一種方案。

  2.什麼是YUV?

YUV是被歐洲電視系統所採用的一種顏色編碼方法(屬於PAL),是PAL和SECAM模擬彩色電視制式採用的顏色空間

  在現代彩色電視系統中,通常採用三管彩色攝影機或彩色CCD攝影機進行取像,然後把取得的彩色影象訊號經分色、分別放大校正後得到RGB,再經過矩陣變換電路得到亮度訊號Y和兩個色差訊號B-Y(即U)、R-Y(即V),最後傳送端將亮度和色差三個訊號分別進行編碼,用同一通道傳送出去。這種色彩的表示方法就是所謂的YUV色彩空間表示。

  由此可見,RGB和YUV都屬於顏色空間(或者叫“色彩空間”),如果不清楚色彩空間的概念。

二、RGB和YUV的優缺點

  1.RGB缺乏與早期黑白顯示系統的良好相容性。因此,許多電子電器廠商普遍採用的做法是,將RGB轉換成YUV顏色空間,以維持相容,再根據需要換回RGB格式,以便在電腦顯示器上顯示彩色圖形。

  2.YUV主要用於優化彩色視訊訊號的傳輸,使其向後相容老式黑白電視。與RGB視訊訊號傳輸相比,它最大的優點在於只需佔用極少的頻寬(RGB要求三個獨立的視訊訊號同時傳輸)。

  3.採用YUV色彩空間的重要性是它的亮度訊號Y和色度訊號U、V是分離的。如果只有Y訊號分量而沒有U、V分量,那麼這樣表示的影象就是黑白灰度影象。彩色電視採用YUV空間正是為了用亮度訊號Y解決彩色電視機與黑白電視機的相容問題,使黑白電視機也能接收彩色電視訊號。

三、YUV和RGB的實現原理

1.RGB是從顏色發光的原理來設計定的,通俗點說它的顏色混合方式就好像有紅、綠、藍三盞燈,當它們的光相互疊合的時候,色彩相混,而亮度卻等於兩者亮度之總和,越混合亮度越高,即加法混合。

紅、綠、藍三盞燈的疊加情況,中心三色最亮的疊加區為白色,加法混合的特點:越疊加越明亮。

紅、綠、藍三個顏色通道每種色各分為256階亮度,在0時“燈”最弱——是關掉的,而在255時“燈”最亮。當三色灰度數值相同時,產生不同灰度值的灰色調,即三色灰度都為0時,是最暗的黑色調;三色灰度都為255時,是最亮的白色調。

RGB 顏色稱為加成色,因為您通過將 R、G 和 B 新增在一起(即所有光線反射回眼睛)可產生白色。加成色用於照明光、電視和計算機顯示器。例如,顯示器通過紅色、綠色和藍色熒光粉發射光線產生顏色。絕大多數可視光譜都可表示為紅、綠、藍 (RGB) 三色光在不同比例和強度上的混合。這些顏色若發生重疊,則產生青、洋紅和黃。

2.在YUV中,“Y”表示明亮度(Luminance或Luma),也就是灰階值;而“U”和“V” 表示的則是色度(Chrominance或Chroma),作用是描述影像色彩及飽和度,用於指定畫素的顏色。“亮度”是透過RGB輸入訊號來建立的,方法是將RGB訊號的特定部分疊加到一起。“色度”則定義了顏色的兩個方面─色調與飽和度,分別用Cr和Cb來表示。其中,Cr反映了RGB輸入訊號紅色部分與RGB訊號亮度值之間的差異。而Cb反映的是RGB輸入訊號藍色部分與RGB訊號亮度值之間的差異。

四、RGB和YUV的格式

  1.RGB的格式

  ①網頁格式

  ②RGB555

  ③RGB565

  ④RGB24

  ⑤RGB32

  2.YUV格式

  YUV格式通常有兩大類:打包(packed)格式和平面(planar)格式。前者將YUV分量存放在同一個陣列中,通常是幾個相鄰的畫素組成一個巨集畫素(macro-pixel);而後者使用三個陣列分開存放YUV三個分量,就像是一個三維平面一樣。

  ①YUY2(和YUYV)格式為每個畫素保留Y分量,而UV分量在水平方向上每兩個畫素取樣一次。一個巨集畫素為4個位元組,實際表示2個畫素。(4:2:2的意思實際上是一個巨集畫素中有2個Y分量、1個U分量和1個V分量。)影象資料中YUV分量排列順序如下:

  Y0 U0 Y1 V0 Y2 U2 Y3 V2 …

  ②YVYU格式跟YUY2類似,只是影象資料中YUV分量的排列順序有所不同:

  Y0 V0 Y1 U0 Y2 V2 Y3 U2 …

  ③ UYVY格式跟YUY2類似,只是影象資料中YUV分量的排列順序有所不同:

  U0 Y0 V0 Y1 U2 Y2 V2 Y3 …

  ④AYUV格式帶有一個Alpha通道,並且為每個畫素都提取YUV分量,影象資料格式如下:

  A0 Y0 U0 V0 A1 Y1 U1 V1 …

  ⑤ Y41P(和Y411)格式為每個畫素保留Y分量,而UV分量在水平方向上每4個畫素取樣一次。一個巨集畫素為12個位元組,實際表示8個畫素。影象資料中YUV分量排列順序如下:

  U0 Y0 V0 Y1 U4 Y2 V4 Y3 Y4 Y5 Y6 Y8 …

  ⑥ Y211格式在水平方向上Y分量每2個畫素取樣一次,而UV分量每4個畫素取樣一次。一個巨集畫素為4個位元組,實際表示4個畫素。影象資料中YUV分量排列順序如下:

  Y0 U0 Y2 V0 Y4 U4 Y6 V4 …

  ⑦YVU9格式為每個畫素都提取Y分量,而在UV分量的提取時,首先將影象分成若干個4 x 4的巨集塊,然後每個巨集塊提取一個U分量和一個V分量。影象資料儲存時,首先是整幅影象的Y分量陣列,然後就跟著U分量陣列,以及V分量陣列。IF09格式與YVU9類似。

  ⑧IYUV格式為每個畫素都提取Y分量,而在UV分量的提取時,首先將影象分成若干個2 x 2的巨集塊,然後每個巨集塊提取一個U分量和一個V分量。YV12格式與IYUV類似。

  ⑨YUV411、YUV420格式多見於DV資料中,前者用於NTSC制,後者用於PAL制。YUV411為每個畫素都提取Y分量,而UV分量在水平方向上每4個畫素取樣一次。YUV420並非V分量取樣為0,而是跟YUV411相比,在水平方向上提高一倍色差取樣頻率,在垂直方向上以U/V間隔的方式減小一半色差取樣。

  3.在DirectShow中,常見的RGB格式有RGB1、RGB4、RGB8、RGB565、RGB555、RGB24、RGB32、ARGB32等;常見的YUV格式有YUY2、YUYV、YVYU、UYVY、AYUV、Y41P、Y411、Y211、IF09、IYUV、YV12、YVU9、YUV411、YUV420等。

五、RGB和YUV轉換

  對於數字視訊,定義了從 RGB 到兩個主要 YUV 的轉換。這兩個轉換都基於稱為 ITU-R Recommendation BT.709 的規範。

  第一個轉換是 BT.709 中定義用於 50-Hz 的較早的 YUV 格式。它與在 ITU-R Recommendation BT.601 中指定的關係相同, ITU-R Recommendation BT.601 也被稱為它的舊名稱 CCIR 601。這種格式應該被視為用於標準定義 TV解析度(720 x 576) 和更低解析度視訊的首選 YUV 格式。它的特徵由下面兩個常量 Kr 和 Kb 的值來定義:

  Kr = 0.299

  Kb = 0.114

  第二個轉換為 BT.709 中定義用於 60-Hz 的較新 YUV 格式,應該被視為用於高於 SDTV 的視訊解析度的首選格式。它的特徵由下面兩個不同的常量值來定義:

  Kr = 0.2126

  Kb = 0.0722

  從 RGB 到 YUV 轉換的定義以下列內容開始:L = Kr * R + Kb * B + (1 – Kr – Kb) * G然後,按照下列方式獲得 YUV 值:

  Y = floor(2^(M-8) * (219*(L–Z)/S + 16) + 0.5)

  U = clip3(0, 2^M-1, floor(2^(M-8) * (112*(B-L) / ((1-Kb)*S) + 128) + 0.5))

  V = clip3(0, 2^M-1, floor(2^(M-8) * (112*(R-L) / ((1-Kr)*S) + 128) + 0.5))

  其中,M 為每個 YUV 樣例的位數 (M >= 8)。

  Z 為黑電平變數。對於計算機RGB,Z 等於 0。對於 studio視訊RGB,Z 等於 16*2,其中 N 為每個 RGB樣例的位數 (N >= 8)。S 為縮放變數。對於計算機RGB,S 等於 255。對於 studio視訊RGB,S 等於 219*2。

  函式floor(x) 返回大於或等於 x 的最大整數。函式clip3(x, y, z) 的定義如下所示:

  clip3(x, y, z) = ((z < x) ? x : ((z > y) ? y : z))Y 樣例表示亮度,U 和 V 樣例分別表示偏向藍色和紅色的顏色偏差。Y 的標稱範圍為 16*2 到 235*2 。黑色表示為 16*2 ,白色表示為 235*2 。U 和 V 的標稱範圍為 16*2 到 240*2 ,值 128*2 表示中性色度。但是,實際的值可能不在這些範圍之內。

  對於 studio 視訊 RGB 形式的輸入資料,要使得 U 和 V 值保持在 0 到 2M-1 範圍之內,必需進行剪輯操作。如果輸入為計算機RGB,則不需要剪輯操作,這是因為轉換公式不會生成超出此範圍的值。

  這些都是精確的公式,沒有近似值。

六、YUV的取樣格式

  YUV的主要取樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。

  其中YCbCr 4:1:1 比較常用,其含義為:每個點儲存一個 8bit 的亮度值(也就是Y值),每 2x2 個點儲存一個 Cr 和Cb 值,影象在肉眼中的感覺不會起太大的變化。所以, 原來用 RGB(R,G,B 都是 8bit unsigned) 模型, 1個點需要 8x3=24 bits(如下圖第一個圖),(全取樣後,YUV仍各佔8bit)。按4:1:1取樣後,而現在平均僅需要 8+(8/4)+(8/4)=12bits(4個點,8*4(Y)+8(U)+8(V)=48bits), 平均每個點佔12bits(如下圖第二個圖)。這樣就把影象的資料壓縮了一半。

  上邊僅給出了理論上的示例,在實際資料儲存中是有可能是不同的,下面給出幾種具體的儲存形式:

  (1) YUV 4:4:4

  YUV三個通道的抽樣率相同,因此在生成的影象裡,每個象素的三個分量資訊完整(每個分量通常8位元),經過8位元量化之後,未經壓縮的每個畫素佔用3個位元組。

  下面的四個畫素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流為: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3

  (2) YUV 4:2:2

  每個色差通道的抽樣率是亮度通道的一半,所以水平方向的色度抽樣率只是4:4:4的一半。對非壓縮的8位元量化的影象來說,每個由兩個水平方向相鄰的畫素組成的巨集畫素需要佔用4位元組記憶體。

  下面的四個畫素為:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流為:Y0 U0 Y1 V1 Y2 U2 Y3 V3

  映射出畫素點為:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]

  (3) YUV 4:1:1

  4:1:1的色度抽樣,是在水平方向上對色度進行4:1抽樣。對於低端使用者和消費類產品這仍然是可以接受的。對非壓縮的8位元量化的視訊來說,每個由4個水平方向相鄰的畫素組成的巨集畫素需要佔用6位元組記憶體。

  下面的四個畫素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  存放的碼流為: Y0 U0 Y1 Y2 V2 Y3

  映射出畫素點為:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]

  (4)YUV4:2:0

  4:2:0並不意味著只有Y,Cb而沒有Cr分量。它指得是對每行掃描線來說,只有一種色度分量以2:1的抽樣率儲存。相鄰的掃描行儲存不同的色度分量,也就是說,如果一行是4:2:0的話,下一行就是4:0:2,再下一行是4:2:0...以此類推。對每個色度分量來說,水平方向和豎直方向的抽樣率都是2:1,所以可以說色度的抽樣率是4:1。對非壓縮的8位元量化的視訊來說,每個由2x2個2行2列相鄰的畫素組成的巨集畫素需要佔用6位元組記憶體。

  下面八個畫素為:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]

  [Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]

  存放的碼流為:Y0 U0 Y1 Y2 U2 Y3

  Y5 V5 Y6 Y7 V7 Y8

  映射出的畫素點為:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]

  [Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]

原文 :https://www.jishux.com/plus/view-425722-1.html