关于图像处理:RGB到YCbCrYUV转换

公式

RGB to YCbCr

Y = a * R + b * G + c * B
Cb = (B - Y) / d
Cr = (R - Y) / e

YCbCr to RGB

R = Y + e * Cr
G = Y - (a * e / b) * Cr - (c * d / b) * Cb
B = Y + d * Cb

	BT.601/JPEG	BT.709	BT.2020
a	0.299	0.2126	0.2627
b	0.587	0.7152	0.6780
c	0.114	0.0722	0.0593
d	1.772	1.8556	1.8814
e	1.402	1.5748	1.4746

d和e这两个参数是为了让Cb和Cr落在-0.5~0.5区间才引入的（使之具备与明度信号Y雷同的幅值，便于工程实现），计算方法如下：
d = (1 – c) / 0.5
e = (1 – a) / 0.5

这些系数是怎么来的，为什么要取这些值？
a, b, c这三个系数是在ITU规范中定义的，表明了RGB三原色须要以何种比例混合来生成明度信号Y，这个比例与三原色的选取无关（因为不同波长的光对亮度的奉献也不同），参考标准文档：
https://www.itu.int/dms_pubrec/itu-r/rec/bt/R-REC-BT.601-7-20…
https://www.itu.int/dms_pubrec/itu-r/rec/bt/R-REC-BT.709-6-20…
https://www.itu.int/dms_pubrec/itu-r/rec/bt/R-REC-BT.2020-2-2…

量化

通过上述公式计算出的Y, Cb, Cr并不是最终后果，ITU规定明度与色度信号并不能占满量程，比方0~1v电压范畴，明度信号取值范畴是0.06v~0.86v，其无效幅值为满量程的80%，色度信号取值范畴稍大，其作用是防止滤波器导致的过冲。

对于数字信号，ITU给出的量化公式如下：

\( D_Y’ = INT[(219E_Y’ + 16) \cdotp 2^{n-8}] \)
\( D_{CB}’ = INT[(224E_{CB}’ + 128) \cdotp 2^{n-8}]\)
\( D_{CR}’ = INT[(224E_{CR}’ + 128) \cdotp 2^{n-8}] \)

上述公式中，\( E_Y’ \), \( E_{CB}’ \), \( E_{CR}’ \)为取值范畴[0, 1]的浮点数，n为位深（个别为8bit，10bit和12bit），INT为四舍五入取整（round），\( D_Y’ \), \( D_{CB}’ \), \( D_{CR}’ \)为最终要送编码器的YUV数据。

留神：JPEG并不会将Y, Cb, Cr做量化，即应用满量程[0, 255]。

C++实现：

ffmpeg: https://github.com/FFmpeg/FFmpeg/blob/master/libavutil/colorspace.h
我本人的实现: https://github.com/zhanwang-sky/jpeg_helper/tree/main/jpeg_helper/yuv_helper

关于图像处理:RGB到YCbCrYUV转换

公式

量化

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于图像处理:RGB到YCbCrYUV转换

公式

量化

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复