关于算法:模型推理教你用-C-实现一般模型推理图片预处理模块

1次阅读

共计 1422 个字符,预计需要花费 4 分钟才能阅读完成。

欢送关注我的公众号 [极智视界],回复 001 获取 Google 编程标准

O_o>_<   o_OO_o~_~o_O

  大家好,我是极智视界,本文介绍了用 C++ 实现个别模型推理图片预处理的办法,通用性较强。

   大家晓得,对于一个视觉深度学习利用来说,次要会波及几个流程:视频编解码、图像预处理、模型推理、后处理。这里介绍一下图像预处理的实现。

   以默认如下配置为例:opencv 读图、宽高均为 512、三通道、均值 [0.485, 0.456, 0.406]、方差 [0.229, 0.224, 0.225]、需做归一化、以 RGB 喂给模型。那么你的预处理能够这么写:

cv::Mat source, frame;
source = cv::imread(img_path);                      // 读图

if (!source.data)                                  // 异样判断
{std::cout << "read error" << std::endl;}

int batchsize = 1;
int net_w = 512;
int net_h = 512;

cv::cvtColor(source, frame, cv::COLOR_BGR2RGB);    // 通道转换
cv::resize(frame, frame, cv::Size(net_w, net_h));  // resize

float* mat_data = new float[batchsize * net_w * net_h * 3];
int data_index = 0;

// 开启图像预处理
for(int i = 0; i < net_h; i++)
{const uchar* current = frame.ptr<uchar>(i);                    // 指向每行首地址
    for(int j = 0; j < net_w; j++)
    {mat_data[data_index] = ((current[3*j + 0] / 255.0) - 0.485) / 0.229;                    // R
        mat_data[net_w*net_h + data_index] = ((current[3*j + 1] / 255.0) - 0.456) / 0.224;      // G
        mat_data[2*net_w * net_h + data_index] = ((current[3*j + 2] / 255.0) - 0.406) / 0.225;  // B
        data_index++;
    }
}

// 而后把 mat_data 喂给模型

// 用完之后别忘了 delete mat_data
delete mat_data;

   解释一下以上的代码,opencv 读图默认 BGR 排布,这个案例须要以 RGB 喂给模型,所以在做预处理的时候最重要的是要把通道对应起来。这里的实现次要利用了指针偏移,每个内循环的起始地位都是指向每行首地址,而后缓缓往后偏移,在偏移的途中顺便做一些预处理的操作,等走完一遍也就顺便实现了图像预处理流程,这样的解决形式,效率还是不错的。

  而后再说一下预处理完的数据排布,后面说了 opencv 读进来是 BGR 的,通过了 cvtColor 转换后成了 RGB,这个时候的数据排布是 RGBRGBRGBRGBRGB…,而后进咱们的图像预处理,做完之后的数据排布是这样的:RRRRRRRRRRRR…GGGGGGGGGGG…BBBBBBBBBBB,之后在喂给模型就行。

   以上介绍了用 C++ 实现个别模型推理图片预处理的办法,预处理是深度学习利用中必不可少的一个环节,代码还算比拟通用,心愿我的分享能对你的学习有一点帮忙。


【公众号传送】
《【模型推理】教你用 C++ 实现个别模型推理图片预处理模块》

正文完
 0