【opencv基础】代码优化加速相关

原创

mb62c788fd198da 2022-07-11 09:59:49 ©著作权

©著作权归作者所有：来自51CTO博客作者mb62c788fd198da的原创作品，请联系作者获取转载授权，否则将追究法律责任

1. 浮点数据定点化；

cv::Mat tmp1 = values * 1000000;
tmp1.convertTo(tmp1, CV_32SC1);
cv::Mat tmp2 = this->weights * 1000000;
tmp2.convertTo(tmp2, CV_32SC1);
cv::Mat tmp(tmp1.rows, tmp2.cols, CV_64FC1);
tmp = tmp1 * tmp2 / 1000000000000.0f;
tmp.convertTo(tmp, CV_32FC1);

View Code

opencv中cv::Mat数据矩阵乘法，需要各个数据的类型是一样的，且需要注意数据溢出问题，以及矩阵乘法支持Mat矩阵的数据类型（type）只能是 CV_32FC1、 CV_64FC1、 CV_32FC2、 CV_64FC2 这4种类型中的其中一种。定点化一般指的是两个浮点数据转换为整形数据相乘，这样才能加速，而我们的转换过程矩阵乘法一直都是浮点数据相乘，所以对加速没用，甚至会增加额外的转换过程的耗时。

2. 使用eigen库运算；

3. 使用加速优化的编译选项;

使用浮点运算；使用neon;可以使用不同的架构选项、ARM选项等等；

QMAKE_CXXFLAGS += -march=armv8 -mfloat-abi=hard -mfpu=vfpv4-d16 -mfpu=neon

4. 使用多线程；

注意互斥锁和信号量；

5. 使用多核并行编程；

openmp

参考

1. eigen;

2. GNU_GCC;

3. openmp_MSDN;

4. openmp_example_smallpt;

5. openmp_org;

完

上一篇：【leetcode_easy_array】1010. Pairs of Songs With Total Durations Divisible by 60

下一篇：【机器学习基础】常用的数据归一化方法总结

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯