近来完成了一个功能,然后进行各项测试工作的。吾发现了一个cudaMemcpy有严重的性能问题。

  • 如果复制的数据量,不超过1920x1080*4(颜色)*4(画面),性能表现良好。
  • 一旦超过,性能急剧恶化,消耗的时间大增。

 

  有人奇怪了:汝怎么知道的?

  这有什么奇怪的,测试多个摄像头的时候发现画面卡顿,再检查哪个步骤,就知道了。

 

  怎么解决呢?当然是限制数据量的大小。怎么限制?9个摄像头合成以后的画面,大小能控制?有几个思路:

  • 限制合成画面的大小;
  • 进行缩放;
  • 限制单次数据量。