libtorch默认是将cpu性能全部耗光,cpu利用率达到95%,需要设置并行计算的线程数,设置函数是torch::set_num_threads(1);
python版本的torch.set_num_threads(1)
resnet50模型
cpu型号:I7 4770 3.6HZ 内存16G
pytorch 单线程cpu速度大概285ms 增加线程速度反而降低 两个线程300ms 4个线程350ms
gpu 750ti 85ms
libtorch 单线程cpu速度大概230ms 增加一个线程速度大概175ms 4个线程130ms