libtorch默认是将cpu性能全部耗光,cpu利用率达到95%,需要设置并行计算的线程数,设置函数是torch::set_num_threads(1);

python版本的torch.set_num_threads(1)

 

resnet50模型

cpu型号:I7 4770 3.6HZ 内存16G

pytorch 单线程cpu速度大概285ms  增加线程速度反而降低 两个线程300ms 4个线程350ms

            gpu 750ti  85ms

libtorch 单线程cpu速度大概230ms 增加一个线程速度大概175ms  4个线程130ms