2018年10月16日,在上海英特尔举办了秋季人工智能技术研讨会,主要从芯片硬件和深度学习底层加速工具包介绍了所做的事情。我今天将分享一下我所看到的内容给大家。
Intel针对CPU版本的tensorflow进行了优化,在ResNet50网络上进行了训练和推理测试,同样的硬件条件下,与没有优化的CPU版本的tensorflow结果相比,速度分别提高了14倍和3.2倍。
Intel优化的CPU版本的tensorflow目前只支持最新版的1.10.0,安装也非常简单只需要加一条语句即可:conda install tensorflow -c intel。
Intel对现在大多数深度学习网络进行了优化,例如SSD,UNet,DCGAN等。
Intel对tensorflow中优化的操作有前传操作(conv2d,relu,maxpool,batchnorm,concat等)和后传操作(reluGrad,maxpoolGrad,batchnormGrad等)。
TensorTuner是用来在Intel至强CPU上来调整tensorflow配置的工具。
Intel至强和FPGA芯片可以用于集成,存储,处理,管理和分析等方向。
Intel不同的芯片应用于不同的深度学习需求。
OPENVINO TOOLKIT是用来加速计算机视觉和深度学习推理性能工具包。
DLDK是充分利用Intel架构能力来进行深度学习。
现在Intel FPGA芯片已经支持现在主流的深度学习模型:AlexNet,GoogleNet,Yolo,LeNet,VGG16,ResNet101等。
BigDL是面向ApacheSpark的分布式深度学习框架。
AnalyticsZoo是基于ApacheSpark和BigDL的“大数据分析+AI”的平台。
案例分享
1、膝关节分割诊断。首先用3DUnet把膝关节分割出来,然后将膝关节区域分割成多个ROI区域,再通过3DCNN进行疾病分类。
2、通过AI优化网络视频传输带宽。通过MaskRCNN网络在视频图像中分割提取出主播图像,再通过编码和解码网络提取进行特征压缩(压缩静态背景信息,不压缩主播信息),这样可以减少网络直播视频传输带宽达到32%左右。
3、高速双目VSLAM+AI端处理系统模组。该模组是基于Intel Movidius平台进行数据处理的,通过双目镜头获取图像来提取特征,以此来识别真实物体,输出可以达到100fps,分辨率和追踪精度可以达到毫米级水平,而且功耗非常低只有1.8W。