2018年10月16日,在上海英特尔举办了秋季人工智能技术研讨会,主要从芯片硬件和深度学习底层加速工具包介绍了所做的事情。我今天将分享一下我所看到的内容给大家。

2018年英特尔秋季人工智能技术研讨会_视频传输Intel针对CPU版本的tensorflow进行了优化,在ResNet50网络上进行了训练和推理测试,同样的硬件条件下,与没有优化的CPU版本的tensorflow结果相比,速度分别提高了14倍和3.2倍。

2018年英特尔秋季人工智能技术研讨会_tensorflow_02Intel优化的CPU版本的tensorflow目前只支持最新版的1.10.0,安装也非常简单只需要加一条语句即可:conda install tensorflow -c intel。

2018年英特尔秋季人工智能技术研讨会_深度学习_03Intel对现在大多数深度学习网络进行了优化,例如SSD,UNet,DCGAN等。

2018年英特尔秋季人工智能技术研讨会_视频传输_04

2018年英特尔秋季人工智能技术研讨会_tensorflow_05Intel对tensorflow中优化的操作有前传操作(conv2d,relu,maxpool,batchnorm,concat等)和后传操作(reluGrad,maxpoolGrad,batchnormGrad等)。

2018年英特尔秋季人工智能技术研讨会_tensorflow_06TensorTuner是用来在Intel至强CPU上来调整tensorflow配置的工具。

2018年英特尔秋季人工智能技术研讨会_深度学习_07

2018年英特尔秋季人工智能技术研讨会_tensorflow_08Intel至强和FPGA芯片可以用于集成,存储,处理,管理和分析等方向。

2018年英特尔秋季人工智能技术研讨会_tensorflow_09Intel不同的芯片应用于不同的深度学习需求。

2018年英特尔秋季人工智能技术研讨会_tensorflow_10OPENVINO TOOLKIT是用来加速计算机视觉和深度学习推理性能工具包。

2018年英特尔秋季人工智能技术研讨会_深度学习_11DLDK是充分利用Intel架构能力来进行深度学习。

2018年英特尔秋季人工智能技术研讨会_tensorflow_12现在Intel FPGA芯片已经支持现在主流的深度学习模型:AlexNet,GoogleNet,Yolo,LeNet,VGG16,ResNet101等。

2018年英特尔秋季人工智能技术研讨会_深度学习_13

2018年英特尔秋季人工智能技术研讨会_深度学习_14

2018年英特尔秋季人工智能技术研讨会_视频传输_15

2018年英特尔秋季人工智能技术研讨会_视频传输_16

2018年英特尔秋季人工智能技术研讨会_视频传输_17

BigDL是面向ApacheSpark的分布式深度学习框架。

AnalyticsZoo是基于ApacheSpark和BigDL的“大数据分析+AI”的平台。

2018年英特尔秋季人工智能技术研讨会_tensorflow_18

2018年英特尔秋季人工智能技术研讨会_tensorflow_19

2018年英特尔秋季人工智能技术研讨会_深度学习_20

案例分享

1、膝关节分割诊断。首先用3DUnet把膝关节分割出来,然后将膝关节区域分割成多个ROI区域,再通过3DCNN进行疾病分类。

2018年英特尔秋季人工智能技术研讨会_tensorflow_21

2、通过AI优化网络视频传输带宽。通过MaskRCNN网络在视频图像中分割提取出主播图像,再通过编码和解码网络提取进行特征压缩(压缩静态背景信息,不压缩主播信息),这样可以减少网络直播视频传输带宽达到32%左右。

2018年英特尔秋季人工智能技术研讨会_深度学习_22

3、高速双目VSLAM+AI端处理系统模组。该模组是基于Intel Movidius平台进行数据处理的,通过双目镜头获取图像来提取特征,以此来识别真实物体,输出可以达到100fps,分辨率和追踪精度可以达到毫米级水平,而且功耗非常低只有1.8W。

2018年英特尔秋季人工智能技术研讨会_tensorflow_23