随着人工智能的兴起,GPU 借助深度学习,走上了历史的舞台,活跃在各个领域。FPGA 也借着这股浪潮,慢慢地走向数据中心,走向人工智能,发挥着它的优势。

“人工智能浪潮催生的计算迭代需求远超摩尔定律,阿里云希望为人工智能产业提供最强的计算能力,我们开放了视频识别、语音识别、图像识别等人工智能服务及ET工业大脑、医疗大脑场景解决方案,今天我们推出的异构计算加速平台,将进一步完善人工智能产业生态,满足更多客户的核心业务需求。”阿里云异构计算负责人张献涛表示。

9月12日,阿里云宣布推出全新一代异构加速平台,为人工智能产业提供多场景化的全球加速能力。这是阿里云异构计算家族首次亮相,涵盖GPU、FPGA在内等6款异构实例,可满足从图形渲染到高性能计算及人工智能等复杂应用的计算需求。特别是在人工智能领域,可将深度学习成本缩减一半,大幅降低人工智能计算门槛;而基于阿里云异构平台的全新高性能计算实例E-HPC,可一键部署获得媲美大型超算集群环境的“云上超算中心”。

异构计算服务器内部架构 异构云计算平台功能_异构计算服务器内部架构

最新一代GPU实例GN5i采用了英伟达 Pascal架构P4图形处理器,主要适用于深度学习的在线推理(Inference)阶段,提供最大45Tops INT8整型计算能力和11TFlops FP32单精度浮点计算能力。可根据深度学习计算力的要求,进行GPU实例的“Scale-out”水平扩容或“Scale-up”垂直变配,分钟级即可完成实例的创建。可一键部署TensorFlow等主流深度学习框架,提供智能调度、自动运维、实时扩容等服务。人工智能产业用户可通过GN5i搭建微秒级响应的AI服务,在线服务成本减少50%以上。

异构计算服务器内部架构 异构云计算平台功能_异构计算服务器内部架构_02

与GPU、CPU相比,FPGA更适合非标数据位宽的人工智能、计算金融、基因工程、气象预测等领域。阿里云2017年初推出了基于英特尔Arria 10芯片的FPGA计算实例,已帮助大量用户通过自定义加速算法,实现云上FPGA加速业务的一键部署、快速研发和弹性伸缩,有效提升了人工智能及深度学习的效率,为企业节省成本。

异构计算服务器内部架构 异构云计算平台功能_异构计算服务器内部架构_03

此次发布的F2实例基于赛灵思Xilinx KU115器件,提供145万逻辑门电路,单实例的单精度浮点计算性能可达1.5TFlops。随着集成英特尔(F1)和赛灵思(F2)芯片的FPGA计算实例相继面世,阿里云率先完成对主流FPGA方案的全覆盖,成为全球FPGA领域产品线最全、场景最多的公共云服务商。再加上阿里云业已推出的FPGA镜像市场,可帮助用户完成更多定制化FPGA加速方案,提高特定业务和算法的效率。

“如果把传统超算中心比作‘珠穆朗玛峰’,那么阿里云的E-HPC则是将高性能计算做更普惠的覆盖,成为高性能计算的‘青藏高原’。阿里云资深专家何万青表示。

异构计算服务器内部架构 异构云计算平台功能_运维_04

据何万青介绍,此次推出的基于阿里云异构平台的全新高性能计算实例E-HPC,有四大特点:便捷、互通、弹性、安全。 依托阿里云E-HPC弹性高性能计算提供的PaaS平台,通过调用OpenAPI创建阿里云基础架构层IaaS产品,包括弹性计算ECS资源,虚拟专用网VPC,异构计算资源,高性能高可靠和横向扩展的NAS资源等产品。

通过现场的演示可以看到,只需硬件配置、软件配置、基础配置,最后生成,就可以快速生成一台属于自己的高性能计算机,为科研人员、企业构建了一整套科学家、程序员熟悉的并行计算软件环境。

弹性和灵活性,是阿里云和传统超算中心的主要的差异化竞争点。阿里云希望搭建一个平台,把计算力输出给我们的客户,这是我们的一个初衷。” 阿里云异构计算负责人张献涛最后表示。 


本文作者:赵立京