不久前,英特尔推出首款面向数据中心的全新服务器 GPU,采用英特尔能效最高的图形架构——英特尔Xe-LP微架构,全新产品的到来意味着其在以数据中心的版图有了进一步的扩张与补全,而基于此,英特尔也正全面向 XPU 时代进军。

事实上,英特尔在今天为我们带来高扩展性、灵活、性能卓越的硬件背后,更离不开其在软件上深厚的积累与优化。近日,就英特尔软件技术栈的研发与应用,以及最新的研究成果,英特尔架构、图形和软件集团副总裁兼中国区经理谢晓清,英特尔大数据技术全球CTO、大数据分析和人工智能创新院院长戴金权在接受媒体采访时进行了正面解答与分享。

英特尔“致胜法宝”

早在 2017 年,英特尔便确立了“以数据为中心”的转型目标,围绕着“以数据为中心”,英特尔在战略发布、战略收购、产品创新、生态合作四个方向上频频发力,在产品和技术上实现了更丰富的计算能力。

同时,在 2018 年提出了“六大技术支柱”战略,围绕以下六个层面确立了如何驱动未来的创新:

  • 制程与封装
  • XPU 架构,包含 CPU、GPU、AI 以及 FPGA
  • 内存与存储
  • 互连
  • 安全
  • 软件

对此,英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清评价道,从英特尔的角度来看,这是我们的“致胜法宝”。

XPU 时代,英特尔的 oneAPI 将致力于为多架构定义统一的解决方案

其中,软件作为重要的一环,英特尔在 2019 年推出支持异构计算的平台软件——oneAPI。

如今经过了一年的迭代,英特尔宣布,即将于今年 12 月带来 oneAPI Gold 版本,支持 CPU 和 GPU,以后也将支持其他的 AI 硬件加速以及 FPGA,使得开发者能够使用一种通用、开放且基于行业标准的编程模型访问英特尔 XPU。谢晓清解释道,这样也方便了软件开发者及企业在软件方面的投资可以最大程度的复用,不需要绑定在单一的硬件的架构以及制程上,并且将开发效率提升到最大化。

lxc使用gpu xe lp gpu_大数据

相关阅读:软件对于英特尔意味着什么?

同时,值得一提的是,以“No Transistor Left Behind”为 slogan 的 oneAPI 具有良好的兼容性,且拥有非常友好的互操作界面。谢晓清表示,在目前各个领域应用比较广泛的高性能计算的 Fortran、在 AI 领域的 Python,以及如 OpenMP 这样不同领域使用的语言,开发者现有的软件可以在 oneAPI 平台上做无缝移植。

整体而言,oneAPI 主要有三大优势,一方面可为用户提供友好的编程环境,使得开发者可以自由选择硬件平台,而不被某一语言“绑定住”;其次,oneAPI 提供的编译器、系统都是高度优化,可以实现最大的硬件产能,并且最优地支持不同异构计算的硬件加速;最后,其开发模式快速、高效,并且源码的维护成本可以达到最低。

经过多年的构建,英特尔从底层固件 IP 和 BIOS,到硬件驱动、操作系统,与业界保持紧密的合作,同时在开源层面也有巨大的投入。

lxc使用gpu xe lp gpu_lxc使用gpu_02

在英特尔内部,谢晓清表示,其软件技术的构建主要遵循三大策略:

  • 软件优先策略
    过去几十年间,英特尔在 CPU 上生成的一些软件生态是其最好的起点。同时,围绕编程语言、系统库以及工具链方面,英特尔也已经有了非常强有力的生态支持。从这也为 Xe 提供了良好的软件生态基础。
  • 易于扩展
    在 GPU 市场,细分市场非常多,不同市场有不同的价格、不同的功耗与性能。对英特尔而言,谢晓清表示,我们希望能够最大限度地得到所有的 GPU 开发者支持。这也是英特尔所有的独立显卡和集成显卡所有的软件都是兼容的原因。
  • 全新的计算负载和用户场景
    作为行业技术领先者,英特尔希望解决一些利用现有的解决方案还不太能够很好解决的问题。

Analytics Zoo:统一的大数据分析+AI 平台

除此之外,在人工智能正慢慢渗透我们日常生活的今天,其应用也正在从实验室深入商业应用场景中,但是对于新时代下的开发者而言,戴金权表示,他们将面临多重挑战,一方面是如何将 AI 算法应用到复杂的数据当中;另一面是在呈爆发式发展的大数据下,如何将 AI 可以直接应用到大数据的生产环境中,并让它无缝的进行大规模的扩展。

基于以上,这也是英特尔大数据+ AI 的软件平台 Analytics Zoo 诞生的主要原因。在 Analytics Zoo 中,英特尔提供了多种模型以帮助业界数据科学家、分析师快速将 AI 运用到现实生产中。

lxc使用gpu xe lp gpu_大数据_03

从上图的架构图中,我们可以看到,Analytics Zoo 构建在基于 oneAPI 等底层加速库、优化框架,以及如 Spark、Flink、Ray 等数据处理分析框架之上。

在此之上,Analytics Zoo 提供了端到端的大数据+AI的软件平台。细分而言,Analytics Zoo 提供了三层能力,一是底层端到端的数据流水线能力,能够帮助用户可以直接无缝地将 AI 模型运行在其分布式大数据上;二是在流水线层之上,提供机器学习的工作流,目的是能够将很多人工的作业、人工的任务可以自动化起来;三是帮助用户在 Analytics Zoo 上面构建不同应用场景,如推荐系统、时间序列分析、计算机视觉以及自然语言处理等。

lxc使用gpu xe lp gpu_数据中心_04

对此,戴金权以金风慧能为例,分享了基于 Analytics Zoo 的应用实践。

lxc使用gpu xe lp gpu_大数据_05

通过上图,基于大数据架构,金风慧能在风能发电机上通过传感器等各种方式收集很多的数据,这些数据通过 Kafka 等大数据的前端进入到 Analytics Zoo 系统当中。

此时,戴金权表示,可以将其视为一个时间序列的问题,因为每过几秒都可以从风能发电机上收集到很多的 KPI,然后构建 LSTNet 模型,并对其进行建模,通过时间序列加上很多过往每个电机的发电功率等信息,一起来构建模型。

最后,经过实践发现,金风慧能风电功率的准确率可以相比以前从 59% 左右提升到 79% 左右,不仅提高了风电功率预测准确率,同时也大大提高端到端训练的效率。

总结

通过一次次的实践,我们亲眼见证了在基于创新的硬件架构之上,软件为其带来的性能呈指数级上升。硬件作为基础,软件作为灵魂,软硬协同让更多应用得以高效落地,也让英特尔在无数的场景为我们带来了更多的可能性。