针对能够并行利用数百个小核心的应用来说,GPU提供了极大的性能提升。众所周知的用例包括各种形式的图形处理,视频编辑渲染等等—科学计算以及数据流处理,包括大数据分析以及高速通信/存储数据服务。

很多用例针对云计算,但特有的性能需求以及代码复杂性使得该项工作充满挑战而且和云中的通用计算相比多少有些滞后。过渡到聚焦GPU的用例的杀手锏是两年前发布的NVIDIA GRID产品,该产品允许应用在由调配GPU资源的软件所创建的vGPU上运行。

这一特性导致了向Adobe及NVIDIA云端迁移。Adobe交付了视频编辑套件的云端版本并开始反对得到许可的独立版本。典型的编辑配置从需要昂贵软件许可费用的工作站变成了一个在Adobe云中运行的虚拟工作站,使用平板电脑就可以搞定。结果就是视频编辑的进入成本下降,用户量激增,Adobe得以蓬勃发展。

NVIDIA提供了GPU云允许编程人员熟悉沙箱环境。随后,亚马逊Web服务以及其他服务商在其公有云上提供了GPU实例,vGPU现在是一个主流平台。值得一提的是高性能计算在接受云计算方面一直慢一拍,但GPU虚拟化产生的影响已经大大降低了进入价格,受困于超级计算机的研究项目能够共享云端资源并访问新的计算资源。预计很多项目的时间进度能够提高50%乃至更多。

2016年初,AMD加入了vCPU竞赛。AMD采用的是硬件而非软件方式处理多租户问题,至少在理论上提供了与多租户虚拟机共享CPU资源同样的安全级别。AMD声称性价比超过了NVIDIA,但过去两家公司的性能测试报告一直不分伯仲。

AMD的产品开启了开放计算语言作为云中并行计算应用语言加入CUDA的大门,因此我们应该会在不久后看到某些激烈的竞争以及价格战。

当今GPU虚拟化的热门用例似乎是虚拟桌面基础设施(VDI)。并非购买并支持大量的桌面PC,我们看到了企业转向移动设备并使用浏览器显示基于云服务器的虚拟桌面结果的一个临界点。这与Adobe软件类似,而且后续的成本及支持需求值得注意。最终的虚拟桌面应该能够利用容器提高服务器利用率。

VDI用例背后是由vGPU实例所支撑的大数据分析处理的增长。GPU非常适合解决Hadoop问题,因此公有云以及混合云将需要使用vGPU武装自己。

使用GPU实现存储以及网络数据服务比如压缩、重复数据删除以及校验码的研究工作变得越来越紧迫了,我们开始实现固态硬盘10Gb/s的传输速率才不到一年的时间,但200Gb以太网可能会在2018年问世。CPU发展速度跟不上而且硬件加速还不够灵活。使用vGPU执行各种存储、网络微服务可能很有意义而且可能是解决软件定义基础设施所面临的困境的一种方式。

vGPU仍旧在完善过程中而且可以预计在今后的两年当中会有提供新功能,性能也会有所提升。AMD目前仅支持VMware的hypervisor,而NVIDIA还支持XenServer。Intel提供了一款与NVIDIA类似的产品,支持KVM、XenServer。在细节上,在类别以及资源分布上不同厂商提供的产品有所不同。尽管软硬件产品在多租户控制上会有差异,但我们预计产品支持的范围会趋同。