在当前,随着物联网的快速演进,大数据、AI、5G等技术的实施落地,数据量呈现出爆发式增长,在边缘侧数据采集规模也越发庞大,由边端到数据中心进行处理的模式,严重制约着数据处理的时效性,同时,面对不同的业务需求,IT架构模型也日趋复杂,在此时,以CPU与GPU为核心的计算单元所构成的架构,既承担着核心业务的计算,也承载着更多的基础设施操作的计算内容,在造成资源极大冲突的同时,也因此会形成通信阻塞。

数据量的持续增加,AI运算的发展,数据在网络中的通信过程中,这种传统的通信模式正在制约着整个系统的快速发展,尤其是面对着越来越庞大的数据中心,显得力不从心。新的问题出现了,怎样提高数据中心的性能?

让计算深入网络

事实上,要解决以上问题,需要对架构有所调整,从过去以计算为核心,转变为以数据为核心。以数据为中心的网络计算架构,意味着数据在哪里,计算能力就在那里,这其中有别于从前的是,当数据在网络中传输时,计算就发生在网络中。

为此,以网络计算为核心的DPU计算单元应运而生。新的方式,可以有效减少网络传输时多打一状况下的丢包情况,解决因此产生的传输瓶颈,最为重要的是,新的架构可以极大的降低网络通信延迟,所以由此看来,网络计算必然会成为未来数据中心架构的核心技术之一。

值得一提的是,将DPU引入数据中心的计算架构中,可以为业务创新提供新的思路。仅以红帽公司(Red Hat)的OVS系统为例,传统的模式下,各种计算都基于CPU,会更多的消耗CPU资源,数据包转发效率降低,而通过DPU的加持,可以实现将OVS与CPU隔离,直接将业务和OVS处于不同的计算单元,从而提升了计算性能,消除了业务瓶颈的出现。

中心性算法的python实现 中心化计算与处理模式_大数据

NVIDIA网络事业部亚太区市场开发高级总监宋庆春

在高性能计算领域,DPU将被应用于云原生超级计算机中,在提高HPC业务性能的同时,依靠DPU可以将业务单元和安全单元分离,保证了业务的安全性,而DPU在物理上的隔离能力,可以有效的帮助企业进行软件防护。

构筑3U计算架构的数据中心

需要指出的是,目前的数据中心中,已经进入了多芯片融合时代,GPU已经承担了越来越多的计算任务,特别是在AI快速发展的今天。而未来,以CPU、GPU、DPU为核心的3U一体计算架构,随着时间的推移,必然会成为数据中心发展的趋势。

3U一体的计算架构,不仅仅会让数据中心在性能方面有显著提升,带来安全方面的变化,也值得肯定。

在性能上,当DPU从BlueField-2升级到BlueField-3时,它的整形计算能力提升了5倍,加密的处理能力提升了4倍,同时存储处理能力(IOP/s)的提升也会达到3-4倍,在性能端实现了跨越式发展。

在安全方面,BlueField-3从IP层,传输层以及MAC层,都可以实现400Gb/s全线速在线加解密,有效降低在线包被窃取的可能性。通过采用root-of-trust的机制,在固件升级上,必须进行授权密钥验证,进一步提升了固件安全。此外,在硬件中实施分布式安全策略支持高级交换和数据包处理(ASAP2)技术;通过内置正则表达式加速引擎执行深度数据包检测恶意活动;在受信任的环境中部署安全应用程序,与主机系统隔离以防止恶意攻击的横向移动,减少攻击面,都将进一步提升数据中心的安全性。

中心性算法的python实现 中心化计算与处理模式_java_02

UCloud资深技术专家马彦青

就如,NVIDIA网络事业部亚太区市场开发高级总监宋庆春所言, 随着网络计算,随着DPU的崛起,数据中心正在成为新的计算单元,由此会引发数据中心的技术变革,计算、存储、通信都将采用统一架构的计算单元,而3U架构会成为其中的核心。

打造网络计算生态

值得一提的是,最近NVIDIA针对DPU推出相应的软件开发包DOCA,通过DOCA软件开发框架,可以实现对卸载、加速和隔离基础架构进行处理,此外支持超大规模、企业级、超级计算和超融合基础设施。

未来,可以通过DOCA实现软件定义网络、软件定义存储、软件定义安全,利用DOCA与BlueField硬件的关联,对数据中心的存储、安全和网络进行操作。通过DOCA,在DPU的使用上可以获得更多生态方面的支持。DOCA开发包提供通信库与相应的API接口,方便开发人员进行操作。

目前DPU已经获得了系统、应用、安全等众多厂商的青睐与广泛支持,这其中包含红帽、SUSE、VMware、Fortinet等等。这其中UCloud作为NVIDIA的重要合作伙伴,一直致力于推动数据中心性能的提升。UCloud资深技术专家马彦青指出,UCloud对于DPU实现硬件的卸载,以及软件与硬件结合趋势的认知非常明确,通过与NVIDIA在网络与存储上的深度合作,对数据中心的业务和模型进行解耦。

利用DPU,UCloud在网络上对传统的VPC架构进行改造,打破网关瓶颈,提升了网络性能。此外,通过将DPU的NVMe SNAP的功能在嫁接到RSSD云盘之后,实现了计算和存储的分离。未来UCloud将对虚拟化架构和裸金属架构进行统一改造,通过将服务加载到DPU中,可以释放出更多的CPU算力。