客户介绍

自2017年成立以来,文远知行WeRide已崛起为全球自动驾驶科技领域的先锋,其研发、测试及运营足迹遍布7个国家的30多个城市,累计运营时间超过1600天。作为拥有中国、美国、阿联酋、新加坡等四国自动驾驶牌照的唯一企业,文远知行在全球多个关键城市设有办事处。

自动驾驶的算力创新:文远知行的GPU池化之路_AI技术

文远知行企业愿景:以无人驾驶改变人类出行

文远知行致力于开发安全可靠的无人驾驶技术,应用场景覆盖智慧出行、智慧货运和智慧环卫,已进入自动驾驶商业化运营阶段,商业营收居全球同类企业之首,形成自动驾驶出租车(Robotaxi)、自动驾驶小巴(Robobus)、自动驾驶货运车(Robovan)、自动驾驶环卫车(Robosweeper)、高阶智能驾驶(Advanced Driving Solution)等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。

2023年,《财富》杂志(Fortune)公布2023年改变世界的公司榜单(2023ChangetheWorld),文远知行位列第八,是唯一一家冲入前十的中国公司。

合作背景

文远知行在达成业务目标过程中,面临着以下算力挑战:

◾ 硬件采购成本高昂。随着公司业务的迅猛发展和算法研发团队的急剧扩张,对GPU卡的需求激增,这直接导致了硬件采购成本的大幅上升,成为主要挑战。

◾ GPU卡资源利用率低。客户通过监控工具监控GPU卡使用情况,发现GPU卡峰值在线率不足20%,平均在线率10%左右。GPU卡资源存在大量闲置、浪费的情况。

◾ 资源监管困难。GPU卡直接分配到对应的算法研发人员,基础设施运维人员难以对GPU卡资源使用情况进行统一监控、管理。

◾ 算法研发人员效率低。传统静态分配方式,算法研发人员需要监控基础设施层如内核驱动、Cuda驱动等问题,影响算法研发人员工作效率。

解决方案

在此背景下,趋动科技OrionX GPU池化软件进入了文远知行的视野,它的能力包括:

◾ GPU资源池化。通过部署趋动科技OrionX AI算力池化软件,并利用现有服务器的连接网络(RoCE v2 100G),用户可构建一个高效的OrionX GPU资源池,实现GPU资源的集中管理和高速互通。

◾ AI任务与GPU算力解耦。通过这个能力,研发人员可以直接在原有GPU服务器节点、或者在CPU服务器节点上通过网络方式远程访问OrionX GPU资源池内GPU资源进行算法研发以及算法调试工作。

◾ 资源按需申请。在不改变使用习惯的前提下,算法研发人员可以随时按需申请自己所需算力资源,不像以往受限于所分配到的算力卡的规格及数量。

◾ 丰富的调度策略。OrionX通过多任务叠加、GPU资源动态挂载、动态释放等丰富的功能和调度策略,能显著提升GPU资源利用率。

◾ 资源弹性动态分配、动态回收。算力池化后,相比传统一人一卡,或者一人多卡的静态分配方式,研发人员可根据实际需求申请所需卡数量和算力资源,算力资源再使用完成后会自动回收到算力池供其他人员申请使用,整个流程对前端使用者透明、无感。

◾ 算力资源统一管理。通过资源的统一管理和调度,算力资源的利用率得到提升,降低了硬件资源的闲置浪费,实现了物效的最大化。同时,OrionX还能够降低运维成本,提高资源的可用性和可靠性,进一步提升物效。

自动驾驶的算力创新:文远知行的GPU池化之路_GPU_02

图:趋动科技OrionX GPU池化解决方案

方案收益

通过方案比选,文远知行选择OrionX作为其面对算力挑战的“独门秘籍”。通过三年多的使用及实践,OrionX为其实现的收益如下:

◾ 显著降低硬件采购成本。据统计,即便在算法研发团队规模较往年扩大数倍的情况下,通过OrionX对利用率的提升,研发部门对GPU的采购需求减少超过80%。

◾ 提升算法研发人员效率。算法研发人员不再需要花精力在基础设施层协调、等待算力等,可以更加专注于算法研发,缩短公司业务模型研发周期。

◾ 简化运维、统一管理。OrionX将GPU算力池化后,大幅提升了用户基础架构运维人员的管理效率,降低日常运维工作量。

◾ 实现资源统一管控。公司层面实现了核心资产GPU资源统一管控、统一分配。让GPU资源管理变得直观便捷,使研发团队能够更专注于创新和开发工作本身。

客户评价

“自2020年初建立GPU资源池以来,我们算法工程师团队规模已经实现了数倍增长。即便在未对GPU资源池进行大规模扩展的前提下,我们依然通过OrionX高效的远程调用和智能调度机制,充分利用算力资源池的潜能,保障研发顺畅高效进行。这一策略不仅全面满足了日益增长的算法研发需求,而且还显著提升了GPU资源的利用率,展现了我们在资源管理和优化方面的专业能力。” - 彭老师 | 文远知行研发工程师

合作展望

展望未来,趋动科技将继续发挥自身在AI算力池化领域的技术专长,为文远知行提供更稳固高效的算力调度能力,并共同见证以无人驾驶改变人类出行的愿景实现!