0 前言


2018年7月,工业和信息化部印发《推动企业上云实施指南(2018-2020年)》(以下简称《指南》),推动企业利用云计算加快数字化、网络化、智能化转型,推进互联网、大数据、人工智能与实体经济深度融合。


《指南》文件大力倡议企业利用云平台开展研发设计服务:“使用计算机辅助设计、产品开发等云服务,在云端部署开发、设计环境,提升研发效率和创新水平。”这一表述正式将“工业研发云”推至前台,向制造业管理层及信息化部门提出了重要命题。


作为专注于“工业研发云”研发及实践工作近十年的企业,上海泛云信息科技有限公司(以下简称“泛云科技”)不仅向北京、上海、深圳等超级计算中心输出技术,帮助其构建工业计算SaaS云服务平台,近期更与上汽乘用车、阿里云携手,成功搭建了业界首个IaaS混合架构工业研发云,帮助上汽乘用车IT团队转型成为SaaS服务商,平台运营至今成效斐然。


我们将结合这些项目,深入剖析企业研发业务上云的价值,重点论述科学利用公共云资源的方法,理顺智能制造时代背景下的工业研发云发展路径,为中国制造业的创新发展提供一些参考思路。


1 为何上云


研发设计是制造业核心竞争力的重要引擎,无论是行业巨头,还是后起之秀,都在研发设计业务领域持续创新,力求加速进化研发能力,打造企业品牌价值,进而争取产业链话语权。


中国制造企业正处在转型升级的关键时期,为何要将研发设计业务上云?云计算可以给研发设计工作带来什么益处?相信这是企业管理层关注的首要问题。


为了回答这个问题,我们需要分析企业内部研发业务发展所面临的刚性需求,同时也要关注企业外部环境变化所带来的挑战与机遇。


1.1 业务发展需求

企业内部研发业务发展是研发云的根本动力。在一个研发设计业务蓬勃发展的企业,我们不难发现其对高效能、高弹性的计算资源具有极其强烈的需求:

1)CAX业务繁重

先进制造企业研发部门已经大量使用以CAD、CAE、CAPP等软件为代表的CAX研发工具集,三维设计、数值仿真等业务日趋繁重。以数值仿真为例,很多企业中普遍出现计算任务工况多、规模大、时间紧的情况,迫切需要快速获取高性能计算资源,高性能计算(HPC)资源扩建的需求报告提交频次非常高;同理,三维设计人员对高端图形工作站的需求也是非常强烈。


2)资源迭代滞后

CAX业务发展所引发的计算资源需求是刚性的,但是在企业实际运营场景中,计算资源的建设、扩容以及更新等工作的迭代过程是缓慢且滞后的。以上汽乘用车为例,高性能计算(HPC)集群虽然经历多次扩建,但是硬件严重老化,设备故障率居高不下,计算性能难以满足业务需求,且资源更新迭代速度缓慢,严重影响仿真研发业务进度。


3)基础运维落后

基础运维工作是制造型企业IT部门的长期痛点。私有计算资源规模日渐扩大,但是企业运维人员的IT技能更新缓慢,基础架构运维工作又远离企业主营业务,得不到足够的重视与投入。调研显示,国内很多企业的IT管理人员长期忙于解决硬件故障、调度软件异常等基础问题,缺少自动化运维工具和系统知识支撑,无暇顾及理顺计算资源与研发需求的动态匹配关系。


4)资源弹性缺陷

资源弹性是云的重要特征,但是在私有云(集群)场景中,计算资源能力上限完全受制于私有云(集群)的弹性上限。然而,企业研发业务对计算资源的需求总量并非静态常数,而是具有明显峰谷特征的波动形态,这就对计算资源体系的弹性特征提出了明确的要求,一个封闭的私有云(集群)显然是存在天然缺陷的。


5)用户体验黑洞

用户体验是云平台的引力要素,研发人员希望获得流畅、高效、弹性的计算服务,而研发云是当前技术条件下管控能力最佳的实现形式。但是不管是私有云,还是公共云,都可能引发一个用户体验黑洞的问题,这个问题不仅制约着本地集群的应用体验,也是公共云、混合云计算模式的一个很关键的风险点,那就是数据与计算力的匹配协同问题。以数值仿真为例,如果在本地PC(线下)进行前后处理,而在HPC集群(线上)求解计算,必然会导致数据文件的频繁挪动,这个问题在私有云场景中只是割裂用户的连贯性计算体验,而在公共云、混合云场景下将会因为带宽资源限制严重影响用户体验。


1.2 外部挑战机遇

企业外部环境变化是研发云的发展催化剂。在日益紧密的产业链协作、日趋激烈的国际竞争环境下,企业管理层将会逐步发现研发云是一个天然的、先进的创新能力载体,为企业核心竞争力转型升级带来新的挑战与机遇:

1)资源供应链演进

“互联网+”的核心思路是利用互联网在社会资源配置中的优化和集成作用,而在工业领域,研发设计业务上云则是充分利用互联网计算力的规模、配置优势,快速响应企业计算资源需求,改善企业IT服务模式。计算资源互联网化是企业IT供应链演进的新阶段,随之可能促发知识资源互联网化,为企业重新打造一个更具活力的供应链新物种。


2)创新协作模式变革

工业领域的创新协作是业界长期关注的焦点问题,然而业界普遍看好的全数字化交付型协作,却构建在难以充分保护知识产权的技术基础之上,表现始终差强人意。由于云平台的多宿主特性,结合互联网的公平特质,工业研发云有望成为创新协作模式变革的重大机会点,洞察研发云特征优势的企业将会获得发展先机。


3)云模式的选择与挑战

工业研发云的部署形式可分为私有云、公有云以及混合云,而在公有云资源接入模式上又可分为SaaS公有云(传统超算)和IaaS公有云,这将给企业用户带来很多困扰。选择不同部署形式的研发云,将会决定计算资源的弹性特征;而选择接入不同类型的公有云,则将给企业创新能力的战略延展性进行定位。选择接入SaaS公有云的优势是成本低、易实现,但是企业放弃了平台运营权;而IaaS公有云则是将用户认证、核心数据管理权限、资源调度规则等运营自主权交还用户,适合重视战略延展的高端企业。


4)企业创新能力升级

研发设计业务上云不仅仅是利用云计算技术重构企业IT基础架构,也不能简单视为将企业内部使用的工业软件部署在云上。工业研发云具备一种非常重要的先天特质,那就是可以在互联网生态环境中与第三方创新工具、智力支持资源进行快速融合,弹性扩展工业研发云的生态自发展能力,从而实现企业创新能力升级。


5)产业领军战略引力

对于一个具有战略眼光的产业领军企业来说,研发业务上云是企业上云战略中的一个重要组成部分,既是汇聚产业生态圈内创新知识及数字化能力的平台,也可帮助企业构造一整套包括研发云在内的设计、仿真、生产、制造、销售、维修的生态闭环,带领合作伙伴共同向产业链下游用户提供高附加值智能制造服务。


综上所述,无论从内部需求,还是外部机遇来看,研发设计业务上云将是一次重要且难得的发展机遇,对于企业核心竞争力的发展有着极其深远的影响。


2 如何上云


不难看见,《指南》推动之下,企业上云行动将会如火如荼的展开,各种云计算技术、架构乃至算法模型将百花齐放,必然对企业信息化部门的分析、规划以及架构能力提出严苛的挑战。


聚焦研发设计业务上云的专业方向,企业该如何选择合适的上云路径?基于多年项目实践积累,我们给出三条原则性建议:


2.1 持续优化研发云平台架构

无论是单机、集群还是云模式,工业研发云的本质仍然是研发设计数据生产平台,因此研发云的平台架构必然与工业研发数据的生产方式密切相关。

工业研发设计过程中所产生数据可以按其目标进行分类:以CAD为代表的表征几何特性的非结构化数据,以CAE为代表的表征物理特性的非结构化数据,以PDM为代表的表征管理特性的结构化数据。这些数据的生产方式又可分为:人机频繁互动的交互型生产,长期静默运算的计算型生产。由此可见,理想中的研发云平台架构需要满足以上目标数据的差异化生产方式要求。


泛云科技于2012年提出了一个通用的工业研发云平台架构,并在后续项目实践中不断补充完善,持续优化演进,目前已经在私有云、公有云以及混合云项目中得到了充分的验证与完善。


在研发云平台中,资源角色根据业务属性分为计算云、应用云、存储云、许可云、云管理系统、平台接口,为企业用户提供全方位的研发数据生产服务。各个角色的分工如下:

1)计算云:改进传统高性能计算调度机制,提供静默运算型应用服务;

2)应用云:利用远程可视化高清传输协议,提供人机交互型应用服务;

3)存储云:面向CAX数据生产及管理需求,提供非结构化数据存储服务;

4)许可云:聚集工业研发设计软件许可证,形成弹性可控的许可证服务;

5)云管理系统:为研发、运维人员提供便捷、高效的应用及管理门户。

平台接口:云平台的代码级服务接口,便于第三方系统调用研发云能力。


2.2 科学利用云端组件及技术


企业研发上云实践_java

图1 研发云平台的组成


得益于互联网场景的快速实践,云计算技术的迭代与演进进程非常迅速,对于研发云平台建设者来说,云端组件、整合技术的选择也成为了非常重要的研究课题。


基于研发云项目实践经验,泛云科技建议将该课题进行分类解析:

1)性能类需求

针对性能类需求,由于云计算技术厂商(尤其是公有云平台)正在加速迭代进程中,在投资体量相同的情况下,公有云计算性能远远领先于企业自建设备,因此建议性能要求较高的应用场景应该尽快迁入公有云。

但是由于公有云的物理属性,企业在购置其计算力组件服务的同时,必须购置相应的安全服务保障,以上海汽车仿真计算云SSCC平台为例,我们采用了以下整体解决方案:


企业研发上云实践_java_02

图2 上海汽车仿真计算云SSCC平台采用的整体解决方案


该方案利用VPC专有网络将阿里云中的SCC高性能计算节点安全接入企业统一计算环境,并且利用企业自有AD进行用户认证及行为审计,同时利用阿里云EGS图形实例进行云端在线前后处理,减少CAE计算数据的无效下载消耗,帮助企业节省带宽费用成本。


2)管理类需求

针对管理类需求,云计算技术往往仅能满足最低限度的共性要求,如果需要构建符合企业研发管理需求特征的系统,建议进行技术组件的深度定制与改造。


以计算云为例,无论私有云还是公有云领域都存在一个误区,认为利用队列调度、节点监控类工具就可以完成搭建工作。实际上针对静默运算型应用服务的管理需求,必须分解为:资源配额(业务需求)、角色关联(业务链路)、队列调度(运行实例)、运维分析(业务反馈)。由此可见,研发云平台中的计算云组件并不是简单复制传统HPC架构,而是需要进行更深层次的业务解构与升级。


2.3 恪守企业计算资源计划方法论

针对前文所述的计算资源管理类需求,技术方案只是必要条件,其充分条件则是构建一套科学规范的企业计算资源计划方法论。

泛云科技在2013年即提出“企业计算资源计划”理念、方法及系列实践工具:


企业计算资源计划(Enterprise Computing Resource Planning,简称ECRP)承袭ERP系统化管理理念,以企业级软、硬件资源作为管理对象,利用信息技术构建计算资源统一服务、调度、监控、统计及需求预测平台,实现企业计算资源全生命周期管理,进而为企业管理层提供决策辅助信息。

企业计算资源计划是ERP概念的重要衍生,ECRP聚焦于企业业务流程中的核心数据生产环节,融合先进信息技术与精益管理思想,改进现代企业的计算资源运行模式,促进合理调配计算资源,优化核心数据生产过程,提升核心数据生产效率,保障核心数据信息安全,促成企业实现计算资源精益化管理目标。


无论是在PC单机生产环境,还是研发云平台环境,企业管理层需要既有高屋建瓴的战略思考,又有细致入微的细节评估;既尊重IT技术迅猛发展的客观现实,也深切的考虑企业数字化转型的长期态势;不仅注重当下投入成本的经济考量,也审慎评估技术路线的趋势风险。恪守企业计算资源计划方法论,将是研发业务上云的重要基石。


3 云上研发


坚持服务于企业核心竞争力增长战略,深刻洞察产品设计研发发展需求,同时注重持续消化吸收新兴IT技术养分,我们不难打造各种类型的具有行业特色的研发云平台。


3.1 企业级设计仿真私有云

私有云具有天然的物理安全性,组件技术相对简单且成熟,因此通常是企业设计研发业务上云的第一选择。泛云科技迄今已经帮助近百家企业及研究院所搭建设计、仿真私有云,涉及领域涵盖汽车、船舶、航天、航空、电子、电气、核能、环保、水利、工程、家电、冶金等行业。


据统计,泛云科技所承接项目中约20%是升级改造硬件厂商的高性能计算或者虚拟化方案,约30%为替换友商的设计云、仿真云管理系统,均成功帮助用户及时避免项目夭折的风险,挽回企业部分经济损失。

得益于研发云架构的先进性与普适性,当前单个研发云的应用并发规模已经突破千人,真正实现了在企业内部构建核心数据生产闭环化的管理目标。


3.2 SaaS研发计算公共云

2013年起,泛云科技先后向北京市计算中心、国家超级计算深圳中心、上海超算科技、航天云网等国家级工业云平台输出产品与技术,协助建设互联网环境中的SaaS模式的工业研发云,成功聚合了一大批工业领域通用的CAD、CAE等研发设计类软件,并将其转化为即需即用的互联网服务。


中小企业用户无需耗费巨资购买高端工业研发软件,仅需在这些工业云平台上注册,不必下载软件,即可获得交互设计、求解计算等服务。值得一提的是,公共SaaS平台还可以根据行业研发特征需求,提供便捷高效的设计仿真自动化模板服务,帮助中小企业进一步缩短研发周期,节省设计成本。


3.3 IaaS混合架构研发云

2017年开始,泛云科技开始与IaaS公有云合作,为企业提供IaaS混合架构研发云解决方案,完成了业内第一例项目:上汽仿真计算云(SAIC Simulation Computing Cloud,SSCC)。


SSCC平台目前基于上汽本地计算集群、阿里云神龙高性能计算实例等组件,构建了一套统一的仿真数据生产环境,集成软件包括并不仅限于HyperWorks,EnSight,Converge Studio,Star-CCM+,Fluent,MSC.Admas,Abaqus,NCode,LS-Dyna,Converge,MSC.Nastran,NX.Nastran,OptiStruct,Star-CD,iSight等数十款常用软件,可为数百人的仿真分析团队提供在线服务,月均完成仿真计算任务达到上万例。


IaaS混合架构研发云模式可以帮助大型企业用户构建面向集团、行业的高弹性知识生产平台,既可以复用公共云的成熟的管控技术,又可以贯彻集团安全规范,资源开通灵活,节约了自建集群的资源投入和人力成本。以SSCC项目为例,上汽乘用车借助阿里云实现了工程开发仿真能力升级,各个提升仿真计算效率25%,帮助工程开发人员更加专注于产品设计和性能优化;这种高效合作的模式,可以快速扩展到产品研发的各个环节,加速研发到面市的进程,助力上汽乘用车为终端市场快速打造电动化、网联化、智能化、共享化的汽车产品和出行服务。


4 结论


在“企业上云”的大势驱动下,研发设计业务上云可以高效利用云计算的规模优势,在资源维度上构建企业核心竞争力,为企业创新工作提供新动能。

深入理解“企业计算资源计划”方法论,将有助于企业立足自身条件,审时度势,合理规划、建设、利用研发云平台,成为智能制造时代的弄潮儿与大赢家!