虽然AI深度学习的发展已经到了令人赞叹的地步,但是,在一些专业领域,AI落地仍遇到瓶颈,一直未有大的突破。数据显示,2018年人工智能的行业渗透率仅4%,2021年这个数据也才7%。有知名人士预测,2026年人工智能的行业渗透率将达到20%。

“让行业用户甚至是中小用户也能利用大模型开展深度创新,从而加速整个社会的智能化升级。”浪潮信息副总裁刘军在技能大模型推出时这样表示。半年后,“深度创新”得以在浪潮智能客服领域实现。智能客服大脑不仅支持自然语言交互服务、智能运维与诊断,还支持对专家工程师、备品备件等资源的智能管理与调度。


巨量模型落地考 浪潮服务大脑如何跨越产业鸿沟_IT


这是浪潮信息走出的一小步,未来能否将这一成功模式在其他行业进行复制?“大模型“的创新路径能走多远?我们能否借助大模型的智能化生产力,从智能感知、智能交互和智能决策等层面,帮助企业实现“降成、增效、创新”?

AI落地正在迎来新的大考,拭目以待。


以巨量模型做引擎,AI不再“装烟囱”


在工业领域如制造业、物流等行业,AI落地为何举步维艰?原因是,专业性以及由此带来的多场景化是一道巨大的门槛。

“2019年我们就上线了任务式对话、知识图谱等多种类型机器人。”浪潮信息服务总监陈彬在谈到智能客服系统时指出,基本上市场迭代过的机器人浪潮信息都落地使用过。

当时,浪潮信息用多个小模型、小知识库搭建系统以此来完成不同的任务。不过,设计者很快发现,这样的系统搭建目前已经走到了一个瓶颈期,无法达到理想中的智能化程度。

“在引入大模型之前,我们还是遇到了比较大的困难。”陈彬解释说,IT行业的技术问题大多呈现专业度高、复杂度高的特点,不仅需要专业技术人员参与训练,更多的问题需要经过多轮对话之后才能理解客户真实的服务意图。“如何让机器人学会引导客户提问,学会结合上下文语义理解就是一大难点。”

智能客服的另一大难点源自浪潮信息强大的背景。浪潮信息是中国大型的AI、边缘和云服务器提供商,根据IDC2022年8月发布的2021H2《全球人工智能市场半年度追踪报告》(Worldwide Semiannual Artificial Intelligence Tracker)显示,2021全年,全球人工智能服务器市场规模达156亿美元,浪潮信息市场占有率达20.9%,保持全球市场第一。在此境况下,浪潮服务团队不仅面临高强度的服务压力,还需要在专业壁垒高、低容错率的服务要求下,以数字化、智能化技术提升服务全流程的质效水平。除此之外,浪潮信息的数据中心业务涉及多元业务流程、硬件和软件的交叉,也使得智能系统在实际业务中面临着一个比C端更复杂的场景。


巨量模型落地考 浪潮服务大脑如何跨越产业鸿沟_IT_02

浪潮信息的服务工作直接关乎客户侧数据中心的稳定运行


按照传统的AI模式,每个知识库都需要人工或半人工搭建,维护成本非常高。经过多年的持续建设后,还会形成重重烟囱式系统,导致客户体验参差不齐。

业内对此的共识是,这种装烟囱似的AI搭建模式,随着投入越多,其边际效用将会逐渐递减,无法达到预期效果。对浪潮信息来说,成本是一个必须要考虑的因素,但更为关键的问题是,这样的方式不利于数据资产的统一管理,更加不利于整体服务能力的提升。

近几年,IT巨头纷纷推出的巨量模型也让AI产业落地找到了新的方向。浪潮信息和谷歌、微软,阿里这些国内外AI 头部企业纷纷加码巨量模型的投入与研发。从OpenAI 的 GPT-3 ,到DeepMind 的 Gopher ,再到浪潮信息2021年推出的全球最大的中文单体巨量模型源1.0,模型的参数越来越高,耗资也越来越大。


巨量模型落地考 浪潮服务大脑如何跨越产业鸿沟_数据_03

浪潮“源”是当前全球排名前列的大规模预训练模型之一


“大模型并不是新一轮的炫技,它更多源于人工智能产业的现实需求。”刘军指出,AI应用场景已经从碎片化过渡到深度融合的一体化,在算法模型方面,巨量模型将会成为AI算法规模化创新的基础。

将大模型蒸馏成相对轻量的、更垂直的模型,已经成为产业界的普遍做法。“以大模型作为基础能力,通过蒸馏实现相关小模型,不仅实现(产业落地)的速度更快,智能化水平也更高。”浪潮信息AI软件研发总监吴韶华进一步解释说。


巨量模型落地考 浪潮服务大脑如何跨越产业鸿沟_数据_04


打破传统多模型驱动,革新训练模式


自己造的降落伞要自己先跳。浪潮信息一直秉承这样一个理念。他们试图寻找这样一种融合:以“源”大模型为引擎,以专业的服务平台为基座,通过知识积累和团队合作,在其熟悉的智能客服领域打造出“智能客服大脑”。

“其实,我们当初也一直在讨论,要不要花这么大精力,把传统的服务场景做成AI相关技术和算法进行落地。”浪潮信息服务总监陈彬强调,从目前取得的成果来看,当时的坚持是正确的。

如何将大模型与契合场景需求的行业模型进行结合?浪潮信息在这方面开启了先河。“把一个小孩从小学培养到大学,完成通识教育,再让他学习IT运维的专业知识。”陈彬解释说,“按照这样的方式将AI训练分为两个层次后,极大减轻了我们业务侧的训练负担。”

“源”大模型有着深厚的学术根基。他总共阅读过大约 2000 亿词,是全球大型中文数据集。假如一个成年人一年读100本20 万字书, 2000 亿词需要一万年才能读完。在一项中文语言理解测评上,他有10项子任务获得冠军,在成语阅读理解填空项目中,表现更是超越了人类智能。

浪潮信息给这位“大学生”准备了充足的专业知识库,包括2万余份产品文档、用户手册,百万余条浪潮信息专家工程师服务对话、数十万份日志、工单数据等。

凭借“源“强大的学习能力,智能客服大脑能够对上述知识库进行自主化学习,不再需要人工进行一条条的问答填充和标注,由此给“训练”带来了颠覆式的变革。

在谈到“源”大模型给智能客服带来的收益和成效时,陈彬介绍说,以往智能客服是多模型、多数据库的,技术架构相对复杂,维护难度非常大。升级为大模型驱动,智能客服大脑完成了将传统烟囱式的、碎片化的AI应用开发转向了集中式开发,有效缓解了碎片化开发反复建模的困境。

“以前我们每周都要让技术专家花费将近20多个小时,来做机器人训练,现在这部分时间被完全解放出来。”陈彬进一步指出,“智能客服大脑还支持对企业文档、知识库和内部的产品资料的同步学习能力,可以让我们的智能客服保证专业知识的实时更新。”

可以说,浪潮信息打造了一个全流程的智能客服大脑。通过知识蒸馏、压缩等技术,“大脑”实现了知识编码、智能问答、知识抽取、故障推理等多种能力。凭借强大的智能交互水平,实现了对用户问题更高精度的回答。

在此基础上打造的“源晓服”也已经成长为一位专家级智能客服机器人,不仅可以对一些复杂的技术咨询进行智能提问引导,还能针对问题进行精准定位,给出专业解答。“源晓服”管理浪潮信息八大产品线的技术售后,覆盖终端用户92%的咨询问题。对于一些常见技术问题,如系统安装、Raid配置、部件异常等问题,“源晓服”的解决率高达80%。

“这意味着我们的智能客服不仅要理解客户所问的问题,定位出客户所问问题的方向和归类,还能给出精练的、正确的和贴切的答案。”陈彬进一步补充说,“‘源晓服’还可以对用户已经输入的信息的自动查询匹配,最大程度上减少客户在对话交流中花费的时间。”数据显示,和人工客服需要10分钟才能解决的事在智能客服中可能10秒钟就可以得到解决。


构建行业智能引擎,推进AI落地走向深水区


在业内人士看来,智能客服大脑无疑是巨量模型与应用场景融合的又一成功案例。从数字化转型到推出巨量模型再到智能客服大脑,浪潮信息不断以“小步快跑”的姿态推进AI应用走向深水区。

目前,智能客服大脑不仅支持自然语言交互服务、也能够实现对已授权IT设备的智能运维与诊断,还可以支持对专家工程师、备品备件等资源的智能管理与调度,已然成为支撑浪潮信息服务智能化转型的核心“大脑”。

当然,浪潮智能客服大脑的意义不在于可以替代人,而是可以打破传统以多知识库、多模型驱动的智能客服底层架构,建立起一套知识流转的模式,协助团队有效控制成本和人力规模,并提高智能服务的质量。据陈彬介绍,智能客服大脑目前以InService平台为载体对外提供服务,该平台免费开放给浪潮信息的客户使用。

“‘源’大模型十分受到行业关注。在交通、金融、医疗等行业,很多客户在寻求合作。”吴韶华表示,有医疗机构的客户基于“源”大模型做的医生助手对话机器人,也有偏于娱乐方向的客户,做剧本杀机器人、正能量机器人等。

浪潮信息构建了“行业大脑”的解决方案,可以直接面向企业,以标准化的流程助力企业构建满足自身客户需求的“行业大脑”。这个解决方案指的是浪潮信息基于“源”大模型构建的行业认知智能引擎,包含智能数据中心、智能知识中心、大模型算法基础设施、AI应用平台。这个智能引擎未来将充分适配多行业,打通企业数据闭环和多类业务场景。

该引擎支持企业进行云端联合训练和本地推理部署。通过云端平台,行业用户只需要上传企业专有知识,就可以实现数据分析、数据传达、数据清洗、模型训练、模型优化、模型评估、模型验证的完整过程。在本地,可以根据场景需求,配置不同的硬件和算力设施,部署模型推理服务和进行高价值的数据分析。

AI落地的成效正在从浪潮信息的智能客服领域,向其他行业延伸。智能客服大脑不仅是浪潮信息业务转型的一个重要尝试,也是行业内关于巨量模型的一个新的探索。意味着“大模型”可以不再停留在实验室,而是真正的开始赋能行业。

(本文转自财新网)