人工智能与网络架构技术结合
- 1.背景
- 2.设计考虑和原则
- 2.1 关键要求
- 2.1.1 数据管理
- 2.1.2 先进基础设施
- 2.1.3 灵活的人工智能部署
- 2.1.4 生态系统开放性
- 2.2 Gaps
- 3. 架构特征
- 3.1 总体设计范围
- 3.2 面向任务的通信
- 3.2.1 任务管理
- 3.2.2 资源编排/运行时间调度
- 3.2.3 数据管理
- 3.2.4 通信机制
- 3.2.5 RAN架构
- 3.3 边缘的深度融合计算和通信
- 3.3.1 新的计算方案
- 3.3.2 新的协议栈
- 3.3.3 更高的系统可扩展性
- 3.4 人工智能服务运营和管理
1.背景
大多数当前AI/ML实现执行集中学习,其中数据从整个系统收集,但培训在单个位置执行,通常在专用于这些类型计算的功率密集型数据中心(例如,使用特殊硬件)目前,人工智能与网络架构设计脱钩,网络架构设计主要被称为==cloud AI==云人工智能,这意味着底层网络仅用于将数据传输到云,数据处理和推理的主要智能位于云。然而,我们还没有看到这两个方面被一起考虑。
例如,当6G提供人工智能和传感作为新服务时,挑战变成提供安全可靠的网络基础设施来传输来自信息源的数据,以便进一步实施云中托管的学习方法或其他类型的可用资源。因此,我们必须了解能够为人工智能提供本地支持的网络体系结构类型。为此,我们还需要掌握构成整个人工智能帝国的三大支柱及其对移动通信系统的潜在需求。
**数据是**人工智能行业的**关键资产**,被称为“新石油”。随着第一波人工智能服务更加关注企业对消费者(B2C)案例,最终用户成为直接数据源。
数据的价值通过来自垂直行业的企业对企业(B2B)案例进一步货币化,这需要不同的用例、业务模型和技术要求。由于性能限制以及安全和隐私问题,我们预计行业数据将在系统边缘处理368,通常在企业场所内。因此,面向工业的人工智能服务将以更分散的方式提供,以本地为重点。这一趋势将导致一系列关于数据管理、处理、所有权处理等要求的讨论。一个既能满足这些要求又能完全遵守数据治理政策的移动通信系统将受到高度重视。
**计算能力**从根本上推动了人工智能行业。人工智能应用程序越强大,它需要的计算资源就越多。有鉴于此,基于中央云的计算资源池模型可能缺乏未来证明所需的可扩展性。
当我们特别考虑到来自垂直行业的前沿处理趋势时,仅在中央云中运行AI应用程序可能行不通。因此,一种新的协同效应正在将人工智能从云端深入移动通信系统,这是一种超高性能的基础设施,可以有效地管理具有可扩展性和弹性的异构资源。这一研究领域既令人兴奋又具有挑战性,因为它可能导致传统系统架构和设计理念的完全重组。
**算法**是整个人工智能业务的核心,定义了人工智能应用程序提供的智能类型,以及人工智能应用使用和消耗的数据类型和计算能力。
基础设施不知道人工智能算法是如何定义的,但它可以为运行这些算法提供更好的支持。例如,深度学习(例如,联合学习)的实现依赖于通信,通信可能涉及算法可伸缩性、带宽和延迟要求。鉴于此,网络系统架构的设计可能会影响人工智能算法的训练方式和人工智能推理的执行方式。
2.设计考虑和原则
cloud AI-> network AI
2.1 关键要求
2.1.1 数据管理
6G系统将固有地生成大量数据,这些数据从操作到管理、从控制平面到用户平面、从环境感知到终端都会有所不同。由于这些数据将来自不同的技术或业务领域,6G系统设计的新挑战将涉及有效组织和管理数据,同时考虑隐私保护
2.1.2 先进基础设施
在6G时代,信息、通信和数据技术将充分交织在一起,构建先进的基础设施。要使人工智能扩散成为现实,应支持对无处不在的连通性和计算资源的实时学习和推理。这将导致移动通信系统特别对于数据收集和处理具有高性能要求(例如,超低延迟和超高数据速率)。除此之外,为了在遵守隐私和安全约束的同时实现最佳性能,分布式和无处不在的计算资源需要来自所有类型利益相关者的所有资源类型的深度融合。
人工智能服务可以利用这一先进的基础设施充分发挥三大支柱(即数据、计算能力和算法)的潜力。
2.1.3 灵活的人工智能部署
轻松部署对于吸引外部合作伙伴的服务至关重要,特别是当它需要一定程度的网络和it专业知识时。该需求主要涉及平台能力的设计。换言之,人工智能服务应易于在6G中部署(在边缘或中心),平台不应限制服务迁移。
2.1.4 生态系统开放性
通过提供原生人工智能支持,6G将拥有比上一代通信系统更广泛的生态系统。
除了传统的电信运营商(如供应商、运营商、订户等),移动通信系统提供的新型人工智能服务将吸引更多的企业客户和垂直行业。而6G被设想为建立在作为其前提的多玩家生态系统上,因此,系统开放性(在业务和技术层面的合作方面)应该是容易、灵活和可信的。
尽管5G已经开始了扩大生态系统开放性的旅程,以建立一个具有垂直行业的新生态系统(例如,通过网络能力暴露[1]和应用程序接口(API)[2]),但它仍然依赖于基于标准化网络功能、程序和接口的传统电信倡议。在6G中,这些考虑应被视为建筑革命的内生原因。
2.2 Gaps
以上只是畅想,目前技术上的差距还有,5G引入了网络数据分析功能(NWDAF),主要目的是促进5G中的数据收集和分析
。NWDAF是专门为数据采集和分析信息提供而设计的5G网络功能。例如,它为其他网络功能提供分析信息,以帮助网络服务供应。NWDAF支持从5G网络功能和OA&M收集数据[3]。为了做到这一点,它还提供了注册和元数据公开到相应网络功能的服务。
然而,由于以下原因,NWDAF并不使5G支持人工智能。
•有限的数据来源:NWDAF主要涉及基于从5G网络功能接收的数据收集和分析。但是,它不考虑来自基础设施、环境、终端、传感器等的数据。
•无数据隐私保护:5G中考虑的数据源主要来自同一业务领域;因此,基本设计中不考虑数据隐私保护。
•不支持外部AI服务:NWDAF是5G核心网络功能,外部AI服务不能直接在5G核心网或RAN中使用。
•基础设施未得到充分利用: 5G架构的关键功能
(如网络切片、URLLC和mMTC)旨在满足性能、功能和运营角度的垂直需求。没有特别考虑为5G提供本地人工智能支持(例如,在数据管理和分布式架构方面)。
•无数据治理:人工智能不仅仅涉及数据收集和分析。为了为人工智能提供本地支持,应考虑独特的数据治理设计,这不在5G的范围内。
因此,本地AI支持是5G和6G之间的基本架构差异之一
3. 架构特征
3.1 总体设计范围
6G的基本作用包括构建超高性能基础设施,其特点是计算资源非常接近终端用户。该基础设施将满足高行业弹性标准。6G系统将无缝地协调所有类型的资源,并具有连通性,以完全融合计算和通信,总体架构设计的范围如图所示。
6G可以提供本地人工智能支持功能,这可能导致三种不同的业务模式
,如图27.1所示:IaaS(基础设施即服务)、PaaS(平台即服务)和AIaaS(人工智能即服务),这是从云服务中借用的概念。
•IaaS:在该模型中,移动通信系统协调运行人工智能服务所需的计算能力和连接资源(例如,来自云、边缘、基站和设备)。基本目标是提供满足人工智能服务要求的高性能基础设施能力。
也就是说,除了更快地传输更多数据之外,这种高性能基础设施涉及将人工智能服务深度集成到系统中,并确保它们无缝运行。重要的是确定这是否涉及重新设计的边缘计算概念或根本突破。
•PaaS:在这个模型中,6G基础设施本身就是一个人工智能平台,它可以协调人工智能工作流、管理数据和执行其他任务。例如,要执行人工智能服务,可能需要来自不同来源的数据,而聚合来自不同技术领域的数据可能是人工智能服务提供商的主要困难。
在这种情况下,PaaS模型可以通过利用ICT参与者在基础设施运营和管理方面的专业知识(特别是从传统的多供应商和多运营商场景中获得)为人工智能提供附加值。
•AIaaS:在该模型中,6G基础设施为外部客户提供人工智能服务。此类服务的示例可以包括人工智能支持的高精度定位和用户移动性趋势等。
这三个模型可以很好地共存,因为它们涵盖了来自不同客户的多样化人工智能服务需求。在这种先进基础设施上运行的人工智能服务将带来许多优势
,如下所示。
•从全球人工智能到本地人工智能:从全国联网的角度来看,集中学习成本太高,因为它涉及通过整个网络收集数据并将数据发送到中央实体。也就是说,本地人工智能或本地和全球人工智能的组合可能有助于降低功耗,从而降低成本。尽管如此,这种数据收集方法和中心培训将很快导致中心位置或中心位置周围的瓶颈和单点故障
(例如,用于培训的数据中心的可用性、通往数据中心的关键路径的使用以及这些关键路径上节点的可用性)。此外,通过集中式学习方法训练或使用私有数据可能不可行,并且可能不授予授权。
•从离线人工智能到实时人工智能:此外,传统的ML解决方案很大程度上依赖于离线培训,包括访问培训数据或建模和模拟环境的抽象版本。然而,这个过程的缺点是它简化了许多细节,同时也忽略了许多重要的度量,这反过来会损害性能增益。幸运的是,高性能分布式基础设施可能会为实时人工智能(包括培训和推理)开辟一组新的可能性,特别是对于具有严格延迟要求的用例(例如,工业场景的闭环控制)。
3.2 面向任务的通信
是6G范式转变的关键之一,涉及面向任务的通讯模型,该模型旨在支持人工智能和传感等新服务。传统的移动通信服务(例如,语音和数据)都是面向连接的,这意味着通信资源是基于来自终端用户和预期服务的主动请求来分配的,而不管用户是否打算与其他用户通话,或者他们是否打算连接到云中的服务器。结果是基于用户的意图建立连接。
相比之下,面向任务的通信涉及一种截然不同的设计理念,即基于网络为用户提供的内容建立连接。例如范例一,人工智能任务将根据用户移动性、实时人口分布或终端使用强度收集和处理特定地理区域的数据。公共交通公司可以利用这些信息来了解城市的流动性,特别是在高峰时段。因此,这些公司将使用6G中的人工智能服务,而不定义如何从特定用户收集数据以获得特定信息。
例如范例二,感测任务可以跨不同频率执行无线电环境的3D映射。这种能力可以实现新的用例,例如具有高精度定位和跟踪的实时传感,以及手势和活动识别。这些任务是通过协调多个基站、包括连接性的终端和计算资源来完成的,如图所示.
其中,前面有提到,面向任务的通信解决方案的创建可能包括四个主要方面:任务管理、资源编排或运行时调度、数据管理和通信机制。
3.2.1 任务管理
从体系结构的角度来看,可以为任务管理引入新的网络服务和API,包括在整个生命周期中定义、操作和管理任务。任务管理可以将任务分解为功能子任务
,由于访问和终端格式的异构类型,这些子任务需要通过各种方法实现。在深度融合的计算和通信平台上执行任务可能意味着本地执行各种子任务。
3.2.2 资源编排/运行时间调度
在传统移动通信系统中中,基于主动连接建立请求来管理资源(特别是在无线电接入侧),并且基于设备预订信息和服务类型来调度资源。
为了执行任务,该系统需要在不同地理位置的不同通信设备之间协调和访问计算资源。从资源的角度来看,一个任务可以分解为计算任务和通信任务。前者可以跨不同的云、云边缘、基站和设备建立,而后者可以跨多个小区在不同类型的设备之间建立。而我们的新系统中,资源编排或运行时调度将基于系统提供的任务,而不是来自终端用户的请求。不是保留无线电资源来建立会话以供双方彼此通信,而是调度计算和通信资源来执行区域X中的任务。
任务的资源编排或运行时调度应根据任务的地理和工作范围提供资源的整体视图。如果在单个技术或业务域中执行任务,则可以利用所有现有的网络管理经验。对于大规模分布的多玩家场景或系统,E2E资源编排和运行时调度将变得具有挑战性(例如,在信任建立、收费机制和审计方面),新方法可能会出现。第31章深入探讨了这些新方法的更多细节。
3.2.3 数据管理
关于执行任务,需要探索的一些新领域是数据收集、隐私保护、信息存储、网络能力和知识暴露。 数据治理是一种专门的架构技术,用于在更广泛的范围内管理数据,
如第30章所述,可以利用它提供本地人工智能支持。
3.2.4 通信机制
为了支持任务的通信机制,可以例如在设备和环境传感器以及通信和计算设备之间建立许多连接。就任务性能而言,它涉及灵活高效的多用户/终端、多访问和多计算协作。因此,可能需要从根本上改变传统机制(如会话和移动性管理)。
3.2.5 RAN架构
为了有效地执行任务,我们的解决方案是在网络服务层分离任务控制和用户计划功能,这样任务控制可以在大范围内执行
。因此,6G基站可以在逻辑上分为两部分:控制节点(表示为cNB)和多个服务节点(表示SNB)。cNB对分布在大区域中的多个SNB提供任务控制功能。这种设计可以减少公共控制信息的开销。sNB提供变体终端和网络设备之间的连接。``cNB和sNB是超出物理设备格式的逻辑实体。使用这样的设计,RAN中的资源可以容易地分组为虚拟集群,
每个虚拟集群可以被控制,例如支持不同的任务。这样一个集群的优势在于,它控制一组可管理的站点上的所有相关资源,可以实现更好的资源管理
。集群区域大小应足以支持执行的任务。
3.3 边缘的深度融合计算和通信
边缘的深度融合计算和通信:6G系统预计将服务,行业场景需要最佳性能和本地数据处理
;因此,我们的解决方案是:边缘节点成为未来移动通信网络的关键创新平台
. 移动边缘计算或所谓的多址边缘计算(MEC)是一个在移动通信领域中越来越重要的成熟话题。它将计算能力从集中位置扩展到移动通信系统的边缘,从而在网络功能部署和操作方面提供灵活性,以及更好的网络性能(例如,延迟)
。然而,许多实用性挑战限制了边缘节点的部署。例如,当安装了安全网关(SeGW)时,在RAN和SeGW之间部署边缘节点涉及大量困难。这是因为IP安全(IPsec)会话不能中断,如图所示
。另外的挑战是,由于无线电接入架构和相应通信逻辑的限制,我们无法在RAN的深处部署边缘。
在6G中,RAN级别的深度融合计算和通信是需要考虑的基本因素,我们在以下上下文中将其称为“深度边缘”。
深度边缘位于数据源附近。
通过使用深度边缘,AI服务可以本地集成到RAN架构设计中。`
深度边缘我们的目标一个是在移动网络边缘运行云IT服务器
。我们还需要考虑重建RAN体系结构,还有打破边缘限制,最小化对协议栈的影响,并提高整体系统的可伸缩性
。对深度边缘的研究可包括以下方面。
3.3.1 新的计算方案
目前,已经可以利用RAN中的AI能力。例如,我们可以优化资源调度并减轻干扰。也就是说,这是移动网络使用人工智能而不是原生支持人工智能的主要原因,这是两个不同的概念(即,人工智能用于网络与人工智能原生网络)
。我们将详细讨论后者。
为了将边缘计算能力深入集成到RAN中,可能会出现一种新型的无线电设备,称为无线电计算节点(RCN)
,以将其与无线电接入节点区分开来,如图所示。``在RCN中,可以引入独立的计算平面来承载各种任务(即AI和传感)或其他扩展控制平面(CP),用户平面(UPs)等。
这种类型的计算资源不仅涉及将刀片放置在无线电接入节点中,而且还需要考虑RAN架构的总体设计,这反过来将允许计算资源与RAN中的通信能力无缝融合。例如,可能需要本地控制器来控制无线通信资源、功能和AI管道。
此外,要求是应指定相应的接口、应用程序和协议,以支持部署在深边缘的服务之间的动态部署和高效通信。这样的服务可以利用减少延迟、运输成本、潜在安全风险和隐私问题的优势。
3.3.2 新的协议栈
深度边缘还可能导致重新设计的协议栈,例如,可以简化协议栈以探索支持面向任务的服务(例如AI工作流)的高性能解决方案。在5G系统中,通过核心网络的基站和UPF,在云中的UE和服务器之间建立数据连接。为了在RAN级别上深度汇聚计算和通信资源,在UE和托管在深边缘的计算平面中的POD或容器之间直接建立连接,使得通信机制能够显著简化。因此,可以实现提供支持关键实时服务的高效通信的目标。
3.3.3 更高的系统可扩展性
移动通信系统用于全国范围的覆盖(例如B2C类型的服务)以及本地范围的覆盖范围(例如B2B类型的服务)。
因此,深度边缘节点的数量可能在数百万左右,它们都不应该是孤立的资源。有可能建立一个基于大量独立但可控的深度边缘节点的大规模网络,这些节点可能跨越不同的技术或业务领域
,承载大量智能。从一个角度看,这将是一个高性能的网络
,从另一个角度来看,它还是可扩展、开放和透明的
。数据和服务的有效同步、运行时调度、合适资源的选择以及本地(例如工业)应用的识别是系统架构设计的重要方面
。
通过深度边缘节点形成大规模网络,可以执行局部和全局组合的人工智能,而不是纯全局人工智能。直接应用是,可以在更大的规模和范围内利用行业数字化转型。
3.4 人工智能服务运营和管理
人工智能服务运营和管理框架是设计本地人工智能支持架构时需要考虑的另一个重要方面
。该框架用于促进人工智能服务(特别是来自外部提供商)的无缝集成和部署。
•人工智能服务运营:6G将建立在多玩家生态系统上,该生态系统本质上涉及多个技术和业务领域。就人工智能服务运营而言,该生态系统应能顺利高效地运行,尤其是在多运营商和多供应商场景下。为了在零信任情况下建立业务关系,人工智能运营可能需要区块链等技术。
•人工智能服务管理:人工智能服务的管理包括人工智能工作流协调和数据管理,以及计算和通信资源协调。
如图27.5所示,为了跨不同的业务和技术领域运行AI服务,我们必须定义单个管理领域或跨不同管理领域使用的关键接口
。第31章扩展了支持多玩家协作的平台的建立。在移动通信系统内定义接口的常规方法可能被标准化。然而,不建议构建完全依赖于该标准化的新框架
。相反,该领域的最佳实践,例如人工智能框架本身,可以在高级开源组件上加以利用[4,5]。通过这种跨域框架,可以在6G网络中编程和部署E2E AI管道。人工智能服务运营和管理框架是传统移动通信系统架构之上的新组件。因此,将引入新类型的网络功能或设计原则,例如
,如下。
•人工智能服务运营:出于隐私保护的考虑,架构的剥夺功能可能会使人工智能服务操作无法看到某些信息,这不可避免地会受到影响。也就是说,该架构将为人工智能服务操作提供支持,以减轻这种影响。
•资源管理:人工智能服务是计算和通信密集型服务。 因此,资源管理涉及适当管理设备、服务器(或服务位置,例如数据中心)和网络的计算和网络资源。不适当的管理会导致高功耗,并且还会导致网络和服务性能(例如,延迟)的恶化。
•人工智能服务部署:该架构将促进人工智能服务的部署。这包括根据服务级别描述确定部署位置和相应的互连。