Edge Computing:Vision and Challenges

Abstract

由于物联网的普及,推动了边缘计算的出现。边缘计算要求在网络边缘处理数据,通过边缘计算有可能解决响应时间、电池寿命、带宽成本以及数据安全隐私等问题。在本文中,首先介绍边缘计算的定义,接着介绍几个案例研究,从云卸载到智能家居和城市,以及实现边缘计算概念的协作边缘。最后提出了边缘计算领域的一些挑战和机遇。

Introduction

作者预计到达2020年,至少有500亿件东西连接到互联网。有些物联网应用可能需要很短的响应时间,有些可能涉及私有数据,有些可能产生大量数据,这些要求都可能对网卡罗造成沉重负担,当前的云计算的效率不足以支持这些应用程序。因此为了提出边缘计算的概念,作者首先分析了为什么需要边缘计算,然后给出了边缘计算的定义和展望。介绍了云卸载、智能家居和城市以及协作边缘等几个案列研究,以进一步详细解释边缘计算,随后介绍了可编程性、命名、数据提取、服务管理、隐私和安全方面的 一些挑战和机遇,以及值得进一步研究的优化指标。

What is Edge Computing

越来越多的数据是在网络边缘产生的,因此在网络边缘处理数据将更加有效。当数据在网络边缘产生时,云计算并不总是对数据处理有效。

Why do we need Edge Computing

  • Push From Cloud Services:在之前已经证明了由于云的计算能力远超边缘事务的能力,将所有计算任务放置到云上进行数据处理是一种有效的方法。但是我们发现与快速发展的数据处理速度相比,网络的带宽已经停滞,由于数据量不断增加,数据传输速度正成为云计算的瓶颈。对于需要实时处理的事物,例如无人驾驶,每秒产生1GB的数据,如果将所有的数据都发送到云处理,那么响应时间就会太长。那么在这种情况下,**我们选择在边缘处理数据,以缩短响应时间、提高处理效率和减小网络压力。

  • Push From IoT:在当前的发展来看,几乎所有带电的设备都将成为物联网的一部分,它们将扮演数据生产者和消费者的角色。那么我们可以知道它们产生的原始数据将是巨大的,这使得传统的云计算效率不足以处理这些数据,因此物联网产生的大部分数据永远不会传输到云,而是在网络边缘消耗。下图为传统的云计算结构,但是这种结构并不足以实现物联网。

    • 首先,边缘的数据量过大,浙江导致巨大的不必要带宽和计算资源使用。

    • 其次,隐私保护要求将对物联网中的云计算构成障碍。

    • 最后,物联网中的大多数终端节点都是能量受限的东西,而无线通信模块非常耗电。

    • 因此将一些计算人物卸载到边缘可能更节能,

边缘计算——Edge Computing:Vision and Challenges_物联网

 

 

  • Change from data consumer to producer:在云计算中,边缘的终端设备通常扮演数据消费者的角色。但是如今,人们也在通过移动设备生成数据,从数据使用者到数据生产者/使用者的转变需要在边缘放置更多的功能,例如图像或视频剪辑可能会相当大,上传时会占用大量带宽,在这种情况下,上传到云端之前,视频可以在边缘进行剪辑之后再上传。另一个例子是可穿戴健康设备,由于网络边缘的东西收集的物理数据通常是私有的,因此在边缘处理数据比将原始数据上传到云中更能保护用户隐私。

What is Edge Computing

边缘计算是指允许在网络边缘、代表云服务的下游数据和代表物联网服务的上有数据上执行计算的使能技术。将边缘定义为数据源和云数据中心之间路径上任何计算和网络资源

作者认为边缘计算与雾计算是可以互换的,但是边缘计算更关注事物方面,而雾计算更关注基础设施方面。在边缘计算中事物不仅是数据消费者还扮演着数据生产者的角色。在边缘,这些东西不仅可以从云端请求服务和内容,还可以从云端执行计算任务。

Edge Computing benefits

在边缘计算中,我们希望将计算放再数据源父进,与传统的基于云的计算模式相比,边缘计算可以减少响应时间、运行时间以及能耗。

Case Study

cloud offloading

在云计算中,大多数计算发生在云中,这意味着数据和请求在集中的云中处理。但是这种计算模式可能会经历更长的延迟,这会削弱用户体验。在边缘计算中,边缘具有一定的计算资源,这提供了一个从云中卸载部分工作的机会。

在传统的网络中,只有数据缓存在边缘服务器中。但在边缘计算中,不仅数据,而且应用于数据的操作都应该缓存在边缘。

一个案例便是购物车,对于用户来说,购物车中的增删,可以在边缘中存储,不必即时的上传到云端。这样能够提高响应速度,也能提高用户体验。只用在后台时将数据上传到云端。

另一个问题是设计用户从一个边缘节点移动到另一个边缘节点时多个边缘的协作。一个简单的解决方案是将数据缓存到用户可能到达的所有边缘,但是边缘节点之间的同步问题就出现了。总之我们是希望通过边缘计算减少延迟来提高交互服务的质量。

video analytics

对于视频和摄像头来说,主要问题在于长时间的数据传输延迟和隐私问题,使得云计算不再适用于需要视频分析的应用程序。但是使用边缘计算,例如智能手机,可以执行请求并搜索其本地摄像头数据,并且只向云报告结果。再这种模式下,不仅保证了隐私,还可以在每件事情上利用数据和计算能力,并比单独的云计算更快地获得结果。

smart home

边缘计算被认为是构建智能家庭地完美选择:通过在夹中运行专用边缘操作系统地边缘网关,可以在家中轻松连接和管理事务,可以在本地处理数据,以减轻互联网带宽的负担,该服务还可以部署在edgeOS上,以实现更好的管理和交付。

smart city

对于智慧城市,边缘计算主要能从以下三个角度解决问题:

  • 大数据量:对于城市来说,每天产生的数据量都是十分庞大的,因此通过建立集中的云数据中心来处理所有数据是不现实的,因此通过处理网络罗边缘的数据,边缘计算可能是一种有效的解决方案。

  • 低延迟:对于一些需要可预测和低延迟的应用程序,如卫生应急或公共安全,边缘计算可以节省数据传输时间并简化网络结构。决策和诊断可以在网络边缘进行,也可以分布,这比在中央云收集信息和决策更高效。

  • 位置感知:对于基于地理的应用程序,边缘计算由于位置感知而超过了云计算。在边缘计算中,数据可以根据地理位置进行收集和处理,而无需传输到云端。

Collaborative Edge

在许多情况,由于隐私问题和数据传输的巨大成本,利益相关者拥有的数据很少相互共享,因此多个利益相关者之间的合作机会有限。而Edge作为一个物理小型数据中心,通过数据处理能力连接云和最终用户买也可以是逻辑概念的一部分,通过一种协作边缘,连接地理上分布的多个利益相关者的边缘,为这些人提供共享和合作数据的机会。

Challenger and opportunities

programmablity

在边缘计算中,计算从云端卸载,边缘节点很可能是异构平台。在这种情况下,这些结点的运行彼此不同,程序员在编写可能部署在边缘计算中的应用程序时会面临巨大困难。

为了解决边缘计算的可编程性,提出了计算流的概念,它被定义为沿着数据传播路径应用于数据的一系列函数/计算。功能/计算可以是应用程序的全部或部分功能,并且计算可以发生在路径上的任何位置,只要应用程序定义了应在何处进行计算。

计算流是软件定义的计算流,因此可以在数据生成设备、边缘节点和云环境中以分布式和高效的方式处理数据。正如边缘计算中所定义的,许多计算可以在边缘而不是中心云上完成。在这种情况下,计算流可以帮助用户确定应该执行哪些功能/计算,以及在边缘发生计算后数据如何传播。功能/计算分布指标可能是延迟驱动、能源成本、TCO和硬件/软件指定的限制。

通过部署计算流,希望计算的数据尽可能接近数据源,并且可以降低数据传输成本。在计算流中,函数可以被重新分配,数据和状态以及函数也应该被重新分配。此外,协作问题(例如,同步、数据/状态迁移等)必须在边缘计算范式中跨多个层解决。

naming

在边缘计算中,一个重要的假设是事物的数量非常大。但是边缘计算的有效命名机制尚未建立和标准化。对于现有的一些命名方式,例如DNS,不够灵活,无法为动态边缘网络提供服务,因为边缘的大多数东西有时具有高度的移动性和资源限制。此外,对于网络边缘的一些资源受限的东西,基于IP的命名方案可能过于繁重,无法支持。

也有新的命名机制,例如NDN可以应用于边缘计算,但是这些命名需要额外的代理并且不够安全。

data abstraction

当前的数据量大并且无法被长期保存,因此设想边缘计算中的人参与应该最小化,边缘节点应该以主动的方式消费/处理所有数据并与用户交互。在这种情况下,数据应该在网关级别进行预处理,将处理后的数据发送到上层。在这一过程就面临若干挑战。

  • 首先,从不同事物报告的数据具有不同的格式。

  • 其次,很难确定数据抽取的程度

  • 并且由于低精度传感器、不可靠的无线连接等原因,edge上的数据有时并不可靠,如何从不可靠的数据源中提取有用的信息仍然是物联网应用程序和系统开发人员面临的挑战。

数据提取的另一个问题是对事物的适用操作。收集数据是为了服务于应用程序,应该允许应用程序控制事物,以便完成用户想要的某些服务。结合数据表示和操作,数据抽象层将作为连接到edgeOS的所有事物的公共接口。此外,由于事物的异构性,数据表示和允许的操作可能会有很大差异,这也增加了通用数据抽象的障碍。

Service Management

在网络边缘的服务管理方面,作者认为应该支持以下四个基本特性,以保证可靠的系统,其中包括差异性、可扩展性、隔离性和可靠性。

  • Differentiation:不同领域服务的边缘计算部署速度应该有差异

  • Extensibility:物联网中的事物较为灵活,常常会出现增加或者删除,需要做到快速地添加到当前的服务中来或者移除现有节点。

  • Isolation:将不同设备之间的控制分开,不会因为一个设备受损而造成整体系统的受损。

  • Reliability

    • From the service point of view:通过判断一个组件是否有反应来判断组件是否损坏

    • From the system point of view:每个组件都可以都能顾 向edgeOS发送状态/诊断信息。使用此功能,可以轻松地在系统急别步数故障检测、物品更换和数据质量检测等服务。

    • From the data point of view:可靠性挑战主要来自数据传感和通信部分,如果传感数据和通信都不可靠,系统如何通过利用多个参考数据源和历史数据记录来提供可靠的服务仍然是一个开放的挑战。

Privacy and Security

我们可以通过物联网访问到他人地很多隐私信息,而如何保护这部分隐私信息就成了一个大问题。

  • 首先便是社区的隐私和安全意识,社区中很多wifi的密码并不安全,可以通过连接wifi连接到很多其它设备。

  • 其次是从边缘收集数据的所有权,将数据保留在收集的边缘,让用户完全拥有数据将是更好的隐私保护解决方案。

  • 第三是缺少有效的工具来保护网络边缘的数据隐私和安全。

Optimization Metrics

在边缘计算中,我们有多个具有不同计算能力的层。工作负载分配成为一个大问题。我们需要决定哪个层来处理工作负载,或者在每个部分分配多少任务。完成一个工作负载有多种分配策略。为了选择最佳分配策略,提出了几个优化指标:延迟、带宽、能耗和成本。

  • 延迟:延迟是评估性能的最重要指标之一,特别是在交互应用程序/服务中。但是延迟不仅仅取决于计算时间,长时间的WAN延迟会显著影响实时/交互密集型应用程序的行为。为了减少延迟,工作负载最好在最近的层完成,但是最近的物理层可能并不总是最好的选择,必须要考虑资源使用信息以避免不必要的等待时间。如果用户在玩游戏,由于收集的计算资源已经被占用,最好将照片上传到最近的网关或微中心。

  • 带宽:从延迟的角度来看,高带宽可以减少传输时间,特别是对于大数据。对于短距离传输,我们可以建立高带宽无线接入,将数据发送到边缘。

    • 一方面,如果工作负载可以在边缘处理,那么与在云上工作相比,延迟可以大大提高。边缘和云之间的带宽也得到了节省。此外,由于传输路径较短,传输可靠性也得到了提高。

    • 另一方面,尽管由于边缘不能满足计算需求而不能减小传输距离,但至少在边缘处对数据进行预处理,并且上传数据的带下将显著减小。因此,我们需要评估是否需要高带宽连接,以及那种速度适合边缘。此外,为了正确地确定每个层地负载分配,我们需要考虑层中的计算能力和带宽使用信息,以避免竞争和延迟。

  • 能源:对于端点层,将工作负载卸载到边缘可以被视为一种无能量的方法。对于给定的工作负载,将整个工作负载卸载到边缘而不是本地计算是否节能,关键是计算能耗和传输能耗之间的权衡。一般来说,我们首先需要考虑工作负载的功率特性。除了网络信号强度,数据大小和可用带宽也会影响能量开销。仅当传输开销小于本地计算时,我们更喜欢使用边缘计算。然而,如果我们关心整个边缘计算过程,而不是只关注端点,那么总能耗应该是每个使用层的能源成本的累积。与端点层类似,每个层的能耗可以估计为本地计算成本加上传输成本。在这种情况下,最佳工作负载分配策略可能会改变。例如,本地数据中心层很忙,因此工作负载会持续上传到上层。与在端点上进行计算相比,多跳传输可能会显著增加开销,从而导致更多的能量消耗。

  • 成本:从服务提供商的角度来看,边缘计算为他们提供了更少的延迟和能源消耗,前在的吞吐量增加和用户体验改善。因此,他们可以通过处理相同单位的工作量赚取更多的钱。