十多年来,集中式云计算一直被认为是标准的 IT 服务交付平台。尽管云计算无处不在,但新兴的需求和工作负载开始暴露其局限性。由于其强大的数据中心为中心视角,计算和存储资源相对丰富且集中,很少或没有考虑过对支持的虚拟机管理程序和管理平台足迹进行优化。 很少有云开发人员认真考虑支持资源受限节点所需的要求,这些节点只能通过不可靠或带宽受限的网络连接访问,或者考虑对需要非常高的带宽、低延迟或跨多个站点的广泛计算能力的应用的需求。
新的应用程序、服务和工作负载越来越需要一种不同的架构,这种架构的构建是为了直接支持分布式基础设施。为了支持当今的需求(零售数据分析、网络服务)和明天的创新(智慧城市、AR/VR),远程站点对可用性和云能力的新需求应运而生。现在,云计算的成熟度、稳健性、灵活性和简单性需要在多个站点和网络中扩展,才能应对不断变化的需求。
最近,公司已经开始将云计算架构的简化管理和灵活性应用于跨多个站点和网络的分布式基础设施。组织们越来越需要通过广域网 (WAN) 将云能力扩展到网络边缘的日益小型化部署中。尽管这种方法还处于早期阶段,但越来越清楚的是,许多新兴用例和场景将受益于分布式架构。
在本文中,我们将探讨这种新兴的需求。它被称为许多名字:分布式云、雾计算、第四代数据中心,但为了本文的目的,我们将坚持使用一个常见且易于理解的术语——云边计算。
OSF 边缘计算小组认为云计算的这种演变非常令人兴奋,但我们认识到 OpenStack 支持云边计算的能力还处于早期阶段。基于在 OpenStack Summit Boston 上表达的初步社区兴趣,于 2017 年 9 月举行了一个为期两天的研讨会,汇集了 200 多名用户和开发人员,开始努力定义相关的用例并考虑支持它们所需的工具和架构。已经完成了概念验证,社区已经有几个早期部署。OSF 边缘计算小组现在已经承担了描述功能齐全的边缘计算云基础设施的基本要求的挑战
在本文档中,我们旨在完成几项重要任务
为了实现我们的目标,还有很多工作要做,我们欢迎并鼓励整个开源社区加入到创建或调整工具以满足云边计算新需求的努力和机遇中。
值得强调的是,边缘计算存在许多重叠且有时相互冲突的定义——边缘计算对不同的人意味着不同的事情。但为了我们的目的,边缘计算最成熟的观点是,它为应用程序开发人员和服务提供商提供云计算能力,以及网络边缘的 IT 服务环境。
目标是将计算、存储和带宽尽可能地交付到数据输入和/或最终用户附近。边缘计算环境的特点是所有站点之间潜在的高延迟和低且不可靠的带宽——以及与远离数据中心的集中式云资源池无法满足的独特服务交付和应用程序功能可能性。通过将一些或全部处理功能移至最终用户或数据收集点附近,云边计算可以减轻广泛分布站点的影响,从而最大限度地减少延迟对应用程序的影响。
边缘计算首先通过在广域网 (WAN) 上虚拟化网络服务而出现,从而摆脱了数据中心。最初的用例是由希望利用平台所提供的灵活性和简单工具的愿望驱动的,而这些工具是云计算用户已经习惯的。
随着新的边缘计算能力出现,我们看到了一种计算范式正在发生变化——这种范式不再一定受构建集中式数据中心的需要约束。相反,对于某些应用程序,云边计算正在借鉴虚拟化和云计算的经验,并创建了将潜在的数千个大规模分布式节点应用于各种用例(例如工业物联网甚至用于跟踪实时水资源利用情况的遍布数千或数百万个地点的遥远监控网络)的能力。
许多专有和开源边缘计算能力已经存在,而无需依赖分布式云——一些供应商将其称为“设备边缘”。此方法的组件包括物联网网关或 NFV 设备等元素。但越来越多的应用程序需要在边缘获得云计算的通用性,尽管构建分布式边缘基础设施所需的工具和架构仍处于起步阶段。我们的观点是,市场将继续需要更好的云边计算能力。
边缘计算能力包括但不限于
边缘计算中的“边缘”是指管理域的边界,尽可能靠近离散的数据源或最终用户。这个概念适用于电信网络、具有分布式存在点的大型企业,或在物联网的背景下,特别是其他应用程序。
边缘计算的一个特征是应用程序与边缘位置紧密相关。对于电信运营商,“边缘”是指靠近最终用户但由提供商控制的点,可能具有在最终用户设备上运行的一些工作负载元素。对于大型企业,“边缘”是应用程序、服务或工作负载使用的点(例如零售店或工厂)。根据此定义,边缘不是容量极小,甚至无法支持最小云架构(例如物联网或传感器设备)的终端设备。这是一个重要的考虑因素,因为许多关于边缘计算的讨论没有做出这种区分。
边缘计算与数据中心计算类似,因为它
边缘计算与大型数据中心中的计算不同,因为它
边缘计算的概念必须涵盖边缘站点(例如,计算、网络和存储基础设施),还必须涵盖在其上运行的应用程序(工作负载)。值得注意的是,边缘计算环境中的任何应用程序都可能利用云提供的任何或所有功能——计算、块存储、对象存储、虚拟网络、裸机或容器。
定义和区分边缘计算与云计算的基本特征是
那么,我们对边缘计算的特性、用例和场景了解多少?
驱动云边计算的根本需求是服务交付需要靠近用户或端点数据源。边缘计算环境将与核心容量协同工作,但旨在提供改进的最终用户体验,而不会对核心的连接提出不合理的要求。改进源于
但存在权衡。为了交付边缘计算,有必要大大增加部署数量。这给广泛的边缘部署带来了重大挑战。如果管理单个云需要一个十人团队,组织如何应对数百甚至数千个小型云?一些要求包括
可能有很多种方法来描述用例,本文太短,无法提供详尽的清单。但这里有一些示例,可以帮助澄清思路并突出协作机会。
受益于分布式架构的四种主要工作负载需求类别是分析、合规性、安全性和 NFV。
物联网,其中数据通常从大型微站点网络收集,是受益于边缘计算模型的应用程序的一个示例。将大量数据通过通常有限的网络连接发送到位于集中式数据中心中的分析引擎适得其反;它可能不够响应迅速,可能会导致过多的延迟,并浪费宝贵的带宽。由于边缘设备还可以生成 TB 级的数据,因此在数据源附近进行分析可以更具成本效益,方法是在边缘分析数据并仅将少量压缩的信息发送回集中式系统。这里有一个权衡——平衡将数据传输到核心的成本与丢失一些信息。
不幸的是,随着边缘设备的激增——包括移动手机和物联网传感器——新的攻击向量正在出现,利用端点的激增。边缘计算能够将安全元素移至攻击源附近,实现更高性能的安全应用程序,并增加帮助防御核心免受破坏和风险的层数。
合规性涵盖广泛的要求,包括地理围栏、数据主权和版权执行。根据地理位置和政治边界限制对数据的访问、根据版权限制限制数据流以及在具有特定法规的地方存储数据都可以通过边缘计算基础设施实现和强制执行。
网络功能虚拟化 (NFV) 本质上是边缘计算应用程序,因为它提供基础设施功能。电信运营商正在通过将虚拟网络功能作为边缘计算基础设施的一部分或在其之上运行来改变其服务交付模式。为了最大限度地提高效率并最大限度地降低成本/复杂性,在边缘计算基础设施上运行 NFV 是有意义的。
实时应用,例如 AR/VR、互联汽车、远程医疗、触觉互联网、工业 4.0 和智慧城市,无法容忍超过几毫秒的延迟,并且对抖动(延迟变化)非常敏感。例如,互联汽车需要低延迟和高带宽,并且依赖于靠近用户的计算和内容缓存,这使得边缘容量成为必要。在许多场景中,尤其是在使用闭环自动化来维持高可用性时,需要几十毫秒的响应时间,如果没有边缘计算基础设施,就无法满足。
边缘计算扩展了带宽能力,释放了新型沉浸式应用的潜力。其中一些包括 AR/VR、4K 视频和 360° 图像,适用于医疗保健等行业。由于 TCP 等协议对无线网络流量的突然变化反应不佳,因此在边缘缓存和优化内容已经变得越来越重要。与无线/网络信息实时访问相结合的边缘计算基础设施,可以在观看高峰时段将视频的停顿和延迟减少高达 20%,并且还可以根据无线条件调整视频流的比特率。
许多应用程序对延迟不敏感,不需要大量的附近计算或存储容量,因此理论上可以在集中式云端运行,但带宽和/或计算需求仍然可能使边缘计算成为更有效的方法。这些工作负载中的一些今天很常见,包括视频监控和物联网网关,而另一些,包括人脸识别和车牌识别,是新兴能力。对于这些应用中的许多应用,边缘计算基础设施不仅可以减少带宽需求,还可以为实现应用价值的功能提供平台——例如,视频监控运动检测和威胁识别。在这些应用程序中的许多情况下,90% 的数据是常规且不相关的,因此将其发送到集中式云端成本高昂且浪费了通常稀缺的网络带宽。在边缘对数据进行异常和变化排序,仅报告可操作的数据更有意义。
即使在今天,许多环境也存在有限、不可靠或不可预测的连接。这些可能包括交通运输(飞机、公共汽车、船舶)、采矿作业(石油钻井平台、管道、矿山)、电力基础设施(风电场、太阳能发电厂),甚至通常应该具有良好连接的环境,例如商店。边缘计算通过允许站点在需要或网络连接不可用时保持半自主和功能性,从而很好地支持这些环境。这方面的最佳示例是零售地点需要在网络连接暂时中断时保持其销售点 (POS) 系统正常运行的需求。
企业可能需要边缘计算容量,具体取决于工作负载、连接限制和隐私。例如,需要在使用将其发送到云端之前匿名化个人健康信息 (PHI) 的医疗应用程序,可以使用边缘计算基础设施来完成此操作。
另一种看待将受益于云边缘计算的需求的方式是根据将部署它们的公司的类型。运营商应用程序是在边缘计算基础设施上运行的工作负载,该基础设施由运营商(例如电信公司)构建和管理。第三方应用程序是由组织构建的,在现有边缘基础设施上运行,以利用其他人的边缘计算基础设施。值得注意的是,任何应用程序都可以利用云提供的所有功能——计算、块存储、对象存储、虚拟网络、裸机或容器。
边缘计算范式的基本特征是基础设施位于最终用户更近的位置,站点分布规模很大,并且边缘节点通过 WAN 网络连接连接在一起。检查一些更深入的场景有助于我们评估当前与用例匹配的功能,以及突出显示需要改进的薄弱环节和机会。
1. 零售/金融/偏远地点“盒子中的云”:边缘计算基础设施支持针对特定公司或行业垂直领域的定制应用程序套件。通常由企业使用,边缘计算基础设施最终连接在一起形成分布式基础设施,以减少硬件占用空间、标准化多个站点的部署、提供更大的灵活性来替换位于边缘的应用程序(并在所有节点上以统一的方式运行相同的应用程序,无论硬件如何)、提高弹性并解决间歇性 WAN 连接问题。在连接有限的环境中,缓存内容或提供计算、存储和网络是边缘计算的显而易见的应用。
2. 移动连接:移动/无线网络很可能是云边缘计算的常见环境元素,因为至少在 5G 广泛可用之前,移动网络仍将具有有限且不可预测的带宽的特点。远程维修的增强现实、远程医疗、用于捕获公用事业(水、燃气、电力、设施管理)数据的物联网设备、库存、供应链和运输解决方案、智慧城市、智慧道路和远程安全应用程序等应用程序将在更大或更小的程度上依赖于移动网络。它们都将受益于边缘计算将工作负载移动到最终用户附近的能力。
3. 网络即服务 (NaaS):源于需要在截然不同的环境中提供相同的网络服务应用程序体验的需求,NaaS 用例需要在边缘的分布式平台具有较小的占用空间,并且具有强大的集中管理工具,这些工具可以跨越不可靠或有限的 WAN 网络连接来支持边缘的服务。此场景的主要特征是:硬件占用空间小、移动(更改网络连接)和不断变化的工作负载、数据和应用程序的混合位置。这是需要支持微节点——非传统封装(并非所有 19 英寸机架都在冷却数据中心内)的小剂量计算的基础设施的案例之一。NaaS 将需要支持数千个或数万个边缘节点,并且必须支持网状和/或分层架构以及根据需要启动并在完成时关闭的按需站点。API 和 GUI 必须更改以反映大量计算节点将位于不同的位置,而不是存在于同一数据中心中。
4. 通用客户前提设备 (uCPE):这种场景已经开始部署,需要支持类似设备的硬件占用空间,并且其特点是具有高可用性要求的有限网络连接和通常稳定的工作负载。它还需要一种支持数据和应用程序混合位置的方法,跨数百或数千个节点,以及扩展现有的 uCPE 部署将成为一个新兴需求。
这对于 NFV 应用程序尤其适用,在这些应用程序中,不同的站点可能需要不同的服务链应用程序集,或者具有不同所需应用程序集的站点仍然需要协同工作。需要支持网状或分层架构以及由于间歇性网络连接而需要存储和转发数据处理。自我修复和自我管理与远程管理节点的能力是必须具备的。
5. 卫星通信 (SATCOM):这种场景的特点是众多功能强大的终端设备,通常分布在最偏远和最恶劣的条件下。同时,利用这些分布式平台托管服务也是有意义的,特别是考虑到极高的延迟、有限的带宽以及通过卫星通信的成本。此类用例的具体示例可能包括船只(从渔船到油轮)、飞机、石油钻井平台、采矿作业或军用基础设施。
虽然世界各地已经有很多边缘部署正在进行中,但广泛采用需要新的思维方式来解决新兴的和已经存在的挑战和限制。
我们已经确定,从设计上讲,边缘计算平台在硬件和支持应用程序生命周期的平台服务方面,都必须比传统的以数据中心为中心的云平台更具容错性和鲁棒性。我们不能假设此类边缘用例将拥有标准数据中心基础设施所拥有的维护和支持设施。零触地配置、自动化和所有基础设施和平台堆栈中的自主编排是这些场景中的关键要求。
但还有其他需要考虑的挑战。
首先,边缘资源管理系统应提供一组高级机制,这些机制的组合产生一个能够操作和使用依赖于 WAN 互连的地理分布式 IaaS 基础设施的系统。换句话说,挑战在于修改(并在需要时扩展)IaaS 核心服务,以便处理上述边缘特性——网络断开连接/带宽、计算和存储方面的有限容量、无人部署等。
一些可预见的需求包括
这些需求相对明显,并且可能可以通过利用和调整现有项目来满足。但边缘计算的其他需求更具挑战性。这些包括但不限于