本章介绍如何通过创建恢复组和单元来在 Amazon Route 53 Application Recovery Controller 中为您的应用程序建模,然后介绍如何添加就绪检查和就绪范围,以便 Route 53 ARC 可以审核您的应用程序的就绪情况。
创建就绪检查后,您可以监控资源的就绪状态。就绪检查可帮助您确保备用应用程序副本及其资源与生产副本持续匹配,反映生产应用程序的容量、路由策略和其他配置详细信息。如果没有,您可以添加容量或更改配置,以便副本再次对齐。
就绪检查对于持续验证应用程序副本配置和运行时状态是否一致***有用。不应使用就绪检查来指示您的生产副本是否健康,也不应将就绪检查作为灾难事件期间故障转移的主要触发器。
Route 53 ARC 中的准备情况检查会持续(每隔一分钟)审核 AWS 预置容量、服务配额、节流限制以及检查中包含的资源的配置和版本差异是否存在不匹配。就绪检查可以通知您这些差异,以便您可以确保每个副本具有相同的配置设置和相同的运行时状态。尽管准备检查确保您在副本之间配置的容量是一致的,但您不应期望他们代表您决定副本的容量应该是多少。例如,您应该了解您的应用程序要求,以便调整 Auto Scaling 组的大小,在每个副本中具有足够的缓冲区容量,以便在另一个单元不可用时进行管理。
对于配额,当 Route 53 ARC 检测到与就绪检查不匹配时,它可以通过增加较低配额以匹配较高配额来采取措施来调整副本的配额。当配额匹配时,就绪检查状态显示READY
。(请注意,这不是立即更新过程,总时间取决于具体资源类型和其他因素。)
***步是设置就绪检查以创建代表您的应用程序的恢复组 。每个恢复组都包含每个单独的故障控制单元或应用程序副本的单元。接下来,您为应用程序中的每种资源类型创建资源集 ,并将 就绪检查与资源集相关联。***,您将资源与就绪范围相关联,以便您可以获取有关恢复组(您的应用程序)或单个单元(副本,即区域或可用区 (AZ))中资源的就绪状态。
就绪(即READY
或NOT READY
)基于就绪检查范围内的资源和资源类型的规则集。每种资源类型都有一组就绪规则 ,Route 53 ARC 检查使用这些规则来审核资源的就绪情况。资源是否存在READY
取决于每个就绪规则的定义方式。所有就绪规则都会评估资源,但有些规则会相互比较资源,有些则查看有关资源集中每个资源的特定信息。
通过添加就绪检查,您可以通过以下方式之一监控就绪状态:使用 EventBridge、在 AWS 管理控制台中或使用 Route 53 ARC API 操作。您还可以监控不同上下文中资源的就绪状态,包括单元的就绪状态和应用程序的就绪状态。使用 Route 53 ARC 中的跨账户授权 功能,可以更轻松地从单个 AWS 账户设置和监控分布式资源。
话题
Route 53 ARC 就绪检查通过帮助您确保您的应用程序经过扩展以处理故障转移流量,让您深入了解您的应用程序和资源是否已准备好进行恢复。就绪检查状态不应用作指示生产副本是否健康的信号。但是,您可以使用就绪检查作为应用程序和基础设施监控或健康检查系统的补充,以确定是故障转移还是转移到副本。
在紧急情况或中断时,使用运行状况检查和其他信息的组合来确定您的备用服务器已扩展、运行良好并准备好对生产流量进行故障转移。例如,除了验证备用单元的就绪检查状态是否为 之外,检查针对备用单元运行的金丝雀是否满足您的成功标准READY
。
请注意,Route 53 ARC 就绪检查托管在美国西部(俄勒冈)的单个 AWS 区域中,在中断或灾难期间,就绪检查信息可能会变得陈旧或检查可能变得不可用。有关更多信息,请参阅Route 53 ARC 的数据和控制平面。
Route 53 ARC 就绪检查根据每种资源类型的预定义规则以及这些规则的定义方式确定就绪状态。Route 53 ARC 为其支持的每种资源类型都包含一组规则。例如,Route 53 ARC 具有 Amazon Aurora 集群、Auto Scaling 组等的就绪规则组。一些就绪规则将集合中的资源相互比较,而另一些则查看有关资源集中每个资源的特定信息。
您不能添加、编辑或删除就绪规则或规则组。但是,您可以创建 Amazon CloudWatch 警报并创建就绪检查以监控警报的状态。例如,您可以创建自定义 CloudWatch 警报来监控 Amazon EKS 容器服务,并创建就绪检查来审核警报的就绪状态。
创建资源集时,您可以在 AWS 管理控制台中查看每种资源类型的所有就绪规则,也可以稍后通过导航到资源集的详细信息页面查看就绪规则。您还可以在以下部分查看就绪规则:Route 53 ARC 中的就绪规则。
当准备检查使用一组规则审核一组资源时,定义每个规则的方式决定了结果是 所有资源READY
还是NOT READY
所有资源,或者不同资源的结果是否不同。此外,您可以通过多种方式查看就绪状态。例如,您可以查看资源集中的一组资源的就绪状态,或者查看恢复组或单元(即 AWS 区域或可用区,具体取决于您的设置方式)的就绪状态摘要起来你的恢复组)。
每个规则描述中的措辞解释了它如何评估资源以确定应用该规则时的就绪状态。定义一个规则来检查每个资源或检查资源集中的所有资源以确定准备情况。具体来说,这些规则的工作方式如下:
ACTIVE
状态。此外,Route 53 ARC 对配额采取了额外的步骤。如果就绪检查检测到任何受支持资源的服务配额(资源创建和操作的***值)跨单元不匹配,Route 53 ARC 会自动提高配额较低的资源的配额。这仅适用于配额(限制)。对于容量,您应该根据应用程序的需要添加额外的容量。
您还可以为就绪检查设置 Amazon EventBridge 通知,例如,当任何就绪检查状态更改为 时NOT READY
。然后,当检测到配置不匹配时,EventBridge 会向您发送通知,您可以采取纠正措施以确保您的应用程序副本已对齐并为恢复做好准备。有关更多信息,请参阅将 Route 53 ARC 与 Amazon EventBridge 结合使用。
通过 Route 53 ARC 中的 DNS 目标资源准备情况检查,您可以审核应用程序的架构和弹性准备情况。这种类型的就绪检查会持续扫描您的应用程序架构和 Amazon Route 53 路由策略,以审核跨区域和跨区域的依赖关系。
面向恢复的应用程序有多个副本,这些副本被隔离到可用区或 AWS 区域中,因此这些副本可以彼此独立地失败。如果您的应用程序需要调整以正确隔离,Route 53 ARC 将建议您在需要时进行更改,以更新您的架构,以帮助确保其具有弹性并为故障转移做好准备。
Route 53 ARC 会自动检测应用程序中单元(表示副本或故障控制单元)的数量和范围,以及这些单元是按可用区还是按区域孤立的。然后,Route 53 ARC 会识别并向您提供有关单元中应用程序资源的信息,以确定它们是否正确隔离到区域或区域。例如,如果您的单元的范围限定为特定区域,则准备情况检查可以监控您的负载均衡器及其背后的目标是否也孤立到这些区域。
使用此信息,您可以确定是否需要进行更改才能将单元中的资源与正确的专区或区域对齐。
首先,为应用程序创建 DNS 目标资源,并为它们设置资源集和准备情况检查。有关更多信息,请参阅在 Route 53 ARC 中获取架构建议。