下图说明了一个配置为支持就绪检查功能的示例恢复组。此示例中的资源在恢复组中分为单元(按 AWS 区域)和嵌套单元(按可用区)。恢复组(应用程序)的整体就绪状态,以及每个单元(区域)和嵌套单元(可用区)的单独就绪状态。
以下是 Route 53 ARC 中就绪检查功能的组件。
单元定义应用程序的副本或独立的故障转移单元。它将应用程序在副本中独立运行所需的所有 AWS 资源分组。例如,您可能在主单元中有一组资源,而在备用单元中有另一组资源。您确定单元包含的内容的边界,但单元通常表示可用区或区域。一个单元内可以有多个单元(嵌套单元),例如一个区域内的可用区。每个嵌套单元代表一个独立的故障转移单元。
Cells are collected into a recovery group. A recovery group represents an application or group of applications that you want to check failover readiness for. It consists of two or more cells, or replicas, that match each other in terms of functionality. For example, if you have a web application that is replicated across us-east-1a and us-east-1b, where us-east-1b is your failover environment, you can represent this application in Route 53 ARC as a recovery group with two cells: one in us-east-1a and one in us-east-1b. A recovery group can also include a global resource, such as a Route 53 health check.
在 Route 53 ARC 中创建准备情况检查组件时,您可以使用资源标识符指定资源,例如 Amazon DynamoDB 表、网络负载均衡器或 DNS 目标资源。资源标识符是资源的 Amazon 资源名称 (ARN),或者对于 DNS 目标资源,是 Route 53 ARC 在创建资源时生成的标识符。
DNS 目标资源是应用程序的域名和其他 DNS 信息的组合,例如域指向的 AWS 资源。包括 AWS 资源是可选的,但如果您提供它,它必须是 Route 53 资源记录或网络负载均衡器。当您提供 AWS 资源时,您可以获得更详细的架构建议,这些建议可以帮助您提高应用程序的恢复弹性。您可以在 Route 53 ARC 中为 DNS 目标资源创建资源集,然后为资源集创建准备情况检查,以便您可以获得应用程序的架构建议。就绪检查还根据 DNS 目标资源的就绪规则监控应用程序的 DNS 路由策略。
资源集是一组跨越多个单元的资源,包括 AWS 资源或 DNS 目标资源。例如,您可能在 us-east-1a 中有一个负载均衡器,在 us-east-1b 中有另一个。要监控负载平衡器的恢复准备情况,您可以创建一个包含两个负载平衡器的资源集,然后为资源集创建准备情况检查。Route 53 ARC 将持续检查集合中资源的就绪情况。您还可以添加就绪范围以将资源集中的资源与您为应用程序创建的恢复组相关联。
就绪规则是 Route 53 ARC 针对资源集中的一组资源执行的审计。Route 53 ARC 为其支持就绪检查的每种类型的资源都有一组就绪规则。每个规则都包含一个 ID 和一个说明,说明 Route 53 ARC 检查资源的目的。
准备情况检查会监控您的应用程序中的资源集,例如一组 Amazon Aurora 实例,Route 53 ARC 正在审核其恢复准备情况。准备情况检查可以包括审计,例如容量配置、AWS 配额或路由策略。例如,如果您想要跨两个可用区审核 Amazon EC2 Auto Scaling 组的就绪情况,您可以为具有两个资源 ARN 的资源集创建就绪检查,每个资源 ARN 用于每个 Auto Scaling 组。然后,为确保每个组均等扩展,Route 53 ARC 会持续监控两个组中的实例类型和计数。
就绪范围标识特定就绪检查所包含的资源分组。就绪检查的范围可以是一个恢复组(即,对整个应用程序来说是全局的)或一个单元(即,一个区域或可用区)。对于作为 Route 53 ARC 的全局资源的资源,将就绪范围设置为恢复组或全局资源级别。例如,Route 53 运行状况检查是 Route 53 ARC 中的全局资源,因为它不特定于区域或可用区。
下图说明了支持 Route 53 ARC 中路由控制功能的组件示例。此处显示的路由控件(分组到一个控制面板中)使您可以管理两个区域中每个区域中两个可用区的流量。当您更新路由控制状态时,Route 53 ARC 会更改 Amazon Route 53 中的运行状况检查,从而将 DNS 流量重定向到不同的单元。您为路由控制配置的安全规则有助于避免故障打开场景和其他意外后果。
以下是 Route 53 ARC 中路由控制功能的组件。
A cluster is a set of five redundant Regional endpoints against which you initiate API calls to update or get routing control states. A cluster includes a default control panel, and you can host multiple control panels and routing controls on one cluster.
A routing control is a simple on/off switch, hosted on a cluster, that you use to control routing of client traffic in and out of cells. When you create a routing control, you add a Route 53 ARC health check in Route 53. This enables you to reroute traffic (using the health checks, configured with DNS records for your applications) when you update the routing control state in Route 53 ARC.
Routing controls are integrated with health checks in Route 53. The health checks are associated with DNS records that front each application replica, for example, failover records. When you change routing control states, Route 53 ARC updates the corresponding health checks, which redirect traffic—for example, to failover to your standby replica.
控制面板将一组相关的路由控件组合在一起。您可以将多个路由控件与一个控制面板关联,然后为控制面板创建安全规则,以确保您进行的流量重定向更新是安全的。例如,您可以为每个可用区中的每个负载均衡器配置路由控制,然后将它们分组在同一个控制面板中。然后,您可以添加一个安全规则(“断言规则”),确保在任何时候至少有一个区域(由路由控制表示)处于活动状态,以避免意外的“故障打开”情况。
When you create a cluster, Route 53 ARC creates a default control panel. By default, all routing controls that you create on the cluster are added to the default control panel. Or, you can create your own control panels to group related routing controls.
Safety rules are rules that you add to Route 53 ARC to ensure that recovery actions don't accidentally impair your application's availability. For example, you can create a safety rule that creates a routing control that acts as an overall "on/off" switch so that you can enable or disable a set of other routing controls.
Route 53 ARC 中的每个集群都有五个区域端点,您可以使用它们来设置和检索路由控制状态。您访问端点的过程应该假设 Route 53 ARC 会定期启动和关闭端点以进行维护,因此您应该连续尝试每个端点,直到连接到一个。您访问端点以获取路由控制的当前状态(打开或关闭)并通过更改路由控制状态来触发应用程序的故障转移。