
白皮书强调了高可用性的重要性,即在硬件、软件或网络故障时,数据库能够以最少的人工介入确保服务水平协议规定的运行性能。同时,讨论了容灾的概念,即在自然灾害或人为灾难后恢复IT基础设施的方法。
Amazon Aurora通过其多可用区(AZ)部署和Global Database功能,支持在单个区域和跨区域实现高可用性和容灾。白皮书详细介绍了Amazon Aurora的架构,包括其分布式存储子系统和计算资源与存储的解耦,这些设计使得Amazon Aurora能够在出现故障时自动恢复。
此外,白皮书还提供了监控高可用性和容灾环境的最佳实践,包括使用Amazon CloudWatch Logs、增强监控和Amazon RDS Performance Insights等工具。同时,强调了制定恢复时间目标(RTO)和恢复点目标(RPO)的重要性,并提出了与这些目标相匹配的高可用性和容灾策略。