
亚马逊云科技构建云韧性,保障企业业务不间断运行
(全球TMT2024年8月28日讯)韧性是应用程序抵御中断或从中恢复的能力,在亚马逊云科技,构建云韧性是一项最基础的工作。亚马逊云科技从一开始并持续在其基础设施、服务设计与部署、运营模式和机制中将韧性考虑其中。在此基础上,亚马逊云科技还提供一套全面的服务、最佳实践等,进一步帮助客户提升自身的韧性。

亚马逊云科技全球基础设施地理位置分散,遍及34个地理区域的108个可用区。为了避免单点故障的影响范围,亚马逊云科技最小化全球基础设施之间的互联性。每个区域都独立于其他区域,区域之间的这种隔离机制确保单个区域发生服务故障时,其他区域不受影响仍正常运营。在服务/系统设计时,亚马逊云科技使用通过对服务的控制平面和数据平面进行隔离设计,并采用“单元架构”设计模式,减少故障发生的可能,并尽可能降低故障发生时的影响范围。亚马逊云科技还建立内部运营机制,通过服务责任模型、运营就绪审查、安全/持续部署以及错误流程纠错来确保云服务的韧性。其中,亚马逊云科技的工程和产品管理工作由小型多学科团队领导,他们对所提供的服务拥有强大的所有权。
文章评论(0)