高可用组

产品文档

高可用组

功能介绍

跨可用区及故障域物理分散

可用区(Availability Zone,简称AZ)是单一地域内分别位于不同地点的数据中心,具有独立的网络、供电、散热和实体安全保障,并且通过京东云的内部低延迟、高带宽网络相互连接。当前京东云华北-北京地域及华东-上海提供多个可用区,华南-广州第二可用区正在建设中,即将交付使用。跨可用区部署可提升系统整体容灾能力,当一个可用区发生故障时,另一个可用区资源仍可正常服务服务(每个可用区至少有一台实例)。

故障域(Fault Domain,简称FD)指单个机房内由网络交换机或电源设备故障造成的的单点故障最大影响范围,通常可以理解为一个机架或一组机架。不同FD内的宿主机连接至不同的网络交换机及PDU以保证FD间物理故障隔离,如当一个FD出现网络问题时其他FD内实例仍可正常对外服务,直至网络恢复访问(至少有两个FD有实例,即至少有两台实例)。

高可用组支持配置单可用区或多可用区,为获得更高的业务可用性,建议配置多可用组。高可用组在单个可用区内对应至少有5个故障域(FD1-5)。若高可用组配置多可用区,则其内实例将循环分散在多可用区,归属同一个可用区内的实例则将均匀分散在5个故障域上。

例如,在华北-北京地域创建了一个配置了可用区A及可用区B的高可用组,当向该高可用组内新建15台实例时,第1台实例位于第一个可用区,如可用区A的FD1,第2台实例位于可用区B的FD1,第3台实例位于可用区A的FD2……如下图所示。

若该高可用组需要扩容1台实例实例,则第16台实例将位于可用区B的FD3。

根据业务负载情况自动伸缩

跨可用区及故障域物理分散可保证使用高可用组部署的服务面对不可预知的故障时仍可正常对外服务。此外可通过开启高可用组自动伸缩功能自动调整高可用组内实例数量来应对业务负载波动的情况,对于业务波峰,可设置自动扩容策略保证业务服务能力,对于业务波谷则可设置自动缩容策略节约成本。

告警策略是基于监控指标(如CPU、内存利用率)配置的自动伸缩策略,适用于不可预测业务负载波动的场景。

定时策略是预先设置时间,到预设时间后执行的自动伸缩策略,适用于可预测业务负载波动的场景,如618大促。

更新时间:2019-08-14 11:01:38
feedback