开始新对话

未解决

此帖子已超过 5 年

1330

2014年9月1日 22:00

VPLEX工作负载弹性 – 集群故障注意事项

VPLEX工作负载弹性 集群故障注意事项

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese publish_button_16.ico

介绍

     VPLEX系统所有关键的处理组件都至少使用成对冗余来最大限度地提高数据可用性。本文介绍了如何处理VPLEX集群故障注意事项,以及应使用哪些建议使应用程序能够容受这些故障。

更多信息

VPLEX群集故障:


     VPLEX Metro支持两种分布式设备:分布式卷(Distributed Volumes)和远程卷(Remote Volumes)。分布式卷在每个群集中提供该卷数据的同步拷贝(镜像)。镜像卷显示并表现为单个卷而且其行为方式类似于使用RAID 1设备的虚拟卷,但它有新增的价值,那就是每个群集都维护着数据的一个副本。远程卷可用于访问其数据驻留在一个群集中的虚拟卷。远程卷与分布式卷一样,也能够利用 VPLEX 分布式连贯缓存及其预取算法,以提供比SAN扩展解决方案更高的性能。VPLEX Geo支持分布式卷但不支持远程卷,因为远程访问的长时间延迟将引起大部分应用程序过多的延迟。


     站点首选规则(Site preference rules)定义分布式卷在一个群集与另一个群集的通信中断时的行为。对于放在一致性组内的分布式卷,将在一致性组级别应用站点首选规则,且此规则适用于组中的所有卷。对于位于一致性组外的分布式卷,则将规则应用于单个卷。站点首选规则指示哪个群集应在两个群集间通信中断时断开其镜像端(停止其服务)。如果群集间通信中断,这些规则将有效定义优胜端。

    

     有两种情况会导致群集中断通信:一种是群集间链路故障中讨论的群集间链路故障,另一种是群集故障。本文介绍后一类故障。这种情形下的行为取决于系统是 VPLEX Metro 还是 VPLEX Geo,以及系统是否部署有 VPLEX Witness


不带VPLEX WitnessVPLEX Metro


     发生群集故障时,任何具有站点首选规则(此规则将仍保持运行的站点确定为优胜站点)的分布式卷的 I/O 将继续在设备仍保持运行的端上得到响应。其站点首选规则声明此站点在发生通信中断时断开连接的卷将暂停其 I/O。由于无法辨别是群集故障还是链路故障,所以此行为是为了保持这些分布式设备上数据的完整性。这种情况下,管理员可手动恢复 I/O


     远程虚拟卷有两种故障情形。第一种,如果为虚拟卷提供物理介质的群集发生故障,则远程虚拟卷将完全不可访问。第二种情形是,如果远程群集(未为此卷提供物理介质的群集)发生故障,将仍可以从托管群集(提供物理数据的群集)访问此虚拟卷。


VPLEX Witness VPLEX Metro


     发生群集故障时,仍保持运行的群集将咨询 VPLEX Witness 并确定其对等群集是否发生故障;然后,仍保持运行的群集将继续为其分布式卷提供 I/O 服务。由于已检测到群集故障,因此在此状态下将覆盖任何偏好设置。对于远程虚拟卷,如果为虚拟卷提供物理介质的群集发生故障,则远程虚拟卷将完全不可访问。如果远程群集(未为此卷提供物理介质的群集)发生故障,将仍可以从托管群集(提供物理数据的群集)访问此虚拟卷。


不带 VPLEX Witness VPLEX Geo


     发生群集故障时,任何具有站点首选规则(此规则将仍保持运行的站点确定为优胜站点)的分布式卷都将继续为卷提供服务,但前提是优胜群集能够确定远程群集在发生故障时对该卷处于非活动状态。如果优胜群集无法确定这一点,则将暂停卷以让管理员作出决定,即通过将卷的状态重置为上个一致状态来恢复卷访问,还是修复故障并在修复后恢复访问。


     如果站点首选规则没有指明将哪个站点定义为仍保持运行的偏好,则将暂停卷并需要执行管理操作来作出决定,即通过将卷的状态重置为上个一致状态(如果远程站点在故障发生时未处于活动状态,则可能是当前状态)来恢复卷访问,还是修复故障并在修复后恢复卷访问。如果站点首选规则没有指明偏好,则将暂停一致性组中的卷并将数据回滚到上个一致点。管理员必须在重启使用这些卷的应用程序后明确地恢复这些卷。


VPLEX Witness VPLEX Geo


     发生群集故障时,VPLEX Witness 将向仍保持运行的群集指明其对等群集被视为服务中断。如果卷正在使用活动的站点首选规则,且仍保持运行的群集能够确定远程群集在故障发生时对该卷处于非活动状态,则将自动继续为卷提供服务。如果仍保持运行的群集无法进行此确定,则将暂停卷以让管理员可作出决定,即通过将卷的状态重置为上个一致状态来恢复卷访问,还是修复故障并在修复后恢复访问。如果使用的是含偏好的站点首选规则,则将暂停一致性组中的卷并将数据回滚到上个一致点。管理员必须在重启使用这些卷的应用程序后明确地恢复这些卷。注意:VPLEX Geo VPLEX Witness 只供通讯查询;它不会修改 Geo 响应网络链路故障或群集停机的行为。此行为由站点首选规则和受影响的分布式卷的活动状态控制。相反,Witness VPLEX 管理员提供有关其事件观察的信息(如,它能否在发生故障事件时成功与两个 VPLEX 群集通信)。这些信息在指导管理员如何响应事件方面特别有用。

参考

VPLEX工作负载弹性 – 模块故障注意事项

VPLEX工作负载弹性 – 光纤通道端口故障注意事项

VPLEX工作负载弹性 – 停机注意事项

应用于

VPLEX

             

14 消息

2017年11月13日 02:00

vplexmetro 没有witness, 一致性组主站点是优胜站点,现在主站点vplex故障停机,备站点怎么手动服务起来

找不到事件!

Top