Unsolved
This post is more than 5 years old
18 Posts
0
1258
多引擎VMAX3系统中,一个director故障后,系统如何处理?
多引擎系统中,cache是跨引擎镜像的,但VMAX3是Local RAID。当某director故障后,该director的镜像cache和RAID归属于不同引擎,系统如何做failover操作呢?
Unsolved
This post is more than 5 years old
18 Posts
0
1258
多引擎系统中,cache是跨引擎镜像的,但VMAX3是Local RAID。当某director故障后,该director的镜像cache和RAID归属于不同引擎,系统如何做failover操作呢?
Top
Jianyun_e442cb
56 Posts
0
March 12th, 2015 02:00
我觉得在你那个英文版的帖子里已经说得很清楚啦,:)
重复一下,
1. 前端口是没有Failover的,靠的是冗余;
2. cache本身跨引擎镜像,丢了一个dir就失去镜像了而已。cache是否local不是关键(虽然local当然更快一些)。cache本身是global的。坏了的dir当然不能接受写数据了(原本镜像的也只是写数据),读数据也完全由镜像dir的cache完成(原来的读数据是不镜像的,就近使用)。
3. 后端由同引擎的dir接管。
truly1
18 Posts
0
March 12th, 2015 18:00
如果Dir1和Dir3互为镜像,Dir2与Dir4互为镜像。当Dir1故障后,Dir3会与Dir2镜像,还是与Dir4镜像,还是保持现状不镜像呢?
Jianyun_e442cb
56 Posts
0
March 12th, 2015 20:00
首先,镜像规则尽量会采用奇偶集合,所以双引擎会是1、4卡镜像内存,2、3卡一对。
卡坏了,卡上的内存失效。此时内存靠镜像剩余部分维持运行。
经常会有人问为什么Symm在内存故障时不采用“直写”?直写用于中端产品,一般维护比较差一些,牺牲性能换取安全。
企业级存储,故障引发的性能下降几乎不可以妥协。而直写性能下降非常厉害,企业级用户几乎是不可以接受的。而且这种严重故障的维护非常快,一般都是在1天内修复(白天故障也是坚持到夜里维护),代价比“直写”低。
truly1
18 Posts
0
March 12th, 2015 23:00
非常感谢!
还有个问题,双引擎系统中,正常情况下是跨引擎镜像,当一个引擎故障了,剩余一个引擎的两个director之间也不会重新镜像吗?
Jianyun_e442cb
56 Posts
0
March 13th, 2015 00:00
内存还是不会更改镜像。
引擎故障是“双误”。 EMC不保证双误下的数据可用性。
一般整个引擎故障,会导致这个引擎后端挂载的所有物理磁盘不可访问。对于VMAX1/2,如果RAID5的2个成员,镜像的2个成员都在这个引擎的后端,则这些物理卷不可访问。
对于VMAX3,因为RAID的所有成员都在一个引擎上,所以一个引擎故障,则上面的所有逻辑卷不可访问。
但有一种情形可以避免单个引擎内影响的逻辑卷不可访问问题:如果该引擎的逻辑卷是SRDF全同步保护的,且前端接口和RDF接口都在另外一个引擎有连接,则所有此引擎的数据访问都可以继续通过远程存储的访问来完成。用户除了性能下降外,还是可以继续访问存储。