开始新对话

未解决

此帖子已超过 5 年

1965

2012年3月15日 19:00

CLARiiON热备份技术(一) - 全局热备份

CLARiiON热备份技术(一) - 全局热备份

转载请在文首保留原文出处:中文支持论坛

介绍

    本系列章节将介绍全局热备份(global hot sparing)、主动热备份(proactive hot sparing)和重建日志(rebuild logging)的最佳实践。

 

    为了降低硬盘故障所带来的风险,EMC发展了全局热备份(global hot sparing)技术。全局热备份技术提供了自动化的、在线的RAID重建能力。同时通过引入主动热备份(proactive hot sparing)EMC进一步强化了这项技术。主动热备份技术能够识别出快要出现故障的硬盘并提前开始复制数据。两种技术的整合将数据丢失的风险减少到了最低。CLARiiON (至少FLARE 24版本)同时引入了重建日志(rebuild logging)功能,允许RAID group中的一块盘离线(offline)一段时间而不影响数据完整性。这段时间内对这块盘写入的数据将记录在日志中。

   

    当RAID group中某块硬盘出现故障时,该RAID group就会进入降级(degrade)状态。而当多块硬盘同时发生故障时,数据就有可能丢失,因此尽可能快地替换故障硬盘是很有必要的。CLARiiON主动热备份技术可以提前发现并替换故障盘以避免RAID group进入降级状态。

更多信息

全局热备份的特性:

 

1.     全局热备份运行流程如下:

·         全局热备份在下列情形时被调用

·         手动发起主动复制(proactive copy)

·         FLARE自动发起主动复制

·         硬盘故障或被拔出

2.     FLARE会根据一定算法选择合适的热备份硬盘(后文详述)

3.     RAID 356,故障盘上的数据从奇偶校验位重建后放入热备盘;对RAID 1/01,数据直接从镜像盘复制到热备盘。重建结束后,RAID group的冗余度才算恢复。一旦数据重建开始,进程将一直持续到重建完成,甚至在重建到热备盘的过程完成前拔出坏盘,这一进程也不会中断。

4.     一旦数据完成重建或复制到热备盘,并且人工替换了坏盘,FLARE开始将数据从热备盘回拷(equalize)至新替的盘。

5.     一旦数据回拷完成,RAID group就恢复到正常的状态。而热备盘也恢复可以替换其它盘的能力。

重建(rebuild)和回拷(equalization)所需时间:

硬盘重建取决于以下几个因素:

·         硬盘容量

·         硬盘类型(EFDFCSASSATA)

·         用户实际使用空间

·         重建优先级

·         后台I/O负载

·         RAID类型

·         RAID group中的硬盘数量

·         硬盘在back-end loop上的分布情况

 

    下表列举了300GB FC磁盘组成的LUN在空闲的CX4-960 (4Gb/s bus )上以ASAP (尽可能快)为优先级的基准重建速率:

Type

 

Rebuild Rate

 

    硬盘重建时间较多的受重建优先级和硬盘转速影响。以CX系列来说,更高优先级的LUN先被重建。如果多个LUN有相同的优先级,那最小的LUN先被重建。如果一个RAID group进入空闲状态,那所有LUN都会以ASAP的优先级来重建而不管它们原来的等级如何。ASAPHigh的优先级比MediumLow能更快速地恢复LUN。但优先级越高,对存储性能影响更大。如果更在乎性能的话,建议将优先级设为Low

    数据回拷的过程就是简单地将数据从热备盘复制到新替换的硬盘中,因此它要比重建快不少。下表列举了300GB FC磁盘组成的LUN在空闲的CX4-960 (4Gb/s bus )上的基准数据回拷速率

Type

 

Equalize Rate

 

参考

参考EMC白皮书EMC CLARiiON Global Hot Spares and Proactive Hot Sparing - Best Practices Planning”

应用于

CLARiiON系列、VNX系列

44 消息

2012年10月7日 01:00

每次换盘都前都要等很久。

73 消息

2012年11月5日 18:00

是不是有这么两种情况:1.主动热备份技术检测到盘将要坏掉时,从这块盘把数据复制到热备盘;2.如果这块盘已经坏掉了,raid 3,5,6,就是用其他盘的奇偶校验来重建出坏盘中的数据放入热备盘;

215 消息

2013年3月28日 03:00

主动热备也可以手工的方式在unisphere上触发。

找不到事件!

Top