开始新对话

未解决

此帖子已超过 5 年

6332

2015年1月19日 19:00

【专家问答】EMC存储产品升级与维护的最佳实践

好消息~EMC中文论坛2015年最新一期的“专家问答”活动即将开启序幕!从1月21日(周三)起为期两周的时间里,EMC远程变更管理团队的两位专家将与大家一起讨论和分享有关EMC存储的升级与维护的最佳实践。

曾经错过的专家问答活动,均可以在往期所有“专家问答”活动 汇总帖 中查询得到哦!

本期问答主题:EMC存储产品升级与维护的最佳实践

本期问答开放时间:2015年1月21日-2月3日。活动结束后,本帖将锁定。如有相关的后续问题,请另建新帖提问。

本期坐镇的两位专家为:Jianqing Zha,Kyle Mao

【Jianqing Zha】

EMC资深技术专家,从事远程技术支持工作3年。目前就职于EMC 远程控制管理团队,主要负责VNX, VPLEX 系列产品的系统维护升级。熟悉数据中心的运行维护,熟悉Linux环境。熟悉数据中心存储基础架构,对VNX, Vplex系统运维升级有丰富经验。

jianqing Zha.jpg



【Kyle Mao】

EMC资深技术专家,从事远程技术支持工作3年。目前就职于EMC 远程控制管理团队,主要负责Islon, VNX系列产品的系统维护升级。 熟悉数据中心的运行维护,熟悉Linux环境。熟悉数据中心存储基础架构,对VNX, Islon系统运维升级有丰富经验。

Kyle Mao.png



和专家交流,与同行畅谈。欢迎大家以回帖方式就本期专家问答的主题,积极提问和踊跃发表自己的意见。期待您的参与!

4K 消息

2015年1月20日 19:00

本次专家问答活动正式开启!欢迎大家踊跃提问哦~

1.2K 消息

2015年1月21日 00:00

您好,请问VNX在线做升级,有什么可能风险,有哪些注意事项?

5 Practitioner

 • 

274.2K 消息

2015年1月21日 01:00

感谢您的关注,这个问题比较笼统,通常来说客户对维护升级风险非常在意.任何操作都是有风险的,我们团队在流程上会把风险控制在最小。至于升级过程中出现的一些不可预期状况,这是非常少见。通常来说,整个流程下来升级会正常完成。我说下我们在流程上怎么控制风险的。

1.  远程控制管理团队PCE会在和您安排升级的时候提前做一次预检,确保一切正常。需要注意的是,如发现问题我们会及时联     系您并进行专业处理或提交到相关团队进行处理。

2.  我们会检查相关业务的兼容性及相关的已知问题。

3.  升级当天,或提前24小四之内也会再作一次预检,确保一切正常。

4.  升级开始时相关脚本也会做检测。

5.  升级过程我们会一直监控。

6.  升级结束后会做一次检测和之前的检测记录作对比,如果有问题会进行相关的处理。

需要特别注意的是File升级时data mover 相关的一些共享文件业务有3分钟左右影响(已知问题),Block 升级是没有服务中断。我们预检工程师都会把相关的问题风险提前通知您。如果到时候您有任何升级时的具体问题,欢迎您联系我们团.队RemoteProactive@emc.com


希望以上可以解答你的疑问

8 消息

2015年1月21日 15:00

你好,请问VNX在做性能分析时重点应该关注那些性能指标?对应的解决办法是什么?另外VPLEX单引擎能承受多大iops,如果后端存储闪盘较多,通过vplex做mirror,性能瓶颈是否会出在vplex上。谢谢

416 消息

2015年1月21日 18:00

您好,

     现在客户有一台AX4的存储,现在要扩容6块1TB的硬盘。扩容AX4硬盘有何风险?是否有关于AX4扩容硬盘以及扩容DAE的相关操作文档?

     谢谢二位!

5 Practitioner

 • 

274.2K 消息

2015年1月21日 20:00

VNX在做性能分析时重点应该关注

Utilization 使用率

Queue Length请求队列长度

Response Time物理响应时间

Total Bandwidth总带宽

Total Throughput IO

Read/Write Bandwidth/写带宽

Read/Write Size/写块大小

Read/Write Throughput/IO

Service Time服务时间


结合客户的服务要求进行相应的优化,如果有相关要求,可以使用相关的EMC工具(Analyzer)进行分析,具体的优化方案要具体分析。但首先应该保证系统跑在最稳定最安全的版本。

Vplex 单引擎试验数据能达到400000 IOPS 一般我们很少能看到VPLEX 瓶颈问题。如VPLEX无法负荷IOPS了,首先会有CPU High的情况。 如果出现类似问题我们是要个案分析,也不只是简单增加引擎,如您所说的,闪盘较多的话,我们可能要考虑下latency的问题,由于闪盘的延迟本身可能比较低,而vplex会引入一个相对固定的延迟(1ms左右),这个1ms可能对不同的存储感觉是不一样的。


5 Practitioner

 • 

274.2K 消息

2015年1月21日 23:00

AX这个产品我们上海这边不支持,但一般来说没什么风险,加盘后重新划RGLUN给前端用就可以了。据我了解AX老版本的CODE有些BUG,最好要先排除掉CODE的隐患(我们支持AX机器code 升级),KB3112描述了这个问题https://support.emc.com/kb/3112 ,如有升级需求到时候可以联系我们RemoteProactive@emc.com 关于扩容procedure 或文档,很抱歉我们没有, 但你应该可以在 EMC SolVe-Desktop 这个工具中生成相关文档。

235 消息

2015年1月24日 05:00

客户为什么都不容易接受这个升级?约半天约不上,客户对升级态度是能不升就不升

5 Practitioner

 • 

274.2K 消息

2015年1月25日 05:00

    通常对客户来说, 升级维护是有风险的, 这是客观事实, 当然会是一些客户不愿意做维护的原因。当然会是一些客户不愿意做维护的原因。当然我们也希望可以能尽量主动找我们升级维护。每个新版本code出来都会解决一些发现的新问题。当然也有一些其它原因导致客户不希望升级维护。

   

    坦率得说,任何维护都是有风险的, 我们会把一些潜在风险告知客户, 通过升级或相关维护来开避免一些不可预期的问题发生,从而管控风险或者降低风险。大部分客户是可以理解的。而且维保期内,这些服务不会而外收费。

    至于说维护约不上时间,从我们团队来说,对于中国客户, 如有需求我们会尽量100%满足预约升级,这个请放心。而且我们团队提供一站式服务,从预检,到安排维护,到升级维护, 我们团队都有专业的处理。您还可以选择中国的工程师给你做维护。

2.8K 消息

2015年1月25日 21:00

你好,yuewangjie。

Isilon支持二种升级方法:滚动升级(Rolling upgrade)和同步升级(Simultaneous upgrade)。

滚动升级:集群中的节点分步进行升级,NFS连接会自动连接到工作正常的节点,SMB连接需要重新连接,对业务影响很小。

同步升级:业务会中断,集群中的所有节点同步进行升级。

在升级前建议先做一些准备工作,例如:升级版本间是否直接支持“滚动升级”或者“同步升级”,下载升级IOS。具体可以到support.emc.com上查找升级文档《Isilon upgrade guide》。下图描述了OneFS 7.2版本支持的升级类型。

Untitled.png

5 Practitioner

 • 

274.2K 消息

2015年1月25日 21:00

Isilon支持滚动和批量升级两种方式。

一般来说,批量升级支持任意当前版本升级到任意目标版本,但是也有例外,当前版本在6.5.5.x 或者之前的版本不能直接升级到7.2版本,中间需要临时升级到7.0或者7.1,然后再选择滚动或批量升级到目标版本7.2.

对于滚动升级,也不是所以版本都支持的,具体需要参考目标版本的release note, 请参考: https://support.emc.com/docu46145_Current-Isilon-Software-Releases.pdf

批量升级或重启所有node,所以IO 影响是肯定有的。

对于滚动升级,NFS 客户端只要是配置的默认的auto connect, 在当前升级的node 重启的时候,NFS 连接会自动转移到其他node;关于SMB 客户端,升级当前的连接会全部中断,客户端需要重新提交SMB 访问请求才能重新建立连接。虽然EMC现在不鼓励在Isilon 端配置SAN, 但是少数客户还是在Isilon 存储端配置了iSCSI, VMware datastore,这些数据也会在升级的过程中受影响。

最后,Isilon不允许cluster中存在两个版本的node,原因在于OneFS操作系统是用来统筹和管理整个cluster上的资源,不同的版本之间可能存在较大的差别。

15 消息

2015年1月25日 21:00

Dear,请问下islon升级是滚动升级还是批量升级呢?升级过程中对前端IO不会造成任何影响吧,islon允许整个cluter中有两个不同版本的node吗?

2.8K 消息

2015年1月25日 21:00

再补充一点,如果不同版本的节点被添加到Isilon群集后,节点会被自动re-image到集群的相同版本。如果需要添加的节点OneFS版本过老,如OneFS5.5,可以通过手动re-image添加节点的版本。

7 消息

2015年1月25日 23:00

cx的日志里面看到这个信息

  01/25/15 12:05:18 Bus2 Enc2 DskD      98d Proactive Copy to Hot Spare is recommended. Call your Service Provider. 0    11b      0

但Flare没有自动让热备盘invoke,一般是什么情况造成的?

5 Practitioner

 • 

274.2K 消息

2015年1月26日 00:00

你好 David,

一般如果盘读写在某个扇区(sector)出现错误,冗余的数据和磁盘校验还是会正常提供数据I/O. 这个时候如果SP collect日志里出现以上报错,那就需要进一步确认有没有磁盘需要更换。

一般来说,如果在Unipshere里面, Hardware 菜单里面,对应的磁盘状态没问题,这个信息就可以忽略。

如果有任何的硬件故障,建议您开Service Request 到VNX Support 团队。

找不到事件!

Top