KRhelen

402 消息

6351

2015年1月19日 19:00

【专家问答】EMC存储产品升级与维护的最佳实践

好消息～EMC中文论坛2015年最新一期的“专家问答”活动即将开启序幕！从1月21日（周三）起为期两周的时间里，EMC远程变更管理团队的两位专家将与大家一起讨论和分享有关EMC存储的升级与维护的最佳实践。

曾经错过的专家问答活动，均可以在往期所有“专家问答”活动 汇总帖 中查询得到哦！

本期问答主题：EMC存储产品升级与维护的最佳实践

本期问答开放时间：2015年1月21日-2月3日。活动结束后，本帖将锁定。如有相关的后续问题，请另建新帖提问。

本期坐镇的两位专家为：Jianqing Zha，Kyle Mao

【Jianqing Zha】

EMC资深技术专家，从事远程技术支持工作3年。目前就职于EMC 远程控制管理团队，主要负责VNX， VPLEX 系列产品的系统维护升级。熟悉数据中心的运行维护，熟悉Linux环境。熟悉数据中心存储基础架构，对VNX, Vplex系统运维升级有丰富经验。

jianqing Zha.jpg

【Kyle Mao】

EMC资深技术专家，从事远程技术支持工作3年。目前就职于EMC 远程控制管理团队，主要负责Islon， VNX系列产品的系统维护升级。熟悉数据中心的运行维护，熟悉Linux环境。熟悉数据中心存储基础架构，对VNX, Islon系统运维升级有丰富经验。

Kyle Mao.png

和专家交流，与同行畅谈。欢迎大家以回帖方式就本期专家问答的主题，积极提问和踊跃发表自己的意见。期待您的参与！

回复(18)

Roger_Wu

2 Intern

•

4K 消息

0

2015年1月20日 19:00

本次专家问答活动正式开启！欢迎大家踊跃提问哦～

Zhang_Jiawen

2 Intern

•

1.2K 消息

0

2015年1月21日 00:00

您好，请问VNX在线做升级，有什么可能风险，有哪些注意事项？

A

Anonymous

5 Practitioner

•

274.2K 消息

0

2015年1月21日 01:00

感谢您的关注,这个问题比较笼统，通常来说客户对维护升级风险非常在意.任何操作都是有风险的，我们团队在流程上会把风险控制在最小。至于升级过程中出现的一些不可预期状况，这是非常少见。通常来说，整个流程下来升级会正常完成。我说下我们在流程上怎么控制风险的。

1. 远程控制管理团队PCE会在和您安排升级的时候提前做一次预检，确保一切正常。需要注意的是，如发现问题我们会及时联系您并进行专业处理或提交到相关团队进行处理。

2. 我们会检查相关业务的兼容性及相关的已知问题。

3. 升级当天，或提前24小四之内也会再作一次预检，确保一切正常。

4. 升级开始时相关脚本也会做检测。

5. 升级过程我们会一直监控。

6. 升级结束后会做一次检测和之前的检测记录作对比，如果有问题会进行相关的处理。

需要特别注意的是File升级时data mover 相关的一些共享文件业务有3分钟左右影响（已知问题），Block 升级是没有服务中断。我们预检工程师都会把相关的问题风险提前通知您。如果到时候您有任何升级时的具体问题，欢迎您联系我们团.队RemoteProactive@emc.com

希望以上可以解答你的疑问

yihongtao

8 消息

0

2015年1月21日 15:00

你好，请问VNX在做性能分析时重点应该关注那些性能指标？对应的解决办法是什么？另外VPLEX单引擎能承受多大iops，如果后端存储闪盘较多，通过vplex做mirror，性能瓶颈是否会出在vplex上。谢谢

Password01_

2 Intern

•

416 消息

0

2015年1月21日 18:00

您好，

现在客户有一台AX4的存储，现在要扩容6块1TB的硬盘。扩容AX4硬盘有何风险？是否有关于AX4扩容硬盘以及扩容DAE的相关操作文档？

谢谢二位！

A

Anonymous

5 Practitioner

•

274.2K 消息

0

2015年1月21日 20:00

VNX在做性能分析时重点应该关注

Utilization 使用率

Queue Length请求队列长度

Response Time物理响应时间

Total Bandwidth总带宽

Total Throughput 总IO

Read/Write Bandwidth读/写带宽

Read/Write Size读/写块大小

Read/Write Throughput读/写IO

Service Time服务时间

结合客户的服务要求进行相应的优化，如果有相关要求，可以使用相关的EMC工具（Analyzer）进行分析，具体的优化方案要具体分析。但首先应该保证系统跑在最稳定最安全的版本。

Vplex 单引擎试验数据能达到400000 IOPS，一般我们很少能看到VPLEX 瓶颈问题。如VPLEX无法负荷IOPS了，首先会有CPU High的情况。如果出现类似问题我们是要个案分析，也不只是简单增加引擎，如您所说的，闪盘较多的话，我们可能要考虑下latency的问题，由于闪盘的延迟本身可能比较低，而vplex会引入一个相对固定的延迟（1ms左右），这个1ms可能对不同的存储感觉是不一样的。

A

Anonymous

5 Practitioner

•

274.2K 消息

0

2015年1月21日 23:00

AX这个产品我们上海这边不支持，但一般来说没什么风险，加盘后重新划RG划LUN给前端用就可以了。据我了解AX老版本的CODE有些BUG，最好要先排除掉CODE的隐患（我们支持AX机器code 升级），KB3112描述了这个问题https://support.emc.com/kb/3112 ，如有升级需求到时候可以联系我们RemoteProactive@emc.com 关于扩容procedure 或文档,很抱歉我们没有，但你应该可以在 EMC SolVe-Desktop 这个工具中生成相关文档。

yansheng

2 Intern

•

235 消息

0

2015年1月24日 05:00

客户为什么都不容易接受这个升级？约半天约不上，客户对升级态度是能不升就不升

A

Anonymous

5 Practitioner

•

274.2K 消息

0

2015年1月25日 05:00

通常对客户来说, 升级维护是有风险的, 这是客观事实, 当然会是一些客户不愿意做维护的原因。当然会是一些客户不愿意做维护的原因。当然我们也希望可以能尽量主动找我们升级维护。每个新版本code出来都会解决一些发现的新问题。当然也有一些其它原因导致客户不希望升级维护。

坦率得说,任何维护都是有风险的, 我们会把一些潜在风险告知客户, 通过升级或相关维护来开避免一些不可预期的问题发生，从而管控风险或者降低风险。大部分客户是可以理解的。而且维保期内，这些服务不会而外收费。

至于说维护约不上时间，从我们团队来说，对于中国客户, 如有需求我们会尽量100%满足预约升级，这个请放心。而且我们团队提供一站式服务，从预检，到安排维护，到升级维护，我们团队都有专业的处理。您还可以选择中国的工程师给你做维护。

Jeffey1

2 Intern

•

2.8K 消息

0

2015年1月25日 21:00

你好，yuewangjie。

Isilon支持二种升级方法：滚动升级（Rolling upgrade）和同步升级（Simultaneous upgrade）。

滚动升级：集群中的节点分步进行升级，NFS连接会自动连接到工作正常的节点，SMB连接需要重新连接，对业务影响很小。

同步升级：业务会中断，集群中的所有节点同步进行升级。

在升级前建议先做一些准备工作，例如：升级版本间是否直接支持“滚动升级”或者“同步升级”，下载升级IOS。具体可以到support.emc.com上查找升级文档《Isilon upgrade guide》。下图描述了OneFS 7.2版本支持的升级类型。

A

Anonymous

5 Practitioner

•

274.2K 消息

0

2015年1月25日 21:00

Isilon支持滚动和批量升级两种方式。

一般来说，批量升级支持任意当前版本升级到任意目标版本，但是也有例外，当前版本在6.5.5.x 或者之前的版本不能直接升级到7.2版本，中间需要临时升级到7.0或者7.1，然后再选择滚动或批量升级到目标版本7.2.

对于滚动升级，也不是所以版本都支持的，具体需要参考目标版本的release note, 请参考： https://support.emc.com/docu46145_Current-Isilon-Software-Releases.pdf

批量升级或重启所有node，所以IO 影响是肯定有的。

对于滚动升级，NFS 客户端只要是配置的默认的auto connect, 在当前升级的node 重启的时候，NFS 连接会自动转移到其他node；关于SMB 客户端，升级当前的连接会全部中断，客户端需要重新提交SMB 访问请求才能重新建立连接。虽然EMC现在不鼓励在Isilon 端配置SAN, 但是少数客户还是在Isilon 存储端配置了iSCSI, VMware datastore，这些数据也会在升级的过程中受影响。

最后，Isilon不允许cluster中存在两个版本的node，原因在于OneFS操作系统是用来统筹和管理整个cluster上的资源，不同的版本之间可能存在较大的差别。

yuewangjie1

15 消息

0

2015年1月25日 21:00

Dear，请问下islon升级是滚动升级还是批量升级呢？升级过程中对前端IO不会造成任何影响吧，islon允许整个cluter中有两个不同版本的node吗？

Jeffey1

2 Intern

•

2.8K 消息

0

2015年1月25日 21:00

再补充一点，如果不同版本的节点被添加到Isilon群集后，节点会被自动re-image到集群的相同版本。如果需要添加的节点OneFS版本过老，如OneFS5.5，可以通过手动re-image添加节点的版本。

Qian Yunding

7 消息

0

2015年1月25日 23:00

cx的日志里面看到这个信息

01/25/15 12:05:18 Bus2 Enc2 DskD 98d Proactive Copy to Hot Spare is recommended. Call your Service Provider. 0 11b 0

但Flare没有自动让热备盘invoke，一般是什么情况造成的？

A

Anonymous

5 Practitioner

•

274.2K 消息

0

2015年1月26日 00:00

你好 David，

一般如果盘读写在某个扇区（sector）出现错误，冗余的数据和磁盘校验还是会正常提供数据I/O. 这个时候如果SP collect日志里出现以上报错，那就需要进一步确认有没有磁盘需要更换。

一般来说，如果在Unipshere里面， Hardware 菜单里面，对应的磁盘状态没问题，这个信息就可以忽略。

如果有任何的硬件故障，建议您开Service Request 到VNX Support 团队。

1
2

查看全部

找不到事件！

综合讨论区

【专家问答】EMC存储产品升级与维护的最佳实践