未解决
此帖子已超过 5 年
402 消息
2
6351
【专家问答】EMC存储产品升级与维护的最佳实践
好消息~EMC中文论坛2015年最新一期的“专家问答”活动即将开启序幕!从1月21日(周三)起为期两周的时间里,EMC远程变更管理团队的两位专家将与大家一起讨论和分享有关EMC存储的升级与维护的最佳实践。
曾经错过的专家问答活动,均可以在往期所有“专家问答”活动 汇总帖 中查询得到哦!
本期问答主题:EMC存储产品升级与维护的最佳实践
本期问答开放时间:2015年1月21日-2月3日。活动结束后,本帖将锁定。如有相关的后续问题,请另建新帖提问。
本期坐镇的两位专家为:Jianqing Zha,Kyle Mao
【Jianqing Zha】
EMC资深技术专家,从事远程技术支持工作3年。目前就职于EMC 远程控制管理团队,主要负责VNX, VPLEX 系列产品的系统维护升级。熟悉数据中心的运行维护,熟悉Linux环境。熟悉数据中心存储基础架构,对VNX, Vplex系统运维升级有丰富经验。
【Kyle Mao】
EMC资深技术专家,从事远程技术支持工作3年。目前就职于EMC 远程控制管理团队,主要负责Islon, VNX系列产品的系统维护升级。 熟悉数据中心的运行维护,熟悉Linux环境。熟悉数据中心存储基础架构,对VNX, Islon系统运维升级有丰富经验。
和专家交流,与同行畅谈。欢迎大家以回帖方式就本期专家问答的主题,积极提问和踊跃发表自己的意见。期待您的参与!
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2015年1月20日 19:00
本次专家问答活动正式开启!欢迎大家踊跃提问哦~
Zhang_Jiawen
2 Intern
2 Intern
•
1.2K 消息
0
2015年1月21日 00:00
您好,请问VNX在线做升级,有什么可能风险,有哪些注意事项?
Anonymous
5 Practitioner
5 Practitioner
•
274.2K 消息
0
2015年1月21日 01:00
感谢您的关注,这个问题比较笼统,通常来说客户对维护升级风险非常在意.任何操作都是有风险的,我们团队在流程上会把风险控制在最小。至于升级过程中出现的一些不可预期状况,这是非常少见。通常来说,整个流程下来升级会正常完成。我说下我们在流程上怎么控制风险的。
1. 远程控制管理团队PCE会在和您安排升级的时候提前做一次预检,确保一切正常。需要注意的是,如发现问题我们会及时联 系您并进行专业处理或提交到相关团队进行处理。
2. 我们会检查相关业务的兼容性及相关的已知问题。
3. 升级当天,或提前24小四之内也会再作一次预检,确保一切正常。
4. 升级开始时相关脚本也会做检测。
5. 升级过程我们会一直监控。
6. 升级结束后会做一次检测和之前的检测记录作对比,如果有问题会进行相关的处理。
需要特别注意的是File升级时data mover 相关的一些共享文件业务有3分钟左右影响(已知问题),Block 升级是没有服务中断。我们预检工程师都会把相关的问题风险提前通知您。如果到时候您有任何升级时的具体问题,欢迎您联系我们团.队RemoteProactive@emc.com
希望以上可以解答你的疑问
yihongtao
8 消息
0
2015年1月21日 15:00
你好,请问VNX在做性能分析时重点应该关注那些性能指标?对应的解决办法是什么?另外VPLEX单引擎能承受多大iops,如果后端存储闪盘较多,通过vplex做mirror,性能瓶颈是否会出在vplex上。谢谢
Password01_
2 Intern
2 Intern
•
416 消息
0
2015年1月21日 18:00
您好,
现在客户有一台AX4的存储,现在要扩容6块1TB的硬盘。扩容AX4硬盘有何风险?是否有关于AX4扩容硬盘以及扩容DAE的相关操作文档?
谢谢二位!
Anonymous
5 Practitioner
5 Practitioner
•
274.2K 消息
0
2015年1月21日 20:00
VNX在做性能分析时重点应该关注
Utilization 使用率
Queue Length请求队列长度
Response Time物理响应时间
Total Bandwidth总带宽
Total Throughput 总IO
Read/Write Bandwidth读/写带宽
Read/Write Size读/写块大小
Read/Write Throughput读/写IO
Service Time服务时间
结合客户的服务要求进行相应的优化,如果有相关要求,可以使用相关的EMC工具(Analyzer)进行分析,具体的优化方案要具体分析。但首先应该保证系统跑在最稳定最安全的版本。
Vplex 单引擎试验数据能达到400000 IOPS, 一般我们很少能看到VPLEX 瓶颈问题。如VPLEX无法负荷IOPS了,首先会有CPU High的情况。 如果出现类似问题我们是要个案分析,也不只是简单增加引擎,如您所说的,闪盘较多的话,我们可能要考虑下latency的问题,由于闪盘的延迟本身可能比较低,而vplex会引入一个相对固定的延迟(1ms左右),这个1ms可能对不同的存储感觉是不一样的。
Anonymous
5 Practitioner
5 Practitioner
•
274.2K 消息
0
2015年1月21日 23:00
AX这个产品我们上海这边不支持,但一般来说没什么风险,加盘后重新划RG划LUN给前端用就可以了。据我了解AX老版本的CODE有些BUG,最好要先排除掉CODE的隐患(我们支持AX机器code 升级),KB3112描述了这个问题https://support.emc.com/kb/3112 ,如有升级需求到时候可以联系我们RemoteProactive@emc.com 关于扩容procedure 或文档,很抱歉我们没有, 但你应该可以在 EMC SolVe-Desktop 这个工具中生成相关文档。
yansheng
2 Intern
2 Intern
•
235 消息
0
2015年1月24日 05:00
客户为什么都不容易接受这个升级?约半天约不上,客户对升级态度是能不升就不升
Anonymous
5 Practitioner
5 Practitioner
•
274.2K 消息
0
2015年1月25日 05:00
通常对客户来说, 升级维护是有风险的, 这是客观事实, 当然会是一些客户不愿意做维护的原因。当然会是一些客户不愿意做维护的原因。当然我们也希望可以能尽量主动找我们升级维护。每个新版本code出来都会解决一些发现的新问题。当然也有一些其它原因导致客户不希望升级维护。
坦率得说,任何维护都是有风险的, 我们会把一些潜在风险告知客户, 通过升级或相关维护来开避免一些不可预期的问题发生,从而管控风险或者降低风险。大部分客户是可以理解的。而且维保期内,这些服务不会而外收费。
至于说维护约不上时间,从我们团队来说,对于中国客户, 如有需求我们会尽量100%满足预约升级,这个请放心。而且我们团队提供一站式服务,从预检,到安排维护,到升级维护, 我们团队都有专业的处理。您还可以选择中国的工程师给你做维护。
Jeffey1
2 Intern
2 Intern
•
2.8K 消息
0
2015年1月25日 21:00
你好,yuewangjie。
Isilon支持二种升级方法:滚动升级(Rolling upgrade)和同步升级(Simultaneous upgrade)。
滚动升级:集群中的节点分步进行升级,NFS连接会自动连接到工作正常的节点,SMB连接需要重新连接,对业务影响很小。
同步升级:业务会中断,集群中的所有节点同步进行升级。
在升级前建议先做一些准备工作,例如:升级版本间是否直接支持“滚动升级”或者“同步升级”,下载升级IOS。具体可以到support.emc.com上查找升级文档《Isilon upgrade guide》。下图描述了OneFS 7.2版本支持的升级类型。
Anonymous
5 Practitioner
5 Practitioner
•
274.2K 消息
0
2015年1月25日 21:00
Isilon支持滚动和批量升级两种方式。
一般来说,批量升级支持任意当前版本升级到任意目标版本,但是也有例外,当前版本在6.5.5.x 或者之前的版本不能直接升级到7.2版本,中间需要临时升级到7.0或者7.1,然后再选择滚动或批量升级到目标版本7.2.
对于滚动升级,也不是所以版本都支持的,具体需要参考目标版本的release note, 请参考: https://support.emc.com/docu46145_Current-Isilon-Software-Releases.pdf
批量升级或重启所有node,所以IO 影响是肯定有的。
对于滚动升级,NFS 客户端只要是配置的默认的auto connect, 在当前升级的node 重启的时候,NFS 连接会自动转移到其他node;关于SMB 客户端,升级当前的连接会全部中断,客户端需要重新提交SMB 访问请求才能重新建立连接。虽然EMC现在不鼓励在Isilon 端配置SAN, 但是少数客户还是在Isilon 存储端配置了iSCSI, VMware datastore,这些数据也会在升级的过程中受影响。
最后,Isilon不允许cluster中存在两个版本的node,原因在于OneFS操作系统是用来统筹和管理整个cluster上的资源,不同的版本之间可能存在较大的差别。
yuewangjie1
15 消息
0
2015年1月25日 21:00
Dear,请问下islon升级是滚动升级还是批量升级呢?升级过程中对前端IO不会造成任何影响吧,islon允许整个cluter中有两个不同版本的node吗?
Jeffey1
2 Intern
2 Intern
•
2.8K 消息
0
2015年1月25日 21:00
再补充一点,如果不同版本的节点被添加到Isilon群集后,节点会被自动re-image到集群的相同版本。如果需要添加的节点OneFS版本过老,如OneFS5.5,可以通过手动re-image添加节点的版本。
Qian Yunding
7 消息
0
2015年1月25日 23:00
cx的日志里面看到这个信息
01/25/15 12:05:18 Bus2 Enc2 DskD 98d Proactive Copy to Hot Spare is recommended. Call your Service Provider. 0 11b 0
但Flare没有自动让热备盘invoke,一般是什么情况造成的?
Anonymous
5 Practitioner
5 Practitioner
•
274.2K 消息
0
2015年1月26日 00:00
你好 David,
一般如果盘读写在某个扇区(sector)出现错误,冗余的数据和磁盘校验还是会正常提供数据I/O. 这个时候如果SP collect日志里出现以上报错,那就需要进一步确认有没有磁盘需要更换。
一般来说,如果在Unipshere里面, Hardware 菜单里面,对应的磁盘状态没问题,这个信息就可以忽略。
如果有任何的硬件故障,建议您开Service Request 到VNX Support 团队。