Dell Unity:运行启用了 SupportAssist 的 5.3.0 代码的阵列在正常运行 ~2 个月后可能会遇到存储处理器 (SP) 死机(用户可纠正)
Summary: 运行 5.3.0.0.5.120 代码且启用了 SupportAssist 的 Unity 阵列在使用双 SCG 配置运行大约 2 个月后,或者使用单 SCG 配置或直接连接运行大约 4 个月后,可能会遇到 SP 崩溃。
Symptoms
的 Unity 阵列 SupportAssist 已配置并启用远程访问。
直接连接和网关配置都会受到影响。
使用双 SCG 配置
,运行大约 2 个月后 SP 崩溃和意外重新启动,使用单个 SCG 配置或直接连接运行大约 4 个月后,SP 崩溃和意外重新启动。
Cause
崩溃只应发生在运行 ESE 进程的主 SP 上,死机后资源将被释放。
Resolution
此问题已在 Unity Operating Environment (OE) 版本 5.3.1.0.5.008 中得到修复。
解决 方案:
有多种解决方法可用;有关每个解决方法的详细步骤,请参阅其他信息部分。
Additional Information
解决方法选项 #1:
当僵尸 curl 进程的数量变得很高时,重新启动 SupportAssist 将清除它们并防止发生 SP 崩溃。重新启动 SupportAssist 的建议阈值为 5,000。下面显示了用于检查僵尸(已失效)curl 进程数量和重新启动 SupportAssist 的命令。
14:01:20 service@none spb:~/user# ps -ef |grep curl|grep defunct|wc -l
4702 <----------------Current Number of zombie curl processes
14:01:52 service@none spb:~/user# svc_supportassist --restart
Restart in progress........完成!
14:03:59 service@none spb:~/user# svc_supportassist --status
State:运行
类型:通过网关服务器
连接:Reachable
Primary gateway: https://1.2.3.4:9443 (Reachable)
Remote Access:
是,RSC 已启用:无
版本:4.7.7.21
Initialized:
Yes Proxy mode: none
14:04:22 service@none spb:~/user# ps -ef |grep curl|grep defunct|wc -l
0 <----------------- SupportAssist 重新启动
后的僵尸 curl 进程数解决方法选项 #2:
我们开发了新的 UDoctor 脚本 (udoctor_update_supportassist),并分阶段提供给连接的 Unity 阵列。 如果接受并安装,新的 Udoctor 脚本将清除任何僵尸(已失效)curl 进程,并防止将来任何新的僵尸(已失效)curl 进程的累积。
UDoctor 脚本会自动推送到已启用 callhome 的系统,以及 call home 并指示它们已安装 5.3.0 的系统。 过去,会优先考虑具有大量僵尸进程的系统,但该优先级已被取消,我们正在加速推广到所有显示 5.3.0 连接到总部的系统。 将软件包推送到您的系统后,您将看到与所示类似的警报:
UDoctor 软件包用于将有针对性的更新、解决方法和配置更改应用于 Unity 阵列,与完整的软件 OE 升级无关。
请参阅知识库文章 Dell Unity:UDoctor 软件包 (xxxxxx) 现在可用于安装。(用户可纠正)了解如何确定是否有新的 UDoctor 软件包,以及如何接受和安装新的 UDoctor 软件包。
注 1:
执行 Unity OE 升级 (NDU) 时,它将覆盖 UDoctor 软件包所做的任何更改。 这意味着,当软件修复在新的 Unity OE 版本中可用时,可以执行标准 NDU,无需执行其他步骤。
注 2:
无法覆盖资源清册/推送过程并强制将 UDoctor 软件包推送到任何特定的 Unity 系统。 清点/推送过程每周进行一次。 对于希望尽快修复的客户,正确的解决方案是升级到 Unity OE 版本 5.3.1.0.5.008 (5.3 SP1)。 或者,客户可以利用上面列出的其他解决方法。