Dell Unity:启动超过 240 天后出现 SP 死机
摘要: Dell Unity XT 480、680 或 880 存储处理器 (SP) 在运行超过 240 天后可能会死机。(戴尔可纠正)
症狀
Dell Unity XT 480、680 或 880 SP 在启动 240 天后可能会死机。 其他 Dell Unity 系统可能会在超过 240 天(即超过 730 天)后遇到此问题。
UDoctor 可能会在低于 5.3 的任何代码版本(其中 SP 已运行超过 240 天)上生成警报,该警报将引用此知识库文章。 请参阅知识库文章 Dell Unity:在 OE 5.2.1 或更高版本上出现严重警报640003,其中存储处理器 (SP) 正常运行死机修复已应用,以了解有关 UDoctor 警报的更多详细信息。
原因
由于整数溢出计算导致 64 位结果存储在 32 位变量中,可能会发生 SP 崩溃。
此问题 最有可能 发生在运行 Unity OE 版本 5.1.0.0.5.394 至 5.2.0.0.5.173 的 Unity XT 480、680 或 880 阵列上。这是由于该代码和这些型号中使用的 SP 硬件中的更改,以及代码与该硬件交互的方式造成的。
解析度
修复:
Unity OE 版本 5.2.1.0.5.013 及更高版本中提供了修复。 但是,戴尔不建议升级到此代码版本。 戴尔强烈建议客户升级到最新的可用代码,或者,如果最新代码不是“目标”代码,则至少升级到目标代码。
此外,UDoctor 实用程序在 Unity OE 版本 5.3 及更低版本上发现了此问题。这是因为修复在版本 5.3 中 提供 ,但 向后移植 到 5.2.1 及更高版本的代码。 UDoctor 警报在 向后移植 的代码上触发。
解决办法:
每 240 天主动重新启动一次 SP,以避免 SP 崩溃。有关重新启动 SP 的说明,请参阅以下文章:Unity:如何重新启动存储处理器(用户可纠正)。
客户可以发出 "uptime" 命令,方法是使用 SSH 连接到阵列并使用服务帐户获取 SP 运行时。
下面的示例显示正常运行时间为 31 天。
04:30:01 service@xxx spa:~/user# uptime
04:30am up 31 days 3:41, 2 users, load average: 29.21, 29.45, 29.51
除非实施了上述修复或解决方法,否则 UDoctor 警报将每三天刷新一次。 Dell Technologies 建议客户实施修复程序或解决方法(如果他们无法实施修复程序)。但是,如果修复或解决方法均无法实施,则可以 禁用仅针对此情况 的 UDoctor 检查。
使用 SSH 登录到主 SP 并发出以下命令:
svc_udoctor --jobs --disable CalculateUptime
这将禁止每三天运行一次检查。