Dell Unity:執行 5.3.0 程式碼且啟用 SupportAssist 的陣列,可能會在 ~2 個月的連續運作時間後發生儲存處理器 (SP) 當機 (使用者可修正)
Summary: 執行 5.3.0.0.5.120 程式碼且已啟用 SupportAssist 的 Unity 陣列,在使用兩個 SCG 組態運作約 2 個月,或使用單一 SCG 組態或直接連線約 4 個月後,可能會遇到 SP 核心錯誤。
Symptoms
SupportAssist 的 Unity 陣列已設定並啟用遠端存取。
專線和閘道配置都會受到影響。
使用兩個 SCG 組態
約 2 個月執行時間後 SP 發生錯誤和意外重新開機;使用單一 SCG 組態或直接連線,在執行約 4 個月後,SP 當機和意外重新開機。
Cause
只有執行 ESE 流程的主要 SP 才會發生錯誤,而在錯誤發生後,資源就會釋出。
Resolution
此問題已在 Unity 作業環境 (OE) 版本 5.3.1.0.5.008 中修正。
因應措施:
有多種解決方法可用;有關每個解決方法的詳細步驟,請參閱其他資訊部分。
Additional Information
因應措施選項 #1:
在殭屍捲曲程序數量過高時重新啟動 SupportAssist,將會清除這些程式,並防止 SP 發生當機。重新啟動 SupportAssist 的建議閾值為 5,000。檢查殭屍 (失效) curl 程序數量和重新啟動 SupportAssist 的命令如下所示。
14:01:20 service@none spb:~/user# ps -ef |grep curl|grep defunct|wc -l
4702 <----------------當前殭屍捲曲進程
數量 14:01:52 service@none spb:~/user# svc_supportassist --restart
正在重新開機........完成!
14:03:59 service@none spb:~/user# svc_supportassist --status
State:執行
類型:透過閘道伺服器
連線 連線能力:可
連線的主要閘道:https://1.2.3.4:9443 (可連線)
遠端存取:
是,RSC 已啟用:無
版本:4.7.7.21
已初始化:
是,代理模式:無
14:04:22 service@none spb:~/user# ps -ef |grep curl|grep defunct|wc -l
0 <----------------- SupportAssist 重新啟動
後的殭屍 curl 程序數量因應措施選項 #2:
新的 UDoctor 指令檔 (udoctor_update_supportassist) 已經開發出來,並以交錯的方式提供給連接的 Unity 陣列。 如果接受並安裝,新的 Udoctor 腳本將清除任何殭屍(已失效)的 curl 進程,並防止將來積累任何新的殭屍(失效)捲曲進程。
UDoctor 指令檔會自動推送至已啟用 callhome 和 call home 並指示其已安裝 5.3.0 的系統。 過去,優先考慮具有大量殭屍進程的系統,但該優先順序已被取消,我們現在正在加速向所有連接 home 表示 5.3.0 的系統推出。 將套件推送至系統後,您會看到類似於所示的警示:
UDoctor 套件用於將目標更新、因應措施和組態變更套用至 Unity 陣列,與完整軟體 OE 升級無關。
參考資料:知識文章 Dell Unity:UDoctor 套裝 (xxxxxx) 現已可供安裝。(使用者可修正) 以瞭解如何識別是否有新的 UDoctor 套件可用,以及如何接受和安裝新的 UDoctor 套件。
註1:
執行 Unity OE 的升級 (NDU) 時,它會覆寫 UDoctor 套件所做的任何變更。 這表示當軟體修正程式在新的 Unity OE 版本中可用時,即可執行標準 NDU,不需要執行其他步驟。
注2:
無法覆寫清查/推送程序,也無法強制將 UDoctor 套件推送至任何特定的 Unity 系統。 清查/推送過程每周進行一次。 對於希望儘快修復的客戶,正確的解決方案是升級到 Unity OE 版本 5.3.1.0.5.008 (5.3 SP1)。 或者,客戶可以使用上面列出的其他解決方法。