PowerStore:資料收集失敗,且 PowerStore Manager 使用者介面報告異常資訊

Summary: PowerStore Manager 使用者介面報告不正確的值、錯誤或工作失敗。支援資料或支援資料收集 (DC) 無法執行,或卡在執行狀態。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

症狀包括:

  • 支援資料或支援資料收集 (DC) 無法執行,或卡在 PowerStore Manager 使用者介面 (UI) 中的執行狀態。透過 CLI 執行 DC (svc_dc 執行) 失敗,並顯示: 
    • FAILURE, Running too long
    • 從容器接收服務資料套裝命令回應超時
  • 磁碟區顯示容量為 0GB。  
  • 無法建立或刪除任何物件 (例如磁碟區等)。  
  • 磁碟區無法擴充 - 錯誤 0xE0A080030019。
  • 保護原則已無法運作 (未建立新的快照,而舊的快照不會到期),且複寫驗證失敗。
  • 無法檢視或變更 SSH 狀態。Error: 擷取此資訊時發生錯誤。要求不明的內容 is_ssh_enabled。(0xE04040020002)
  • LDAP 網域連線錯誤
  • 根分割區已滿或空間用盡的警示。未從次要節點上的 /cyc_var/cyc_service/tmp 清理 Temp DC 檔案,可能會導致根分割區已滿。系統會產生警告:節點 X 的根分割區使用率已超過 Y% (代碼:0x00400601 或 0x00400602)
  • 在某些極端情況下,如果無法立即採取任何行動來解決根分割區空間問題,次要節點可能會進入服務模式。
  • 監控 > 系統檢查執行 > 系統檢查失敗,且消防員命令失敗。(0xE0F010200004)



從 PowerStore Manager 看到的 DC 問題範例:

image.png


從 PowerStore Manager 看到的系統檢查失敗範例:

image.png


 

Cause

許多洩漏的系統登入工作階段會導致服務容器中的記憶體洩漏。在 DC 收集期間,由於記憶體不足的狀況,服務容器中的消防員服務已終止。

如果系統在消防員服務終止後未偵測到其故障,則消防員服務將保持中斷。

Resolution

修正

PowerStoreOS 2.1.1.0-1649887 中提供防止發生此問題的修正。建議升級。

此修正程式會列在 PowerStoreOS 版本 2.1.1.0 版本資訊修訂 A03 或更新版本中:
問題 ID 功能領域 說明
MDT-361718  PowerStore Manager(GUI) 由於控制路徑或管理資源的問題,PowerStore 系統使用者介面可能會隨著時間推移而降級。降級可能會導致 PowerStore Manager (UI) 回應緩慢或無法收集資料。

因應措施


注意:此因應措施僅適用於 PowerStore T 機型。PowerStore X 有更多需求和步驟必須在重新啟動任何服務之前執行。

如果問題已存在,請先聯絡 Dell 技術支援 部門或您的授權服務代表,並引用此知識文章 ID,再嘗試升級。

若要解決此問題,必須重新啟動兩個服務。
  • 受影響節點上的服務容器。
    • 服務容器大約需要 10 分鐘才能重新啟動。
    • 除了短暫無法存取受影響節點的服務容器 (ssh 或 cli) 外,不會對系統造成任何影響。
  • 控制路徑 (CP) 或管理服務。
    • 重新啟動大約需要五分鐘。
    • 除了短暫無法存取 PowerStore Manager 使用者介面外,不會對系統造成任何影響。

幾分鐘后,輔助節點根分區上的空間將下降到正常級別。

如果 /cyc_cfs 磁碟分割大於 85%,請從 PowerStore Manager 使用者介面刪除舊的 DC。

重新啟動服務後,您可能會看到一些警示,例如:
  • SupportAssist 連線能力警示。
  • 複寫 RPO 未達到警示。
  • 快照自動刪除警示。
在行動計畫實施後,這些應會全部自行清除。給予它足夠的時間,因為有些可能需要等到下一個 RPO 週期 (複寫) 或快照排程才啟動。

Additional Information

識別問題

檢查大量洩漏的登入工作階段 (如果數目大於 5000,就會發生問題):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC 失敗並出現錯誤 FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


如果主要節點上不再有消防員程序,DC 會失敗,並出現錯誤「Timed out receiving service data bundle command response from container」:
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.