PowerStore:資料收集失敗,且 PowerStore Manager 使用者介面報告異常資訊

Сводка: PowerStore Manager 使用者介面報告不正確的值、錯誤或工作失敗。支援資料或支援資料收集 (DC) 無法執行,或卡在執行狀態。

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

症狀包括:

  • 支援資料或支援資料收集 (DC) 無法執行,或卡在 PowerStore Manager 使用者介面 (UI) 中的執行狀態。透過 CLI 執行 DC (svc_dc 執行) 失敗,並顯示: 
    • FAILURE, Running too long
    • 從容器接收服務資料套裝命令回應超時
  • 磁碟區顯示容量為 0GB。  
  • 無法建立或刪除任何物件 (例如磁碟區等)。  
  • 磁碟區無法擴充 - 錯誤 0xE0A080030019。
  • 保護原則已無法運作 (未建立新的快照,而舊的快照不會到期),且複寫驗證失敗。
  • 無法檢視或變更 SSH 狀態。Error: 擷取此資訊時發生錯誤。要求不明的內容 is_ssh_enabled。(0xE04040020002)
  • LDAP 網域連線錯誤
  • 根分割區已滿或空間用盡的警示。未從次要節點上的 /cyc_var/cyc_service/tmp 清理 Temp DC 檔案,可能會導致根分割區已滿。系統會產生警告:節點 X 的根分割區使用率已超過 Y% (代碼:0x00400601 或 0x00400602)
  • 在某些極端情況下,如果無法立即採取任何行動來解決根分割區空間問題,次要節點可能會進入服務模式。
  • 監控 > 系統檢查執行 > 系統檢查失敗,且消防員命令失敗。(0xE0F010200004)



從 PowerStore Manager 看到的 DC 問題範例:

image.png


從 PowerStore Manager 看到的系統檢查失敗範例:

image.png


 

Причина

許多洩漏的系統登入工作階段會導致服務容器中的記憶體洩漏。在 DC 收集期間,由於記憶體不足的狀況,服務容器中的消防員服務已終止。

如果系統在消防員服務終止後未偵測到其故障,則消防員服務將保持中斷。

Разрешение

修正

PowerStoreOS 2.1.1.0-1649887 中提供防止發生此問題的修正。建議升級。

此修正程式會列在 PowerStoreOS 版本 2.1.1.0 版本資訊修訂 A03 或更新版本中:
問題 ID 功能領域 說明
MDT-361718  PowerStore Manager(GUI) 由於控制路徑或管理資源的問題,PowerStore 系統使用者介面可能會隨著時間推移而降級。降級可能會導致 PowerStore Manager (UI) 回應緩慢或無法收集資料。

因應措施


注意:此因應措施僅適用於 PowerStore T 機型。PowerStore X 有更多需求和步驟必須在重新啟動任何服務之前執行。

如果問題已存在,請先聯絡 Dell 技術支援 部門或您的授權服務代表,並引用此知識文章 ID,再嘗試升級。

若要解決此問題,必須重新啟動兩個服務。
  • 受影響節點上的服務容器。
    • 服務容器大約需要 10 分鐘才能重新啟動。
    • 除了短暫無法存取受影響節點的服務容器 (ssh 或 cli) 外,不會對系統造成任何影響。
  • 控制路徑 (CP) 或管理服務。
    • 重新啟動大約需要五分鐘。
    • 除了短暫無法存取 PowerStore Manager 使用者介面外,不會對系統造成任何影響。

幾分鐘后,輔助節點根分區上的空間將下降到正常級別。

如果 /cyc_cfs 磁碟分割大於 85%,請從 PowerStore Manager 使用者介面刪除舊的 DC。

重新啟動服務後,您可能會看到一些警示,例如:
  • SupportAssist 連線能力警示。
  • 複寫 RPO 未達到警示。
  • 快照自動刪除警示。
在行動計畫實施後,這些應會全部自行清除。給予它足夠的時間,因為有些可能需要等到下一個 RPO 週期 (複寫) 或快照排程才啟動。

Дополнительная информация

識別問題

檢查大量洩漏的登入工作階段 (如果數目大於 5000,就會發生問題):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC 失敗並出現錯誤 FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


如果主要節點上不再有消防員程序,DC 會失敗,並出現錯誤「Timed out receiving service data bundle command response from container」:
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Затронутые продукты

PowerStore

Продукты

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Свойства статьи
Номер статьи: 000193605
Тип статьи: Solution
Последнее изменение: 29 May 2024
Версия:  21
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.