PowerStore: Die Datenerhebung schlägt fehl und die PowerStore Manager-Nutzeroberfläche meldet ungewöhnliche Informationen.

Summary: Die PowerStore Manager-Benutzeroberfläche meldet falsche Werte, Fehler oder fehlgeschlagene Jobs. Supportmaterialien oder Support-Datenerhebung (DC) können nicht ausgeführt werden oder bleiben im Ausführungsstatus hängen. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Zu den Symptomen gehören:

  • Supportmaterialien oder Support-Datenerhebungen (DC) können nicht ausgeführt werden oder bleiben in der PowerStore Manager-Benutzeroberfläche (UI) im Ausführungsstatus hängen. Das Ausführen von DCs über die CLI (svc_dc run) schlägt fehl mit: 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • Volumes zeigen eine Kapazität von 0 GB an.  
  • Objekte (z. B. Volumes usw.) können nicht erstellt oder gelöscht werden.  
  • Volumes können nicht erweitert werden – Fehler 0xE0A080030019.
  • Schutz-Policys funktionieren nicht mehr (neue Snapshots werden nicht erstellt und alte laufen nicht ab) und die Replikationsüberprüfung schlägt fehl.
  • Der SSH-Status kann nicht angezeigt oder geändert werden. Error: There was an error retrieving this information. Unknown property is_ssh_enabled requested. (0xE04040020002)
  • LDAP-Domainverbindungsfehler
  • Warnmeldungen für voll belegten oder knappen Speicherplatz auf der Root-Partition. Temporäre DC-Dateien werden nicht von /cyc_var/cyc_service/tmp auf dem sekundären Node bereinigt, was möglicherweise zu einer vollständigen Root-Partition führt. Das System erzeugt Warnmeldungen: Root partition usage of node X has exceeded Y% (codes: 0x00400601 or 0x00400602)
  • In einigen extremen Fällen, in denen nicht zeitnah eine Maßnahme durchgeführt wird, um die Speicherplatzprobleme in der Root-Partition zu beheben, wechselt der sekundäre Node möglicherweise in den Servicemodus.
  • Überwachen > von Systemprüfungen Das Ausführen > der Systemprüfung schlägt fehl, wenn der Fireman-Befehl fehlschlägt. (0xE0F010200004)



Beispiel für das DC-Problem, wie aus PowerStore Manager ersichtlich:

image.png


Beispiel für den Fehler bei der Systemprüfung, wie in PowerStore Manager zu sehen:

image.png


 

Cause

Viele verlorene systeminterne Anmeldesitzungen führen zu einem Speicherverlust im Servicecontainer. Der Dienst fireman im Servicecontainer wird während der DC-Erfassung aufgrund eines Zustands mit nicht genügend Arbeitsspeicher abgebrochen.
Der Dienst fireman bleibt inaktiv, wenn das System nicht den Fehler erkennt, nachdem der Dienst fireman beendet wurde.

Resolution

Fehlerbehebung

Der Fix, um zu verhindern, dass dieses Problem auftritt, befindet sich in PowerStoreOS 2.1.1.0-1649887. Es wird empfohlen, ein Upgrade durchzuführen.

Dieser Fix ist in den Versionshinweisen zu PowerStoreOS Version 2.1.1.0 Überarbeitung A03 oder höher aufgeführt:
Problem-ID Funktionsbereich Beschreibung
MDT-361718  PowerStore Manager (GUI) Aufgrund eines Problems mit den Kontrollpfad- oder Managementressourcen kann es im Laufe der Zeit zu einer Verschlechterung der PowerStore-Systemnutzeroberflächen kommen. Die Verschlechterung kann zu einer langsamen Reaktion oder dazu führen, dass PowerStore Manager (UI) keine Daten erfassen kann.

Problemumgehung


Hinweis: Dieser Workaround gilt nur für PowerStore T-Modelle. PowerStore X hat mehr Anforderungen und Schritte, die vor dem Neustart von Services ausgeführt werden müssen.

Wenn das Problem bereits vorhanden ist, wenden Sie sich an den technischen Support von Dell oder an Ihren autorisierten Servicemitarbeiter und geben Sie diese Wissensdatenbank-Artikel-ID an, bevor Sie versuchen, ein Upgrade durchzuführen.

Um dieses Problem zu beheben, wenn es bereits vorhanden ist, müssen zwei Services neu gestartet werden.
  • Servicecontainer auf dem betroffenen Node.
    • Der Neustart des Servicecontainers dauert ca. 10 Minuten.
    • Keine Auswirkungen auf das System, außer einem kurzzeitigen Verlust des Zugriffs auf den Servicecontainer (SSH oder CLI) des betroffenen Nodes.
  • Control Path (CP) oder Managementservices.
    • Der Neustart dauert ca. fünf Minuten.
    • Keine Auswirkungen auf das System, außer einem kurzzeitigen Verlust des Zugriffs auf die PowerStore Manager-Benutzeroberfläche.

Nach einigen Minuten sinkt der Speicherplatz auf der Root-Partition des sekundären Node auf das normale Niveau.

Wenn die /cyc_cfs-Partition über 85 % liegt, löschen Sie alte DCs aus der PowerStore Manager-Benutzeroberfläche.

Möglicherweise werden nach dem Neustart der Services einige Warnmeldungen angezeigt, z. B.:
  • SupportAssist-Konnektivitätswarnmeldungen.
  • Replikations-RPO hat Warnmeldungen nicht erfüllt.
  • Warnmeldungen zum automatischen Löschen von Snapshots.
Diese sollten alle nach dem Maßnahmenplan von selbst gelöscht werden. Gewähren Sie ihm genügend Zeit, da einige möglicherweise warten müssen, bis der nächste RPO-Zyklus (Replikation) oder der Snapshot-Zeitplan beginnt.

Additional Information

Identifizieren des Problems

Prüfen Sie, ob eine hohe Anzahl an verlorenen Anmeldesitzungen vorhanden ist (es liegt ein Problem vor, wenn die Anzahl größer als 5000 ist):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC schlägt mit diesem Fehler fehl: FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


Wenn der fireman-Prozess nicht mehr auf dem primären Node vorhanden ist, schlägt der DC mit diesem Fehler fehl: „Timed out receiving service data bundle command response from container“:
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.