PowerStore: Datainsamlingen misslyckas och användargränssnittet i PowerStore Manager rapporterar onormal information

Summary: Användargränssnittet i PowerStore Manager rapporterar felaktiga värden, fel eller jobb som misslyckas. Supportmaterial eller supportdatainsamlingar (DC) kan inte köras eller fastnar i körningsläge. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Symptomen omfattar:

  • Det går inte att köra supportmaterial eller supportdatainsamlingar (DC) eller fastnar i körläge i PowerStore Manager-användargränssnittet (UI). Det går inte att köra domänkontrollanter över CLI (svc_dc körning) med: 
    • FEL, kör för länge
    • Tidsgränsen för mottagning av kommandosvar för tjänstdatapaket från containern
  • Volymer med en kapacitet på 0 GB.  
  • Det går inte att skapa eller ta bort objekt (t.ex. volymer osv.).  
  • Det går inte att utöka volymerna – fel 0xE0A080030019.
  • Skyddspolicyer fungerar inte längre (nya ögonblicksbilder skapas inte och gamla upphör inte att gälla) och replikeringsverifieringen misslyckas.
  • Det går inte att visa eller ändra SSH-status. Fel: Ett fel uppstod när informationen skulle hämtas. Okänd egenskap is_ssh_enabled efterfrågad. (0xE04040020002)
  • Anslutningsfel för LDAP-domän
  • Varningar om rotpartitionen är full eller om utrymmet håller på att ta slut. Temporära DC-filer rensas inte från /cyc_var/cyc_service/tmp på den sekundära noden, vilket kan leda till en fullständig rotpartition. Systemet genererar varningar: Rotpartitionsanvändningen för nod X har överskridit Y % (koder: 0x00400601 eller 0x00400602)
  • I vissa extrema fall där ingen åtgärd vidtas snabbt för att lösa problem med rotpartitionsutrymmet kan den sekundära noden gå in i serviceläge.
  • Övervakning > av systemkontroller > Körningen av systemkontrollen misslyckas med brandmankommandot misslyckades. (0xE0F010200004)



Exempel på DC-problem sett från PowerStore Manager:

image.png


Exempel på systemkontrollfel sett från PowerStore Manager:

image.png


 

Cause

Många läckta systemd-inloggningssessioner leder till en minnesläcka i tjänstcontainern. Brandmantjänsten i servicecontainern avbryts under DC-insamlingen på grund av ett minnesfel.

Brandmanstjänsten förblir nere om systemet inte upptäcker sitt fel efter att brandmanstjänsten har avbrutits.

Resolution

Korrigering

Korrigeringen för att förhindra att det här problemet uppstår finns i PowerStoreOS 2.1.1.0-1649887. Rekommendationen är att uppgradera.

Den här korrigeringen ingår i versionskommentarerna för PowerStoreOS version 2.1.1.0 version A03 eller senare:
Problem-ID Funktionsområde Beskrivning
MDT-361718  PowerStore Manager (GUI) På grund av ett problem med kontrollsökvägen eller hanteringsresurserna kan en försämring av PowerStore-systemets användargränssnitt inträffa med tiden. Försämringen kan leda till långsamma svar eller att PowerStore Manager (UI) inte kan samla in data.

Alternativ lösning


Obs! Den här lösningen är endast för PowerStore T-modeller. PowerStore X har fler krav och steg som måste utföras innan du startar om några tjänster.

Om problemet redan finns kontaktar du Dells tekniska support eller din auktoriserade servicerepresentant och citerar detta artikel-ID i kunskapsbasen innan du försöker uppgradera.

För att lösa det här problemet när det redan finns måste två tjänster startas om.
  • Tjänstcontainer på den berörda noden.
    • Det tar cirka 10 minuter att starta om tjänstcontainern.
    • Ingen påverkan på systemet förutom en kort förlust av åtkomst till tjänstcontainern (ssh eller CLI) för den berörda noden.
  • Control Path (CP) eller hanteringstjänster.
    • Det tar cirka fem minuter att starta om.
    • Ingen påverkan på systemet förutom en kort förlust av åtkomst till PowerStore Manager-användargränssnittet.

Efter några minuter sjunker utrymmet på den sekundära nodens rotpartition till normala nivåer.

Om partitionen /cyc_cfs är över 85 % tar du bort gamla domänkontrollanter från PowerStore Manager-användargränssnittet.

Du kan se några varningar när du har startat om tjänsterna, till exempel:
  • SupportAssist-anslutningsvarningar.
  • Replikerings-RPO uppfyllde inte aviseringar.
  • Aviseringar om automatisk borttagning av ögonblicksbilder.
Dessa bör alla rensas ut av sig själva efter handlingsplanen. Ge det tillräckligt med tid eftersom vissa kan behöva vänta tills nästa RPO-cykel (replikering) eller snap-schema ska starta.

Additional Information

Identifiera problemet

Kontrollera om det finns ett stort antal läckta inloggningssessioner (det finns ett problem om antalet är större än 5000):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC:n misslyckas med felet FAILURE, kör för länge:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


Om brandmansprocessen inte längre finns på den primära noden misslyckas DC:n med felet "Timeout receiving service data bundle command response from container":
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.