PowerStore: una data collection ha esito negativo e l'interfaccia utente di PowerStore Manager segnala informazioni anomale

Summary: L'interfaccia utente di PowerStore Manager riporta errori, valori o job non corretti. I materiali o le data collection di supporto non vengono eseguite o si bloccano durante l'esecuzione. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Alcuni sintomi:

  • I materiali o le data collection di supporto non vengono eseguite o si bloccano in stato di esecuzione nell'interfaccia utente di PowerStore Manager. L'esecuzione di data collection tramite CLI (svc_dc run) ha esito negativo con gli errori: 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • I volumi visualizzano una capacità di 0 GB.  
  • Impossibile creare o eliminare oggetti (ad esempio volumi e così via).  
  • I volumi non possono essere espansi - errore 0xE0A080030019.
  • Le policy di protezione non funzionano più (le nuove snapshot non vengono create e quelle precedenti non scadono) e la verifica della replica non riesce.
  • Impossibile visualizzare o modificare lo stato SSH. Errore: There was an error retrieving this information. Unknown property is_ssh_enabled requested. (0xE04040020002)
  • Errori di connessione al dominio LDAP
  • Avvisi di partizione root piena o spazio esaurito. I file temporanei delle data collection non vengono puliti da /cyc_var/cyc_service/tmp sul nodo secondario, con possibile partizione root piena. Il sistema genera avvertenze: Root partition usage of node X has exceeded Y% (codes: 0x00400601 or 0x00400602)
  • Nei casi estremi in cui non viene subito eseguita un'azione per risolvere i problemi di spazio della partizione root, il nodo secondario potrebbe entrare in modalità di servizio.
  • Monitoraggio > dei controlli > di sistema L'esecuzione del controllo di sistema non riesce con errore del comando Fireman. (0xE0F010200004)



Esempio di problema di una data collection visibile in PowerStore Manager:

image.png


Esempio di errore di controllo del sistema come riportato da PowerStore Manager:

image.png


 

Cause

Un numero elevato di sessioni di accesso systemd con perdite comporta una perdita di memoria nel service container. Il servizio fireman nel service container viene terminato durante la data collection a causa di una condizione di memoria insufficiente.

Il servizio fireman rimane inattivo se systemd non rileva il proprio errore dopo che il servizio fireman è stato terminato.

Resolution

Correzione

La correzione per evitare che si verifichi questo problema è disponibile in PowerStoreOS 2.1.1.0-1649887. Si consiglia di eseguire l'upgrade a questa versione.

Questa correzione è elencata nella revisione A03 o successiva delle note di rilascio di PowerStoreOS versione 2.1.1.0:
ID del problema Area funzionale Descrizione
MDT-361718  PowerStore Manager (GUI) A causa di un problema con il CP o le risorse di gestione, le prestazioni delle interfacce utente del sistema PowerStore possono degradarsi nel tempo. Il degrado delle prestazioni può causare una risposta lenta o l'impossibilità per PowerStore Manager (interfaccia utente) di raccogliere dati.

Soluzione alternativa


Nota: Questa soluzione alternativa è valida solo per i modelli PowerStore T. PowerStore X presenta più requisiti e passaggi da eseguire prima di riavviare qualsiasi servizio.

Se il problema è già presente, contattare il supporto tecnico Dell o il responsabile dell'assistenza autorizzato e citare l'ID di questo articolo della Knowledge Base, prima di tentare l'aggiornamento.

Per risolvere questo problema quando è già presente, è necessario riavviare due servizi.
  • Container di servizio sul nodo interessato.
    • Il riavvio del service container richiede circa 10 minuti.
    • Nessun impatto sul sistema se non una breve perdita di accesso al service container (SSH o CLI) del nodo interessato.
  • CP (Control Path) o servizi di gestione.
    • Il riavvio richiede circa cinque minuti.
    • Nessun impatto sul sistema, a parte una breve perdita dell'accesso all'interfaccia utente di PowerStore Manager.

Dopo alcuni minuti, lo spazio sulla partizione root del nodo secondario scende a livelli normali.

Se la partizione /cyc_cfs è superiore all'85%, eliminare i vecchi DC dall'interfaccia utente di PowerStore Manager.

È possibile che vengano visualizzati alcuni avvisi dopo il riavvio dei servizi, ad esempio:
  • Avvisi di connettività di SupportAssist.
  • Avvisi RPO di replica non soddisfatti.
  • Avvisi di eliminazione automatica delle snapshot.
Dopo avere eseguito il piano d'azione, tutti questi avvisi dovrebbero scomparire automaticamente. Lasciar trascorrere tempo sufficiente, in quanto per alcuni di essi potrebbe essere necessario attendere l'avvio del ciclo RPO (replica) successivo o della pianificazione delle snapshot.

Additional Information

Identificazione del problema

Verificare la presenza di un numero elevato di sessioni di accesso con perdite (si verifica un problema se il numero è maggiore di 5000):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


La data collection ha esito negativo con errore FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


Se il processo fireman non esiste più sul nodo primario, la data collection non riesce con l'errore "Timed out receiving service data bundle command response from container":
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.