Dell Unity: Unity irraggiungibile dopo il riavvio dell'SP primario durante l'aggiornamento

Summary: Questo articolo spiega perché Unity Management Services diventa irraggiungibile dopo il riavvio dell'SP primario durante un aggiornamento. (correggibile dall'utente)

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

L'SP primario si riavvia durante il processo di aggiornamento.

I servizi di gestione Unity diventano irraggiungibili durante il riavvio dell'SP primario del processo di aggiornamento del codice.

L'IP Unity non è pingabile e Unisphere non viene caricato.

L'accesso ai dati non è interessato.

Cause

In Unity, l'SP primario gestisce i servizi di gestione (l'indirizzo IP).
Al riavvio dell'SP primario, viene eseguito il failover dei servizi di gestione sull'SP secondario (peer).

Problema 1:
Se l'SP secondario non è connesso alla stessa rete di gestione di quello primario, l'IP Unity diventa irraggiungibile in caso di failover del servizio di gestione.

Esempio:
Prima dell'aggiornamento:
  • L'SP A è primario e l'SP B è secondario
  • L'SP A è connesso alla rete di gestione da cui si accede a Unisphere.
  • L'SP B non è connesso alla stessa rete dell'SP A.
Quando l'SP A si riavvia durante l'aggiornamento:
  • L'SP B diventa primario e l'SP A diventa secondario.
  • Poiché i servizi di gestione sono nell'SP B, l'IP di gestione di Unity diventa irraggiungibile.
Problema 2:
Un secondo problema può verificarsi quando si verifica il failover tra SP e si esegue lo spoofing dell'indirizzo MAC sul nuovo SP. Alcuni ambienti utente potrebbero raccogliere il nuovo indirizzo MAC "duplicato" e bloccare l'accesso alla porta dello switch, causando la perdita dell'accesso.
 
Nota: In Unity OE 5.3 e versioni successive è stato introdotto un nuovo miglioramento dell'utilità Controllo integrità pre-aggiornamento (PUHC).

Questo miglioramento verifica la presenza di possibili problemi di connettività sulle porte di gestione. Vedere Dell Unity: Il controllo integrità pre-aggiornamento viene completato con l'avvertenza: platform::check_management_port_2 (correggibile dall'utente)
Test of the management port configuration indicates there may be a problem with the management port VLAN settings that could cause loss of management functionality during storage processor reboots associated with the upgrade. Some valid network configurations can also make this test fail. Ensure that the alternate management port is properly configured. See KB#000066048 for recommended VLAN management port guidelines. You can safely ignore this warning if there is not a real issue.
Schermata dell'interfaccia utente dell'avviso PUHC:


Schermata del nuovo avviso PUHC
questo messaggio di avviso indica che l'array Unity non è stato in grado di confermare la connettività di rete di gestione dello storage processor (SP) peer. Il nuovo miglioramento PUHC di Unity OE 5.3 avvia un probe ARP (Address Resolution Protocol) sulla rete. Questa operazione consente di confermare eventuali problemi di connettività sull'SP peer, nel caso in cui venga eseguito il failover delle operazioni di gestione sull'SP peer.

Il PUHC invia una sonda ARP invece di un ping ARP standard. L'indirizzo IP di gestione è attivo solo sull'SP primario, non sul peer. Questo è il motivo per cui il controllo deve essere una sonda ARP sul peer. L'SP non primario (peer) non dispone di un indirizzo IP configurato per un ARP standard. Pertanto, la richiesta ARP deve essere inviata con 0.0.0.0 popolato ed è un probe ARP.

Il messaggio di avvertenza viene visualizzato se non si riceve una risposta dal probe ARP.

Questo avviso non indica che il collegamento della porta era inattivo per una porta di gestione SP prima dell'aggiornamento. Se si verificava questo problema, il controllo integrità precedente all'aggiornamento lo rilevava (come descritto nell'articolo Dell Dell Unity: Il controllo integrità ha esito negativo con [Error code: platform::check_peer_management_port_link_2] (correggibile dall'utente)

Resolution

Durante il PUHC prima dell'aggiornamento:
Il seguente messaggio di avvertenza è un avviso non automatico e non un errore:
Warning Code: platform::check_management_port_2
Utilizzare una delle opzioni riportate nell'articolo seguente per eseguire il failover delle operazioni di gestione sull'SP peer per verificare se l'SP peer dispone di connettività con la rete. Dell Unity: Come eseguire un failover dei servizi di gestione (ECOM) (correggibile da Dell)

Un'ulteriore opzione utilizzata in questo articolo consiste nel riavviare l'SP primario corrente per eseguire il failover delle operazioni di gestione sull'SP peer. Le operazioni di gestione possono essere perse fino a 10 minuti durante il processo di failover. Una volta ripristinate le operazioni di gestione, verificare che l'SP peer sia ora l'SP primario. Se le operazioni di gestione funzionano correttamente su SPA e SPB dopo i test di failover, questo messaggio di avvertenza può essere tranquillamente ignorato.

Durante l'aggiornamento:
Questo avviso può essere ignorato se non è stato visualizzato fino a metà dell'aggiornamento. Cliccare sul pulsante "Retry" per procedere con l'aggiornamento.  

Contattare il Supporto Dell e citare questo articolo della Knowledge Base, nel caso in cui il pulsante "Riprova" non funzioni.

Dopo un aggiornamento riuscito:
L'avvertenza seguente
Warning Code: platform::check_management_port_2
Può essere tranquillamente ignorato se si riceve questo messaggio di avvertenza dopo un aggiornamento riuscito a Unity OE 5.3 o versione successiva.

Additional Information

Questo articolo della KB si applica a tutti i riavvii dell'SP primario e non solo agli aggiornamenti.

Esempi del problema: 
  • In un caso, un SP era connesso alla rete di gestione mentre il cavo di gestione dell'altro SP era collegato a uno switch iSCSI.
  • In un altro caso, un SP era connesso alla rete di gestione mentre il cavo di gestione dell'altro SP era collegato alla porta dello switch che si connetteva a un'altra rete su una VLAN diversa.
A partire da Unity OE versione 5.3, un nuovo test fa parte dell'utilità Pre-Upgrade Health Check (PUHC) per verificare questa condizione.  Questo test controllerà sia gli SP primari che secondari.  Il nuovo test (diverso dal test corrente in cui si verifica che le porte non siano inattivo) utilizzerà l'utilità "arp ping" (arping) per verificare se l'interfaccia consente il traffico ARP (Address Resolution Protocol) attraverso la sua interfaccia.  In genere, gli switch sono configurati per bloccare le trasmissioni ARP su VLAN, quindi nella maggior parte dei casi questo test è affidabile per determinare se le VLAN per le porte di gestione sono configurate correttamente.  Questo test può generare un falso negativo se lo switch è configurato per consentire le trasmissioni su VLAN e il test può generare un falso positivo quando le trasmissioni vengono disabilitate, anche all'interno di una VLAN.  Ma nella maggior parte dei casi, in condizioni normali, questo nuovo test determinerà se le porte di gestione sono configurate correttamente in una VLAN.

Affected Products

Dell EMC Unity Family

Products

Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family, Dell EMC Unity Hybrid
Article Properties
Article Number: 000066048
Article Type: Solution
Last Modified: 21 Jun 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.