Inizia una nuova conversazione

Non risolto

MM

3 Messaggi

567

June 16th, 2021 08:00

Problema VRXT - rimane bloccato nello stato powering on

Buongiorno,

ho un problema con un server VRTX fuori garanzia. 

Dopo questo errore riscontrato nel log

IOV118: Fabric B is down.
   2021-06-12T07:20:48+0200
Log Sequence Number:539
Detailed Description:
The Fabric identified in the message is not up and a chassis power cycle is required.
Recommended Action:
Power cycle the chassis. Using the Chassis Management Controller (CMC) RACADM command line interface, run the command 'racadm chassisaction powercycle'
 
ho provveduto ad effettuare il powercycle come suggerito, ma da quel momento la macchina non riesce a completare l'avvio e rimane bloccata nello stato di powering on. Il controller SPERC viene indicato come installato ma spento dal CMC, ma rimuovendolo fisicamente dal server permane nelle stesse condizioni per il sistema (lo indica come installato anche dopo la rimozione). La macchina non completa l'avvio neanche rimuovendo tutti i blade, tutti gli HDD e lo stesso SPERC. La scheda CMC sembra funzionare correttamente, ho provato anche a spostarla nello slot 2 (così come fatto per lo SPERC) senza che ci fossero cambiamenti.
Nella sezione storage non viene rilevato alcun controller e viene visualizzato questo messaggio:
" The storage subsystem is powered off, the information below is from the last known state. To view up to date storage information power on the chassis". Nel log non ci sono altri eventi successivi che non siano relativi all'apertura del case o alla rimozione dei blade.
Ho aggiornato tutti i firmware all'ultima versione (a parte quello della mainboard, che senza completare l'avvio non si può aggiornare).
Le 4 PSU hanno luce verde e non sembrano avere problemi ed in generale non ci sono alert di alcun tipo.
Dopo il tentativo di avvio senza dischi, li ho rimontati ed ora sembrano non ricevere più corrente (non si attiva nessun led e sono spenti) ed anche dall'interfaccia del CMC risultano assenti. Inoltre, al momento il firmware della mainboard viene indicato come [UNKNOWN]. 
Ho il forte sospetto che sia proprio la mainboard ad essere guasta, ma vorrei esserne sicuro prima di acquistarne un'altra.
 
Cordiali saluti,
Matteo

Moderator

 • 

3.4K Messaggi

June 17th, 2021 01:00

Buongiorno Matteo,

il troubleshooting che hai eseguito è appropriato per determinare la parte guasta, purtroppo però, a parte sostituire delle parti con alcune sicuramente funzionanti, non è possibile stabilire con certezza quale sia la parte incriminata.

Non mi vengono in mente altre prove da fare. Il fatto che togliendo il SPERC viene visto come installato, sembra escludere che sia guasto.

Anche secondo me è da sostituire la scheda madre. Quello che puoi fare è contattare il supporto per richiedere un intervento risolutivo fuori garanzia.

Spero di esserti stato di aiuto.

Buona giornata

Marco

June 29th, 2021 01:00

Buongiorno,

mi sono procurato un altro chassis e ho spostato la CMC ed il PERC da quello vecchio a quello nuovo. Ora la fase di accensione viene completata correttamente, ma il controller si avvia in safe mode con la motivazione che i cavi SAS sono scollegati (chiaramente non lo sono). Ho provato allora a spostare nel nuovo chassis il vecchio backplane ed a sostituire i cavi, ma il problema permane (rimane anche se sposto il PERC nello slot due e sposto i cavi SAS).

Sostituzione del controller a parte (che può essere una soluzione), mi rimane da provare a resettare il PERC, ma mi ha frenato il fatto che ci sia un pinned cache ( e non vorrei perdere qualche dato). Se lo resetto, cancella anche la cache? Mi sembra di capire di no, ma vorrei essere sicuro.

Grazie in anticipo,

Matteo

Moderator

 • 

3.4K Messaggi

June 29th, 2021 07:00

Buongiorno,

per resettare intendi rimuovere e reinserire il controller PERC? In questo caso confermo che la PERC ha una batteria che alimenta la cache e quindi anche rimuovendo la scheda i dati all'interno vengono preservati. Puoi effettivamente provare come tentativo per far ripartire il PERC anche se poi dovrai sostituire la scheda non sono sicuro che potrai trasferire fisicamente i dati nella cache da una PERC a l'altra.

Grazie

 

Marco

June 29th, 2021 09:00

Buonasera,

mi sono spiegato male, con reset intendevo il reimpostare il controller con il factory reset che ho trovato sotto troubleshooting nella sezione controller del CMC. Anche perchè il software si comporta come se si aspettasse un secondo controller per la ridondanza, ma ne ho sempre avuto solo uno.

Moderator

 • 

3.4K Messaggi

June 30th, 2021 01:00

Buongiorno,

controllando nel manuale, il reset del PERC rimuove i dati eventuali che sono rimasti in cache.

https://dell.to/2ToxSw6

Marco

Nessun evento trovato!

Top