Comenzar una conversación nueva

No resuelto

C

9 Mensajes

1198

29 de junio de 2020 06:00

Poweredge R720xd colgado en el CPLD

Buenos días.

Tenemos un server r720 que arranca, hace el test de la memoria y del IDRAC. No da la opcion de entrar en bios, pero sigue haciendo los test de controladora. Puedo acceder con CTRL+R y en principio todo está OK. Pero sigue el arranque y se queda colgado tras el test del CPLD. Desconecta incluso el teclado. He visto en otros foros no oficiales que tiene que ver con los volumenes y que eliminandolos funciona. Pero no puedo perder la información. Igualmente si le quitos los discos y reinicio se queda colgado en el mismo sitio.

¿Puedo quitar los discos, eliminar la información de la controladora y probar? Luego si la información de los raids está en los discos lo recuperaré?

O no tiene nada que ver y hay alguna otra solución?

Gracias

Carlos

 

4 Operator

 • 

2.7K Mensajes

30 de junio de 2020 02:00

Muy buenas @CTeruel,


Podemos probar varias cosas ante de proceder con lo que comentas. Antes de nada, quiero pedirte que limpies la estática en el servidor. Para ello, desconecte todos los cables de corriente y, con los cables desconectados, mantenga pulsado el botón de power durante al menos 30 segundos. Después deje la máquina apagada al menos 5 minutos y luego conecte los cables y vuelva a arrancar la máquina nuevamente.


Después, ¿puedes confirmarme si logras acceder al Lifecycle Controller (LCC)? Pulsa repetidamente F10 durante el arranque. Si logras acceder al Lifecycle Controller, desde aquí podemos hacer un diagnóstico de hardware. Este artículo explica cómo hacerlo:Cómo ejecutar diagnósticos de hardware en un servidor PowerEdge.

 

Además, si el LCC está accesible se puede revisar y exportar el log.


Dime el resultado de estos procedimientos y en función de lo que me digas te planteo nuevas opciones.

 

Un saludo.

9 Mensajes

1 de julio de 2020 01:00

Hola, Diego.

Gracias por responder.

He hecho lo que me indicas pero no puedo entrar en el LCC.

El servidor arranca y hace la prueba de la memoria y la del idrac correctamente. Luego sale el logo de DELL con la barra de proceso y antes de que se llene, arriba a la derecha aparece "Entering Lifecycle Controller". Sin pulsar f10. No salen las opciones de entrar en LCC o en Bios. Automaticamente ya intenta entrar.

Pasa a la siguiente ventana, pasa las opciones de la controladora correctamente y en cuanto salen las del CPLD se cuelga y apaga el teclado.

Puedo acceder al idrac, por si desde ahi podemos hacer algo, pero todos los logs salen como correctos.

 

Gracias de nuevo.

Carlos Teruel

9 Mensajes

1 de julio de 2020 01:00

@DiegoLopez 

 

Perdon, solo te nombro por si era necesario para que el sistema te avise de que hay una respuesta.

4 Operator

 • 

2.7K Mensajes

1 de julio de 2020 03:00

Gracias por tu respuesta @CTeruel!

 

Entendido, seguramente hay algo en el POST que no está permitiendo al servidor completar el arranque. No tiene porque ser el CPLD, puede ser el hardware que venga después en la secuencia de arranque. Por ponerte un ejemplo, recuerdo un caso en el que lo que estaba provocando el problema es una tarjeta de red Broadcom 5720 QP rNDC.

 

Que tengas todavía acceso a la iDRAC es una gran ventaja que podemos aprovechar. Desde la misma iDRAC podemos exportar un log. Este artículo explica cómo hacerlo: Exportar una recopilación de SupportAssist y un registro de PERC mediante iDRAC 7 y 8

 

El siguiente paso para diagnósticar el problemas es que realice una operación de diagnóstico que nosotros conocemos como "Minimun to Post" es decir, quitar todos los componentes no obligatorios para el arranque hasta dejar la máquina con el mínimo posible de componentes y verificar si arranca. Si no arranca en ese estado el problema está en esos componentes, si consigue arrancar, hay que ir añadiendo componentes poco a poco hasta detectar el fallo. Para su información, el manual de hardware del R720XD lista los siguientes componentes para un "Minimun to Post":

 

One Power Supply
Control Panel (for power button functionality)
Working cable connection between control panel and system board
One Processor (CPU) in socket CPU1 (minimum for troubleshooting)
One Memory Module (DIMM) installed in socket A1
System Board
Backplane (for R720xd)

 

Espero que esto le sirva de ayuda.
Un saludo.

4 Operator

 • 

2.7K Mensajes

1 de julio de 2020 07:00

Hola Carlos,


Sinceramente creo que aquí encontramos el primer problema, parece que la máquina estaba bastante desactualizada. Ha podido experimentar un error que impide el arranque o un fallo en un componente. Quizás, si la máquina hubiera estado actualizada el problema no huiera ocurrido o, al menos, hubieramos visto algo en los logs o hubieramos podido sacar un reporte. No sirve de nada lamentarnos ahora pero al menos esto nos debe recordar la importancia de mantener los firmware de los servidores actualizados.


Hay dos formas de aplicar actualizaciones de firmware: a través del sistema operativo (al cual no tenemos acceso) o a través del Lifecycle Controller (la iDRAC también reinicia el server cuando aplicamos una actualización y arranca el LCC). El problema que tenemos ahora es que para aplicar la actualización necesitamos que el servidor pueda acceder al Lifecycle Controller y por la descripción del problema que me haces... el servidor no logra arrancarlo.


Quiero responder a tu pregunta sobre el tipo de ficheros para actualizar a través de la iDRAC o el lCC. Se usa el mismo .exe que si actualizaramos en Windows. ¿En qué versión está la iDRAC?


Sólo se me ocurren una idea, pero si no funciona... será necesario reemplazar la placa base.


La primera opción es limpiar la NVRam. Primero tiene que localizar la NVRam-CLR en la placa base (como se muestra en la imagen) y luego mover el jumper.

 


Arranque el sistema con el jumper desplazado para conseguir que se limpie el NVRam. Luego puede apagar el servidor y volver a poner el jumper en su posición original.


A ver si tiene suerte con este procedimiento.


Un saludo.

9 Mensajes

1 de julio de 2020 07:00

hola de nuevo. MAs info a continuacion.

Finalmente sí ha aceptado el fichero que decía en el anterior post (a la segunda...), y se pone en la cola de trabajos. sigue siendo una versión mas baja que la que piden, pero por probar...

El caso es que sigue sin actualizarse. Dice que la actualización se ejecutará cuando cierre el lifecycle. Pero el servidor entra en el lifecycle al arrancar y se cuelga sin que pueda evitarlo.

 

¿alguna idea?

Gracias de nuevo.

9 Mensajes

1 de julio de 2020 07:00

hola de nuevo, @DiegoLopez 

Le he quitado todo lo que podia desconectar y sigue igual.

Ahora estoy engancahdo con lo de los logs, pero pone que la version del firmware debe de ser minimo la 2.10.10

El servidor no estaba actualizado. He bajado todo lo que puedo bajar del centro de descargas de Dell para actualizar el idrac pero ninguno de los formatos de ficheros me lo acepta. O bien el tipo de fichero o que no puede cargar la imagen, etc. el fichero que deberia ser se llama ESM_Firmware_3F4WV_WN64_1.66.65_A00 pero esto es una imagen para windows! He ido tambien a las descargas del servidor 720, en vez de 720xd y hay mas versiones y formatos, pero tampoco acepta ninguno de ellos.

gracias

Carlos Teruel

 

9 Mensajes

1 de julio de 2020 08:00

Hola de nuevo, @DiegoLopez 

He conseguido actualizar el firmware del IDrac y del lifecycle. No me aceptaba los exe, pero si lo ha hecho con el payload, fichero.d7

Ahora estoy en la version 2.65.65.65

Cuando arranca el servidor, ya me salen las opciones de entrar en BIOS o el lifecycle, sin embargo ninguna de las 2 funciona. Continua el arranque y se queda en la misma pantalla. 

He podido hacer el log y exportarlo. ¿Cómo puedo enviartelo o qué puedo hacer con él?

Y también lo del jumper para limpiar la NVRam, pero tampoco lo ha solucionado.

 

Gracias por la ayuda y por tu tiempo.

Carlos 

4 Operator

 • 

2.7K Mensajes

2 de julio de 2020 00:00

Hola de nuevo @CTeruel,

 

¡Eso son muy buenas noticias! Genial que hayas exportar el log. No obstante, como la máquina está fuera de garantía para que yo pudiera analizar el log tendría que facturarte un ticket coterminous para recibir soporte. Dime si esto os interesa y me pongo en contacto via email.

 

En paralelo, con el mismo método que has empleado para actualizar la iDRAC deberíamos actualizar en prioridad el firmware de la BIOS (recuerda hacerlo escalonadamente). Esta es la última versión 2.9.0, pero abajo del todo en "Version" puedes ver todas las versiones disponibles:
2.9.0

 

Un saludo.

9 Mensajes

2 de julio de 2020 02:00

bueno dias @DiegoLopez 

 

Por favor, ponte en contacto conmigo por mail para que me pases las tarifas del ticket. Esto ya lo tengo que escalar para que me lo acepten.

 

Gracias.

 

4 Operator

 • 

2.7K Mensajes

2 de julio de 2020 02:00

Hecho! Seguimos en contacto por email.

 

Un saludo.

9 Mensajes

21 de julio de 2020 12:00

Hola de nuevo, @DiegoLopez 

 

Por favor ponte en contacto conmigo para reabrir el ticket.

Gracias!

4 Operator

 • 

2.7K Mensajes

22 de julio de 2020 06:00

Recibido Carlos, te escribo lo antes posible.

 

Un saludo.

9 Mensajes

30 de septiembre de 2020 02:00

Hola Diego.

 

Te he enviado un mail sobre este caso. Puedes ponerte en contacto conmigo, por favor?

Saludos

Carlos

 

4 Operator

 • 

2.7K Mensajes

30 de septiembre de 2020 08:00

Ok Carlos, lo he recibido, me pongo en contacto contigo via email.

 

Un saludo.

¡No se encontraron eventos!

Top