Comenzar una conversación nueva

Solved!

Ir a la solución

2526

3 de junio de 2019 11:00

Idrac Booting ... hasta el infinito

Hola a todos. Recurro aqui despues de decenas de horas de intentar de todo, y sé, que seguro es la mayor tonteria para solucionarlo, pero no doy con ella.

 

Dos m1000e

1- Con 8 Blades M620, doble cmc, con fw 6.2. Enciendo el enclosure, todo ok, y desde el gui web puede encender los 8 blades, todo perfecto.

2- El segundo m1000e lo tengo con 16 blades m710hd, bien, enciendo el enclosure, obtengo la ip del cmc, y puedo acceder a configuracion, pero los blades se quedan SIEMPRE en idrac booting, por lo que NO puedo encender ninguno de los servidores. 

Pruebas que he realizado:

1- Si cojo un blade m710hd y lo meto en el enclosure donde estan los m620, enciende perfectamente, y se le asigna ip al idrac, todo genial. por lo que descarto problemas de los idracs de los m720hd.

2- He copiado tal cual, toda la configuracion del idrac del enclosure m620 al enclosure donde estan los m710hd, tanto en quickdeploy, como sin accion, como perfiles.. nada, peeero, al intentar guardar la configuracion me da un error= 12 , adjunto captura de pantalla y configuracion por lo que no me deja activar LAN para los idrac, siempre me da error=12...

3- Los fw de ambos cmc son 6.2, en ambos enclosures.

 

algo se me escapa.. pero ya no se que es.

 

error al guardar esa configuracion copiada a los 16 slots:

Error12.PNG

 

 

Finalmente, como tengo todos los slots.. no me deja hacer otra cosa:
No deja activar lan.PNGAqui va el error que me da al intentar encender un blade, me dice que el idrac no esta listo y consulte el registro, pero el registro no dice nada... 

 

idrac no listo.PNGGracias !!

8 Mensajes

5 de junio de 2019 03:00

Hola Diego! 

Nada, no podia acceder, se quedaba en Idrac booting en el lcd y jamas obtenia ip, ni por dhcp ni fija, ambas configuraciones, varios resets, incluso por racadm resetcfg, tanto servers como blades. Tambien les hice virtual reset a los blades sin exito.

Peeeeero, esta mañana, encontré en:

https://www.dell.com/community/PowerEdge-Hardware-General/trouble-initializing-blades-on-m1000e/td-p/4132371

A tu compañero: DELL-Chris

que dijo:

"""If not you need to start with getting it current. From there we powered the enclosure and blades down. Unseat all the blades a couple inches, so nothing is connected, but still in their slots for safe keeping. Remove enclosure power cord and hold power button for 20 seconds. After that reconnect power cables to enclosure and power it up, with the Blades still out. Let the enclosure completely finish starting up and then insert the blades. 

Let us know how it goes."""

 

Y, antes de tener que salir a otro sitio, es lo que me ha dado tiempo a hacer.

1- Encender chasis desde 0, con un reset cmc, pero con todos los blades desconectados.

2- Una vez encendido el chasis conecté un blade, 1 solo... y idrac booting, idrac provisioning, y zas... le dio ip , y pude arrancar el servidor, y acceder al idrac perfectamente.

Me queda hacerlo con el resto, haber si acaban funcionando, me tuve que marchar. Pero ver el puntito azul de 1 blade server encendido en ese chasis concreto ya es mucho...

Parece (por pensar) que darle las 16 ips a la vez, o hacer el booting de todos los idracs a la vez como que no le gusta y se acaba bloqueando.. si lo hago de 1 en 1 , o de pocos en pocos parece que quizas pueda tirar. De cualquier forma lo acabo de confirmar esta tarde.

Muchas gracias Diego y no dudes que haré resumen si acabo haciéndolo funcionar. Sigo aprendiendo..

 

Seguimos !! 👍👍

 

 

 

 

8 Mensajes

4 de junio de 2019 06:00

Hola Diego!!

 

Gracias por tu post !!! 

Perfecto, ojalá sea asi, lo probaré en unas horas que llego. Ayer le dediqué otras 4horas despues de mi post... sin resultado satisfactorio.

Tanto si funciona como si no, no dudes que lo comparto!

 

Olé Diego !

4 Operator

 • 

2.7K Mensajes

4 de junio de 2019 06:00

Hola @Repedro !

¡Bienvenido a la Comunidad Dell!

El problema que comentas se soluciona a partir de la versión de Firmware 6.10 de la CMC del M1000e:

- Fixed an issue causing all the blades in the chassis to be in a 'not ready' state or 'iDRACs remain offline' during chassis power cycle.

Actualización: https://www.dell.com/support/home/us/en/04/Drivers/DriversDetails?driverId=77KXG&osCode=wnet&productCode=poweredge-m1000e

Como me comentas en tu mensaje, ya tenéis la versión 6.2, así que el fix ya está instalado. Lo que tenéis que intentar ahora es hacer un failover de la CMC: Id a "Troubleshooting", luego "Reset Components", luego "Reset/Failover CMC" y luego "Ok". Esto reiniciará la CMC con lo que estará inaccesible durante unos minutos. Un ping -t te indicará cuando volver a intentar conectar.

Por favor, no olvides decirnos si este procedimiento soluciona tu problema.

Un saludo.

4 Operator

 • 

2.7K Mensajes

4 de junio de 2019 06:00

Para eso estamos!! A ver si hay suerte, si no lo consigues con este procedimiento, probamos algunas alternativas..!

Aprovecho para adjuntar una foto que se me olvidó en el anterior mensaje:

CMC.PNG

8 Mensajes

4 de junio de 2019 09:00

Gracias Diego...

Pues nada.. no lo he conseguido.

adjunto video.. 

el password es 

dell

https://www.loom.com/share/ac1e8d430edd4db29e1f3bb582cc76c3

4 Operator

 • 

2.7K Mensajes

5 de junio de 2019 03:00

Bravo!! Qué buena esa @Repedro! :Yes:

Sí, esta tarea que comenta el compañero es un "Drain Flea Power" y, ciertamente, es mano de santo en muchas ocasiones.

Voy a marcar tu mensaje como solución por si algún compañero de la Comunidad se encuentra con el mismo problema.

Y, por supuesto, a la espera quedamos de saber si yendo poco a poco logras levantar los blades.

Muchas gracias por compartirlo con nosotros. Aquí tampoco dejamos de aprender cada día un poquito :Wink:

4 Operator

 • 

2.7K Mensajes

5 de junio de 2019 03:00

Hola de nuevo @Repedro!

Gracias por el video! Veo que la operación de Failover parece que se hizo bien y que los servidores pasaron del estado "Inicializando" a "Listo". De hecho, me da la impresión de que el problema ahora es otro: parece que los blades no arrancan desde el CMC. ¿Podrías confirmarme el estado de las máquinas en el menú "Troubleshooting" / "Reset Components"? Confírmame este punto y si la respuesta es afirmativa, sigue leyendo:

Si las máquinas ya no están en "Iniciando" y sí en "Listo" puedes probar a acceder a ellas a través de la iDRAC de las propias máquinas. Es decir, en vez de la CMC general que controla todo el chásis, ir a la iDRAC de uno de los servidores.

Desde la iDRAC puedes visualizar el estado de la máquina en cuestión, ver si tiene mensaje de error, comprobar su Firmware (todo esto deberías poder hacerlo). Y, por último, puedes intentar arrancar la máquina desde la CMC con la consola remota (visualizando todo lo que se ve en pantalla). ¿Puedes probar todo esto y decirme si estas operaciones funcionan con normalidad?

Si ninguna de las opciones mencionadas te ha servido, vamos a probar con el "Virtual Reset" de los blades, que sería como darles un botonazo físico. Te explico cómo hacerlo en el punto 4 de este manual: Resetting Components

Un saludo.

8 Mensajes

6 de junio de 2019 16:00

Bien, prueba final y resuelto.

 

Como indiqué en el ultimo post, al hacer de uno en uno, se asignaban ips al idrac y me permitia encender el servidor blade, hasta que al meter el del slot 9 se quedaron todos los servidores pillados.. 

te pillé ! eres tu , el 9 !

Por lo tanto, acabé de comprobarlo, si enciendo el chasis con todos menos el 9, todo enciende perfectamente.

si enciendo el chasis con algunos en los que incluya el 9, no enciende ninguno.

Si cambio el 9 a otro slot, tampoco funciona, por tanto no es problema del backplane del chasis. SI pongo cualquier otro en el slot del 9, si que enciende.

Por lo que 15 servidores buenos, y 1 malo, Y el backplane está ok.

siguientes pruebas..

tomo la idrac de otro blade, y se lo pongo a ese blade que da problemas, y sigue dando problemas.. por lo que descartando que sea el idrac.. ahora seguiré probando pieza a pieza hasta saber cual es la que da la lata para acabar tirando el sistema completo. Memorias, mezzazines.. daré con ello.

 

Lo que si, que he aprendido mogollon, y ahora ya me meteré con el Dell EMC Repository Manager que me parece una pasada lo util que es (cuando consiga crear la primera iso con todas las actualizaciones y meterlas por red a los blades.. creo que es así. no?) porque para las pruebas del bloque del chasis me he visto actualizacion bios de los blades 1 a 1 con un usb... como hace 20 años.. con las pedazos de herramientas que tiene Dell para hacer todo esto mucho mas facil.

 

Gracias Diego y gracias a todos !

Seguimos !

 

4 Operator

 • 

2.7K Mensajes

11 de junio de 2019 01:00

Hola de nuevo @Repedro 

Lo has hecho genial. Todo un ejemplo de cómo hacer un auto-diagnóstico: paciencia, prueba-error y ganas de aprender. Ojalá todo el mundo se enfrentara a los problemas de hardware de la misma manera.

Respecto a la pieza que quizás es la que da el problema.. yo apostaría por la propia placa base. Un M710HD es relativamente sencillo a nivel hardware. Y la pieza que podría fallar de esta forma es principalmente la placa base. Normalmente: cpu, memoria o tarjetas red.. fallan de otra manera. Si necesitas presupuesto de la pieza, avísame, desde Dell podemos ofrecértelo.

Respecto a Dell EMC Repository Manager... si lo que quieres es crear una ISO con todas las actualizaciones para cargarlas como medio virtual desde la iDRAC... ten en cuenta que esto ya está hecho para la generación 12 y posteriores. Las hemos creado nosotros y subido para que podáis descargarlas: Actualice los servidores PowerEdge con una ISO de arranque específica de la plataforma (busca los MXXX)

Para generación 11, sí tienes que crearla tú mismo. Te dejo este artículo sobre el tema: Dell EMC Repository Manager (DRM): guía y descarga.

Un saludo!

¡No se encontraron eventos!

Top