No resuelto

12 Mensajes

1221

21 de julio de 2020 08:00

Servidor PowerEdge R630 Fallo tarjeta de red constantemente

Buenas tardes,

Soy Adrián Pla, técnico de sistemas de JuanyJuan S.L.U. Tenemos un problema en un servidor PowerEdge R630.

El problema es que nos sale constantemente “Perdida de conectividad de red” cada 2 por 3.

Según he investigado la conectividad de red nos falla siempre en los adaptadores de red NIC4 y NIC5, los cuales están en la misma tarjeta de red. Aparece como inactivo durante 30s o 1 min y vuelve a activarse. Estas pérdidas de señal van alternandose entre los NIC4 y NIC5 todo el rato,a veces caen las dos, hasta que llega a un punto en que llega a bloquearse el puerto de switch con el error “linkflapE”. Hay días en que en todo el día pasa una o dos veces, pero la mayoria de días pasa cada 5min, entrando al vcenter y esperando 5min se pueden ver perfectamente estas pérdidas de red. Esto nos pasa desde hace 2 semanas.

 

Actuaciones que se han hecho:

-Se han cambiado los cables de red.

-Se han cambiado las interfaces del Cisco Nexxus a las que iban conectados.

Y seguimos teniendo el problema. Puede ser que sea la tarjeta de red?Ya que los dos adaptadores están en la misma tarjeta. O puede ser algún problema de configuración? (no se ha hecho ningún cambio de configuración recientemente)

La tarjeta doble de red es esta:

Adaptador Broadcom Corporation QLogic 57810 10 Gigabit Ethernet Adapter
Nombre vmnic5
Ubicación PCI 0000:03:00.1
Controlador qfle3

 

Espero vuestra respuesta.

Muchas gracias,

Un saludo,

Adrián

4 Operator

 • 

2.7K Mensajes

22 de julio de 2020 06:00

Hola @adri,


¡Gracias por la detallada explicación! ¡Así da gusto!


A ver, desde el punto de vista hardware hay varias cosas que podemos comprobar antes de pensar en reemplazar la tarjeta. Lo primero, tenemos que meternos de lleno con la versión de firmware / driver en base a la HCL de VMware.

 

No sé que versión de ESXi tienes, pero puedes comenzar rellenando la tabla de VMware con los datos que dispongas. Si lo introduces correctamente, vas a poder ver qué versión firmware y que driver tienes que tener instalado. Asegúrate de tener exactamente lo mismo que te recomiende la tabla.


Luego, el servidor es una generación 13. ¿Tienes acceso a la iDRAC? Si tienes iDRAC puedes ver el log de hardware del sistema. Si no, F10 en el arranque y llegarás al Lifecycle Controller. Desde aquí puedes ver también el log de hardware (Lifecycle Log). El objetivo aquí es buscar cualquier evento de hardware de error que apunte a las tarjetas de red.


Dime si esto te sirve de ayuda.


Gracias y un saludo.

12 Mensajes

23 de julio de 2020 03:00

Buenos días Diego,

 

He escrito el modelo de tarjeta de red y si que veo que coinciden con el sistema y los drivers instalados.

Datos recomendables:

-QLogic 57810 10 Gigabit Ethernet Multi Function Adapter 

-DID: 16ae

-VID: 14e14

-Marca: Qlogic

-SSID: 0000

-SVID: 0000

-Driver para ESXI 6.7 U3:     qfle3 version 1.0.50.11-9vmw

Este es mi ESXI:

-Hipervisor: VMware ESXI, 6.7.0, 14320388

-Modelo: PowerEdge R630

-Tipo de procesador: Intel(R) Xeon(R) CPU E5-2650 v3 @2.30Ghz

-Driver qfle3 Native QLogic E3 network driver for VMware ESXi 1.0.50.11-9vmw.670.0.0.8169922

-Driver qfle3f QLogic E3 Native FC driver 1.0.25.0.2-14vmw.670.0.0.8169922
-Driver qfle3i Qlogic E3 iSCSI Native Driver 1.0.2.3.9-3vmw.670.0.0.8169922

La versión del controlador qfle3 veo que tengo la misma que la recomendada, la 1.0.50.11-9vmw

Voy a ver si puedo ver el log de hardware de sistema y te comento también.

Gracias,

Un saludo,

Adrián

12 Mensajes

23 de julio de 2020 05:00

Buenas tardes Diego,

He entrado a la idrac , al Lifecycle Controller y si que veo como fallan las interfaces. Te copio el mensaje de los 2 errores que se repiten constantemente. 

1:

NIC100: The NIC Slot 2 Port 1 network link is down.
2020-07-23T14:08:13+0200
Número de secuencia del registro: 986
Descripción detallada:
The network link is down. Either the network cable is not connected or the network device is not working.
Acción recomendada:
Verify that the network port is enabled and if the port has Activity/Speed LEDs, that they are lit. Check the network cable, network cable connections, and the attached network switch.
Comentario: root

2-

NIC101: The NIC Slot 2 Port 1 network link is started.
2020-07-23T14:08:29+0200
Número de secuencia del registro: 987
Descripción detallada:
The transition from network link not started (down) to network link started (up) has been detected on the NIC controller port identified in the message.
Acción recomendada:
No response action is required.
Comentario: root

3-

NIC100: The NIC Slot 2 Port 2 network link is down.
2020-07-21T22:58:06+0200
Número de secuencia del registro: 983
Descripción detallada:
The network link is down. Either the network cable is not connected or the network device is not working.
Acción recomendada:
Verify that the network port is enabled and if the port has Activity/Speed LEDs, that they are lit. Check the network cable, network cable connections, and the attached network switch.
Comentario: root

4-

NIC101: The NIC Slot 2 Port 2 network link is started.
2020-07-23T11:24:13+0200
Número de secuencia del registro: 985
Descripción detallada:
The transition from network link not started (down) to network link started (up) has been detected on the NIC controller port identified in the message.
Acción recomendada:
No response action is required.
Comentario: root

Que me recomiendas que haga? cambio la tarjeta de red?

Gracias,

Un saludo,

Adrián

4 Operator

 • 

2.7K Mensajes

23 de julio de 2020 07:00

Hola @adri,


Lo siento, no me cuadra tu primer mensaje. En el texto que me has escrito, no me queda claro.. tienes ESXi 6.7 o ESXi 6.7 U3? Porque no es lo mismo. Además, SSID 0000 y SVID 0000? No me cuadra.. De hecho lo que me escribes es el primer resultado de Google al buscar: "QLogic 57810 10 Gigabit Ethernet Multi Function". Yo creo que esa no es tu tarjeta, es genérica.


Cuando usas la matriz de HCL tiene que darte una versión de driver y una de firmware. Pero no consigo ver en tu mensaje el firmware asociado al driver que comentas. Ambas cosas: firmware y driver tienen que estar al nivel recomendado por la HCL.


Por favor, mira este artículo de la KB de VMware: Determining Network/Storage firmware and driver version in ESXi 4.x and later (1027206)


El punto 4 es el que explica como usar el comando vmkchdev para sacar el VID, DID, SVID y SDID. Si tras sacar el output de este comando sigue siendo SSID 0000 y SVID 0000 soy yo el que se está equivocando pero si no... hay que volver a la HCL y meter bien estos datos.


Respecto al segundo mensaje: Ok, a los errores de hardware. Entonces, primero combrobar qué firmware es el bueno y si confirmamos que estamos en la buena versión, sólo queda reemplazarla.


Un saludo.

12 Mensajes

23 de julio de 2020 08:00

Hola
Es verdad,disculpa, no tengo mucha práctica. Es verdad, los valores de VID DID SVID y SDID no eran correctos, los correctos son estos (Los nics que fallan son el 4 y el 5):


[root@vesxi2:~] for a in $(esxcfg-nics -l |awk '{print $1}' |grep [0-9]) ;do vmkchdev -l |grep $a ;done
0000:01:00.0 14e4:168a 1028:1f5c vmkernel vmnic0
0000:01:00.1 14e4:168a 1028:1f5c vmkernel vmnic1
0000:01:00.2 14e4:168a 1028:1f67 vmkernel vmnic2
0000:01:00.3 14e4:168a 1028:1f67 vmkernel vmnic3
0000:03:00.0 14e4:168e 14e4:1008 vmkernel vmnic4
0000:03:00.1 14e4:168e 14e4:1008 vmkernel vmnic5
VID = 14e4 DID = 168e SVID = 14e4 SDID = 1008


[root@vesxi2:~] vmkchdev -l |grep vmhba1
0000:00:11.4 8086:8d62 1028:0601 vmkernel vmhba1
VID = 8086 DID = 8d62 SVID = 1028 SDID = 0601


La versión de firmware si no me equivoco es:
[root@vesxi2:~] vmware -vl
VMware ESXi 6.7.0 build-14320388
VMware ESXi 6.7.0 Update 3


Te paso también estos comandos:


[root@vesxi2:~] vmkload_mod -s mptspi |grep Version
Version: Version 4.23.01.00-10vmw, Build: 8169922, Interface: 9.2 Built on: Apr 3 2018


[root@vesxi2:~] esxcfg-nics -l
Name PCI Driver Link Speed Duplex MAC Address MTU Description
vmnic0 0000:01:00.0 qfle3 Up 10000Mbps Full 44:a8:42:16:86:35 1500 Broadcom Corporation QLogic 57800 10 Gigabit Ethernet Adapter
vmnic1 0000:01:00.1 qfle3 Up 10000Mbps Full 44:a8:42:16:86:37 9000 Broadcom Corporation QLogic 57800 10 Gigabit Ethernet Adapter
vmnic2 0000:01:00.2 qfle3 Up 1000Mbps Full 44:a8:42:16:86:39 1500 Broadcom Corporation QLogic 57800 1 Gigabit Ethernet Adapter
vmnic3 0000:01:00.3 qfle3 Up 1000Mbps Full 44:a8:42:16:86:3b 1500 Broadcom Corporation QLogic 57800 1 Gigabit Ethernet Adapter
vmnic4 0000:03:00.0 qfle3 Up 10000Mbps Full 00:0e:1e:89:ad:60 1500 Broadcom Corporation QLogic 57810 10 Gigabit Ethernet Adapter
vmnic5 0000:03:00.1 qfle3 Up 10000Mbps Full 00:0e:1e:89:ad:62 9000 Broadcom Corporation QLogic 57810 10 Gigabit Ethernet Adapter


Espero que esto te sirva.
Gracias,
Un saludo,
Adrián

12 Mensajes

23 de julio de 2020 08:00

Hola @DiegoLopez ,

Ah vale, pensaba que no lo recibías al no verlos en el foro. 

Vale perfecto, ya tengo descargado el firmware, pero no me funciona tu ultima instrucción.

[root@vesxi2:~] ethtool -i vmnic4
Can not get control fd: No such file or directory

He encontrado este comando y veo que tengo la versión 7.13.3.0, puede ser?

[root@vesxi2:~] esxcli network nic get -n vmnic4
Advertised Auto Negotiation: true
Advertised Link Modes: Auto, 100BaseT/Half, 100BaseT/Full, 1000BaseT/Full, 10000BaseT/Full
Auto Negotiation: true
Cable Type: Twisted Pair
Current Message Level: 4096
Driver Info:
Bus Info: 0000:03:00:0
Driver: qfle3
Firmware Version: FW: 7.13.3.0 BC: 7.13.54
Version: 1.0.50.11
Link Detected: true
Link Status: Up
Name: vmnic4
PHYAddress: 0
Pause Autonegotiate: true
Pause RX: true
Pause TX: true
Supported Ports: TP
Supports Auto Negotiation: true
Supports Pause: true
Supports Wakeon: true
Transceiver: internal
Virtual Address: 00:50:56:5d:87:f0
Wakeon: MagicPacket(tm)

Puedes facilitarme los comandos para instalar esta versión, así me aseguro de no introducir otros comandos? tengo en cuenta que hay que reiniciar el ESXI, mañana moveré las máquinas virtuales.

Gracias,

Un saludo,

Adrián

4 Operator

 • 

2.7K Mensajes

23 de julio de 2020 08:00

Vale @adri, no sé por qué tus mensajes no se están publicando..

 

Pero sí he rebido la notificación con el texto. Estaba respondiendo a tu primer mensaje porque había visto que habías lanzado el vmkchdev apuntando a la hba en vez de a la NIC. En este último mensaje tuyo ya veo el output de los nic4 o nic5.

 

0000:03:00.0 14e4:168e 14e4:1008 vmkernel vmnic4
0000:03:00.1 14e4:168e 14e4:1008 vmkernel vmnic5

 

VID = 14e4  DID = 168e   SVID = 14e4  SDID = 1008

 

Salen 3 resultados en función del interfaz: Network, iSCSI y FCoE CNAs.

 

En todos los casos el firmware es:
FFV 14.07.06/7.14.xx 

 

Este es el enlace de descarga:

Version 14.07.06, A00-00

Directo.BIN

 

 

Para ver el firmware que tienes:

ethtool -i vmnic4

 

Si tienes problemas para que tus mensajes se publiquen, seguimos

por mensaje privado.

 

Un saludo.

12 Mensajes

23 de julio de 2020 08:00

Hola Diego

Es verdad,disculpa, no tengo mucha práctica. Es verdad, los valores de VID DID SVID y SDID no eran correctos, los correctos son estos (Los nics que fallan son el 4 y el 5):

[root@vesxi2:~] for a in $(esxcfg-nics -l |awk '{print $1}' |grep [0-9]) ;do vmkchdev -l |grep $a ;done
0000:01:00.0 14e4:168a 1028:1f5c vmkernel vmnic0
0000:01:00.1 14e4:168a 1028:1f5c vmkernel vmnic1
0000:01:00.2 14e4:168a 1028:1f67 vmkernel vmnic2
0000:01:00.3 14e4:168a 1028:1f67 vmkernel vmnic3
0000:03:00.0 14e4:168e 14e4:1008 vmkernel vmnic4
0000:03:00.1 14e4:168e 14e4:1008 vmkernel vmnic5

VID = 14e4  DID = 168e   SVID = 14e4  SDID = 1008

[root@vesxi2:~] vmkchdev -l |grep vmhba1
0000:00:11.4 8086:8d62 1028:0601 vmkernel vmhba1
VID = 8086  DID = 8d62   SVID = 1028  SDID = 0601

La versión de firmware si no me equivoco es:

[root@vesxi2:~] vmware -vl
VMware ESXi 6.7.0 build-14320388
VMware ESXi 6.7.0 Update 3

Te paso también estos comandos:

[root@vesxi2:~] vmkload_mod -s mptspi |grep Version
Version: Version 4.23.01.00-10vmw, Build: 8169922, Interface: 9.2 Built on: Apr 3 2018

[root@vesxi2:~] esxcfg-nics -l
Name PCI Driver Link Speed Duplex MAC Address MTU Description
vmnic0 0000:01:00.0 qfle3 Up 10000Mbps Full 44:a8:42:16:86:35 1500 Broadcom Corporation QLogic 57800 10 Gigabit Ethernet Adapter
vmnic1 0000:01:00.1 qfle3 Up 10000Mbps Full 44:a8:42:16:86:37 9000 Broadcom Corporation QLogic 57800 10 Gigabit Ethernet Adapter
vmnic2 0000:01:00.2 qfle3 Up 1000Mbps Full 44:a8:42:16:86:39 1500 Broadcom Corporation QLogic 57800 1 Gigabit Ethernet Adapter
vmnic3 0000:01:00.3 qfle3 Up 1000Mbps Full 44:a8:42:16:86:3b 1500 Broadcom Corporation QLogic 57800 1 Gigabit Ethernet Adapter
vmnic4 0000:03:00.0 qfle3 Up 10000Mbps Full 00:0e:1e:89:ad:60 1500 Broadcom Corporation QLogic 57810 10 Gigabit Ethernet Adapter
vmnic5 0000:03:00.1 qfle3 Up 10000Mbps Full 00:0e:1e:89:ad:62 9000 Broadcom Corporation QLogic 57810 10 Gigabit Ethernet Adapter

Espero que esto te sirva.

Gracias,

Un saludo,

Adrián

 

4 Operator

 • 

2.7K Mensajes

24 de julio de 2020 02:00

Hola de nuevo @adri


El comando para instalar el firmware es:

esxcli software vib install -v /tmp/xxxxxxxxxxxxxxxx.xxx

 

Sí, confirmo que tendrás que reiniciar para que se apliquen los cambios.

Esta es el articulo de la OKB que explica la instalación de VIB en ESXi.

 

Y este el fichero que puedes instalar Version 14.07.06, A00-00 

Directo.BIN

 

Si tras la actualización de firmware el problema persiste, sólo queda reemplazar la tarjeta.


Un saludo.

12 Mensajes

24 de julio de 2020 03:00

Hola @DiegoLopez 

Intento instalar pero la extensión que bajo de internet es la ".BIN" y no ".VIB", por tanto me da error siempre en la cabezera. Hay algo que se me escapa que deba hacer de más ?

[root@vesxi2:/vmfs/volumes/5a451eb0-b6849b4d-347f-000e1e89ad60/Firmware_Red] esxcli software vib install -v Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN
[VibDownloadError]
('Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN', '/tmp/vib_3t0hzb82', "unknown url type: 'Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN'")
url = Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN
Please refer to the log file for more details.
[root@vesxi2:/vmfs/volumes/5a451eb0-b6849b4d-347f-000e1e89ad60/Firmware_Red] esxcli software vib install -v /tmp/Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN
[VibDownloadError]
('/tmp/Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN', 'Bad VIB archive header')
url = /tmp/Network_Firmware_7H96X_LN_14.07.06_A00-00_01.BIN
Please refer to the log file for more details.
[root@vesxi2:/vmfs/volumes/5a451eb0-b6849b4d-347f-000e1e89ad60/Firmware_Red]

 

Gracias,

Un saludo,

Adrián

4 Operator

 • 

2.7K Mensajes

24 de julio de 2020 03:00

Ya veo.. a decir verdad, creo que es error mío, ese comando es para la actualziación del driver.

 

Para la actualziación del firmware puedes usar la iDRAC o el LifeCycle Controller. En ambos casos es muy fácil actualizar el firmware, pero necesitarás descargar el .exe

 

Este artículo explica cómo actualizar un firmware desde la iDRAC: Dell PowerEdge: cómo actualizar de manera remota el firmware de los componentes de un solo sistema mediante iDRAC

 

Este video explica cómo actualizar desde un CD/DVD o USB desde Lifecycle Controller: Dell Lifecycle Controller - Firmware Update Using Local Drive (CD or DVD or USB)

 

En ambos casos te pedirá reiniciar el servidor.

 

Espero que esto te sirva.

Un saludo.

12 Mensajes

24 de julio de 2020 07:00

Hola @DiegoLopez ,

 

Ya he conseguido actualizar el driver a la versión 14.07.06 y después de reiniciar y comprobar que estaba bien instalado y esta el driver en uso veo que continua fallando.

Ahora ya si que debo cambiar la tarjeta, compro la misma o tenéis alguna recomendación de algún modelo?

Gracias por toda la ayuda,

Un saludo,

Adrián

12 Mensajes

26 de julio de 2020 23:00

Buenos días @DiegoLopez , 

El sábado dejó de funcionar la tarjeta, podéis enviarme presupuesto de una tarjeta y decirme el plazo de entrega de la tarjeta?

O la compro a mi suministrador habitual?

Gracias,

Un saludo,

Adrián

Moderator

 • 

2.9K Mensajes

27 de julio de 2020 02:00

Hola Adrian,
perdón por escuchar eso, Si la garantía del servidor no continúa, puedo recomendarles que compren de la misma tarjeta.

Saludos cordiales

 

12 Mensajes

27 de julio de 2020 04:00

Hola @DiegoLopez ,

 

Okey, de acuerdo, no lo tenemos en garantía, compraremos la misma, gracias por todo el soporte y la ayuda ofrecida igualmente.

Un saludo,

Adrián

¡No se encontraron eventos!

Top