PowerVault ME5: El conteo de errores de PHY del enlace de host supera el umbral de error
Summary: Los operadores de PowerVault ME5 pueden observar mensajes ocasionales de conteo de errores PHY del enlace de host del evento 663 en el registro del historial de eventos cuando se utilizan los puertos de front-end de la controladora SAS o Fibre Channel conectados a hosts o switches. Este evento se introdujo en la versión ME5.1.2.1.0 y superior de firmware ME5. ...
Instructions
Según la configuración del módulo de la controladora de PowerVault serie ME5, vaya a la sección correspondiente en este artículo.
- Módulos de la controladora que utilizan puertos de front-end de Fibre Channel (FC)
- Módulos de la controladora que utilizan puertos de front-end de Serial Attached SCSI (SAS)
Controladoras que utilizan puertos de front-end de Fibre Channel (FC)
Es posible que los operadores de arreglos PowerVault serie ME5 con módulos de la controladora conectados mediante transceptores SFP de Fibre Channel (FC) deban realizar acciones correctivas para resolver este síntoma. A menudo, no afecta el procesamiento de I/O. Sin embargo, el mensaje es una indicación temprana de un problema de configuración, un posible problema de hardware o de conexión con el transceptor SFP o el cable de fibra óptica.
En la mayoría de los casos, se resuelve fácil limpiando correctamente la cara del extremo del conector LC en el cable de fibra óptica para eliminar el polvo u otros contaminantes que impiden la refracción de la luz. Para obtener instrucciones sobre cómo inspeccionar y limpiar la cara del extremo del conector de los cables de fibra óptica, siga las instrucciones de este artículo de la base de conocimientos: Los contaminantes, como el polvo, en la cara del extremo del conector de fibra óptica, causan un rendimiento de I/O deficiente
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
Las versiones de firmware ME5.1.2.1.0 y posteriores del arreglo PowerVault ME5 monitorean la métrica del Conteo de palabras de transmisión no válidas de los puertos FC. Este valor del contador significa que una palabra no se transmitió correctamente, lo que resultó en errores de codificación. Este valor de los contadores no se muestra en PowerVault Manager ni en CLI; sin embargo, se registra en el registro de depuración de cada controladora de almacenamiento (SC). Los registros de depuración de la controladora de SC se recopilan dentro del paquete de soporte de PowerVault ME. Consulte PowerVault ME5: Cómo recolectar registros de soporte de PowerVault
Si este mensaje de ERROR se observa con frecuencia, los operadores pueden realizar las siguientes acciones:
-
Inspeccione la instalación del cable de fibra óptica, limpie correctamente la cara del extremo del conector del cable de fibra óptica y monitoree los registros del historial de eventos para detectar instancias repetidas del evento 663. Consulte Los contaminantes, como el polvo, en la cara del extremo del conector de fibra óptica, causan un rendimiento de I/O deficiente
-
Si limpiar los conectores del cable de fibra óptica no resuelve el problema, reemplácelos por un transceptor y un cable de fibra óptica en buen estado. Asegúrese de que las piezas no estén dañadas y que se manipulen correctamente.
-
Si reemplazar los transceptores no resuelve el síntoma, los operadores deben utilizar transceptores validados como se indica en la Matriz de soporte del sistema de almacenamiento de PowerVault serie ME5 de Dell; de lo contrario, comuníquese con su proveedor para obtener soporte.
-
En pocas ocasiones, es posible que los operadores que utilizan switches FC de 8 Gb de una generación anterior deban ajustar la configuración portCfgFillword del switch. Consulte la sección Información adicional a continuación.
Controladoras que utilizan puertos de front-end de Serial Attached SCSI (SAS)
Cada conexión de cable SAS de host a controladora forma un puerto de todo SAS que consta de más de un enlace físico (PHY). Cada PHY es un conjunto de cuatro cables que se utilizan como dos pares de señales diferenciales, lo que permite que los datos se transmitan en ambas direcciones simultáneamente.
Por lo general, no afecta el procesamiento de I/O, el evento se espera cuando se insertan cables SAS a medida que se forma el enlace SAS. En configuraciones de controladoras redundantes, el evento 663 se registra simultáneamente en ambas controladoras a medida que el servidor host conectado arranca y carga el controlador de SAS del sistema operativo del host. No es necesario que el operador realice ninguna otra acción.
Más consideraciones:
Cuando las controladoras PowerVault ME se conectan a un HBA355e SAS de Dell. Las conexiones del puerto de servidor host se pueden distribuir según el informe de PowerVault serie ME5, el puerto de host se degrada cuando se conecta a la controladora SAS HBA355e de Dell después de cambiar los puertos HBA SAS o los HBA SAS del servidor utilizados. Utilice PowerVault Manager para comprobar que el ID de WWN del iniciador de puerto esté asignado a los hosts y volúmenes correctos.
Asegúrese de que los cables SAS estén bien insertados tirando suavemente de cada extremo del cable SAS. Si el cable SAS se suelta del puerto, vuelva a colocarlo correctamente. Es posible que escuche un clic cuando el pestillo del conector esté asegurado. Si el conector del cable SAS no se puede asegurar correctamente, compruebe qué ranura PCI-e se está utilizando en el servidor host. La posición de la ranura del HBA SAS dentro del chasis puede obstruir la inserción del conector. Para obtener detalles, consulte modelos PowerEdge 16G: selección de la ranura PCI-e HBA355e
Registro del historial de eventos de muestra de PowerVault ME5 cuando se reinicia un host conectado a SAS. Ambas controladoras registran el evento y el último evento de la secuencia indica que el problema se resolvió.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Los operadores que utilizan switches Connectrix o Brocade FC de una generación anterior que admiten 8 Gb pueden configurar el ajuste de fillword con un portCfgFillword comando. Cuando se introdujeron los switches de 8 Gb, se adoptó ARBff en lugar de IDLE, principalmente porque podía contribuir a un error de bit menor. El IDLE que se utiliza para la iniciación también se cambió a ARBff, junto con el cambio de la fillword.
Es posible que los operadores de switches FC de generaciones anteriores que continúan utilizándolos en producción observen un aumento en el Conteo de palabras de transmisión no válidas y deben configurar el valor portcfgfillword para utilizar siempre ARBff. En un switch Brocade, esta es la salida de “portcfgfillword --help”.
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.