Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Switch Connectrix B-Series: Defectos FOS-849642 y FOS-847091: los directores y switches de 7.ª generación podrían encontrar una condición de falla que provoca errores crc, fallas de puertos o provoca un reinicio disruptivo

Summary: Directores y switches Gen 7 (X7-8, X7-4, 7730 y 7720) que ejecutan cualquier versión de Fabric OS (FOS) v9.1.x anterior a v9.1.1c o que se ejecuta en FOS v9.2.0 podría encontrarse con una condición de falla que provoca errores crc, fallas de puertos o un reinicio disruptivo en respuesta a la congestión grave y la activación del comportamiento de administración de sobresuscripción de la Función De optimización de tráfico Defectos FOS-849642 y FOS-847091 Estos dos defectos se corregirán en FOS v9.1.1c y v9.2.0a. A la espera de esta calificación, los clientes que se ven afectados pueden optar por implementar la solución alternativa. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Productos afectados
Brocade X7-8, X7-4, 7730 y 7720 que ejecutan FOS v9.1.x o FOS v9.2.0
corregidos en las versionesBrocade FOS v9.1.1c, v9.2.0a y versiones

superiores
Solo los productos Gen 7 están en riesgo.
Los directores de 7.ª generación (X7-8 y X7-4) con un blade de puerto FC64-48 o FC32-X7-48 instalado corren el riesgo de encontrarse con errores de desbordamiento y "verificación". Los blades de puertos FC32-64 y FC32-48 instalados en directores Gen 7 no corren el riesgo de encontrar ninguna falla.
Los switches Gen 7 (G730 y G720) solo están en riesgo de encontrarse con la falla de desbordamiento del búfer. Estos switches no están expuestos a ni están en riesgo de encontrar la condición de falla de error de "verificación".
Para estar aún más en riesgo, el fabric debe experimentar una congestión grave que da como resultado una administración de sobresuscripción por parte de Traffic
Optimizer. Si se encuentra este nivel de respuesta, se observará el siguiente mensaje RASlog:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Los flujos destinados al dispositivo dev02 se trasladaron a PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, línea: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
La acción de administración de sobresuscripción de Traffic Optimizer solo existe en el firmware de FOS v9.1.x. Los productos
Gen 7 que se ejecutan en FOS v9.0.x no están en riesgo para ninguna de las condiciones de falla.


Condiciones de riesgo de falla de desbordamiento del
búferPara que se produzca la condición de desbordamiento del búfer, además de requerir un período de congestión grave, los puertos F en el director o switch de 7.ª
generación también deben haberse configurado del valor predeterminado a una mayor cantidad de búferes. FOS
asignará como máximo 28 búferes de manera predeterminada.
Cualquier director o switch de 7.ª generación que haya aumentado sus conteos máximos de búferes de puerto F por encima de los valores predeterminados utilizados por
FOS puede estar en riesgo, y cualquier director X7-8 o X7-4 que ejecutaba FOS v9.0.x podría estar en riesgo de
encontrar errores de "verificación". En ambos casos, Traffic Optimizer también debe intentar administrar el enrutamiento de tramas en respuesta a
un evento de sobresuscripción causado durante un período de congestión grave.

Para determinar los directores y los switches que podrían estar en riesgo, utilice el comando "portbuffershow" para ver el
image.png
uso del búfer Si el total de todo el uso de búfer para los puertos en el mismo ASIC/chip que también están zonificados juntos agrega hasta un valor mayor que 256 búferes, se considera que el switch Gen 7 está en riesgo de encontrarse con un exceso de búfer en caso de que un evento de congestión grave requiera una administración de sobresuscripción de Traffic Optimizer. La falla no se detectará en cada evento de administración de sobresuscripción, ya que la cantidad de búferes que se administran en el momento del evento debe superar los 256 mientras Traffic Optimizer administra la sobresuscripción, pero la configuración para manejar potencialmente más de 256 búferes pondrá al switch en riesgo.
En la salida de ejemplo que se mostró anteriormente, si los 8 puertos F están en una zona juntas, el switch está en riesgo de encontrarse con un desbordamiento del búfer de trama
mientras Traffic Optimizer administra una condición de sobresuscripción, ya que el conteo de uso del búfer total en este ejemplo es 360.
Sin embargo, en el siguiente ejemplo, donde los puertos F no están todos zonificados juntos, este switch no estaría en riesgo, ya que las dos zonas (que se muestran en verde) suenen hasta 232 búferes y 128 búferes, respectivamente.
image.png
La cantidad máxima de puertos utilizados para la administración de sobresuscripción es de 8 puertos. Si hay más de 8 puertos zonificados juntos desde el mismo ASIC/chip, entonces suba el total de los 8 puertos con los valores de uso de búfer más altos para determinar el riesgo.

NOTA: Los directores y switches de 7.ª generación que nunca han cambiado sus conteos de búfer de puerto F de los predeterminados no están en riesgo de encontrarse con este problema de desbordamiento del búfer de trama. El valor máximo utilizado como ajuste predeterminado para los búferes máximos/reservados es 28 para los productos Gen 7; sin embargo, se podrían asignar menos búferes según el tipo de switch y la velocidad óptica. Los clientes
que nunca aumentaron sus conteos máximos/reservados de búfer de manera predeterminada no experimentarán el problema de desbordamiento
del búfer. Incluso con 8 puertos zonificados juntos, utilizando la asignación predeterminada máxima de 28 búferes por puerto, el valor total de uso máximo del
búfer es solo 224 tramas.

Condiciones
de riesgo de fallas "Verificación"Además del problema de desbordamiento del búfer, los directores X7-8 y X7-4 también podrían estar en riesgo de "verificar" los mensajes de error si se cumplen las siguientes condiciones en este orden:
  • Director X7-8 o X7-4 que se ejecutaba anteriormente en FOS v9.0.x
  • Luego, el director se actualiza a FOX v9.1.x
  • Luego, el director tiene puertos F que cierren sesión e inicien sesión en la versión v9.1.x
  • Luego, el director encuentra un evento de sobresuscripción que requiere administración de Traffic Optimizer
  • Luego, el director realiza una conmutación por error de alta disponibilidad (la actualización del firmware provoca una conmutación por error)
  • El director encuentra otro evento de sobresuscripción que requiere administración de Traffic Optimizer 
Los directores X7-8 o X7-4 que cumplen con todas estas condiciones, en la secuencia especificada, podrían estar en riesgo de encontrar errores de "verificación" durante la administración de sobresuscripción desde Traffic Optimizer.
  • Los directores X7-8 o X7-4 que solo se han ejecutado en el firmware de FOS v9.1.x no están en riesgo de encontrar el error de "verificación", ya que solo se utiliza el modelo de programación v9.1 para todos los puertos. Los directores de 7.ª generación deben haber estado ejecutando anteriormente con FOS v9.0.x para ser susceptibles a este problema.
  • Los directores X7-8 o X7-4 que se han iniciado/realizado un ciclo de apagado y encendido durante la ejecución en el firmware de FOS v9.1.x tampoco están en riesgo de encontrar el error de "verificación", ya que todos los puertos utilizarán la programación v9.1 después del reinicio

Síntomas
Los directores y switches de 7.ª generación que hayan encontrado un evento de administración de sobresuscripción observarán el siguiente
RASlog de Traffic Optimizer:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Los flujos destinados al dispositivo b1a02 se han transferido a PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, línea: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Los síntomas adicionales que podrían aparecer debido a estos problemas identificados podrían ser los siguientes:
  • Es posible que se observen grandes conteos de errores crc en un enlace que no se corrigen con el reemplazo de medios ópticos/cables
  • Las tramas se pueden descartar, se puede perder el crédito en un enlace
  • Es posible que los puertos estén defectuosos, ASIC puede detenerse y tener errores
  • Un director puede observar una conmutación por error inesperada de alta disponibilidad o incluso un reinicio en frío del director
  • Es posible que los switches observen un reinicio en frío

Cause

La administración de sobresuscripción mediante la función Optimizador de tráfico en condiciones específicas podría causar escenarios
de falla que afecten la transmisión de tramas o puertos que se administran. En escenarios de congestión grave, estas fallas también
podrían afectar el rendimiento de otros demonios de Fabric OS (FOS), activos en el switch, lo que genera tiempos de espera
de vigilancia de software, lo que genera una conmutación por error de alta disponibilidad o un estado de alarma del switch.

Los directores y conmutadores de 7.ª generación (X7-8, X7-4, 7730 y 7720) que encuentran un desbordamiento de búferes de trama mientras intentan
administrar y volver a enrutar flujos sobresuscritos en respuesta a un evento de congestión grave pueden causar errores inesperados. Si
la cantidad de tramas supera el búfer utilizado para administrar el manejo de sobresuscripción, se pueden
perder estas tramas en exceso durante el manejo de Traffic Optimizer. Es posible que otras tramas sobrescriban estos excesos de tramas, lo que provoca
errores crc de tramas o incluso fallas de puertos si se sobrescribe la información del encabezado. En escenarios de congestión grave, la administración de estos marcos de desbordamiento/exceso puede provocar el bloqueo de otros demonios de FOS, lo que puede provocar
tiempos de espera de vigilancia. Los demonios críticos que agotan el tiempo de espera causarán una conmutación por error de alta disponibilidad o un reinicio disruptivo del switch.

Además del posible manejo de desbordamiento de tramas, los directores X7-8 y X7-4 que anteriormente habían estado funcionando en FOS v9.0.x y luego se actualizaron a FOS v9.1.x podrían encontrar errores de verificación después de la conmutación por error de HA (incluidos los causados por las actualizaciones de firmware a versiones superiores de v9.1.x). Traffic Optimizer observará varios mensajes de error de "verificación" durante la administración de sobresuscripción debido a un conflicto detectado en la programación de puertos creados cuando algunos puertos, pero no todos los puertos, se restablecen mientras están en v9.1.x. El conflicto entre la programación de administración de la congestión en los puertos que nunca se restablecieron mientras en v9.0.x y posterior se encontró con la administración de la congestión, mientras que en v9.1.x en los puertos que se restablecieron puede aparecer después de un evento de conmutación por error de alta disponibilidad.

Resolution

Solución alternativa
" Los directores y switches en riesgo pueden deshabilitar la acción de administración de sobresuscripción de Traffic Optimizer.
Emita el siguiente comando de la CLI desde la cuenta de mantenimiento para deshabilitar el comportamiento de la acción de administración de sobresuscripción
dentro de Traffic Optimizer
maintenance> serviceexec trafopt mainframe --enableosclassification 0
NOTA: El comando de mantenimiento se debe ejecutar en todos los switches lógicos del chasis.
NOTA: La configuración será persistente en las conmutaciones por error y los ciclos

de alimentaciónAcción
correctiva Una solución de software proporcionada en FOS v9.1.1c y superior evitará estas fallas. Las mismas soluciones también se proporcionan
en FOS v9.2.0a y versiones superiores de FOS v9.2.x. La actualización a estas versiones de FOS evitará un exceso de
tramas debido a la administración de sobresuscripción y también evitará errores de "verificación" en los directores X7.

Para cualquier director o switch de 7.ª generación (X7-8, X7-4, 7730 y 7720) que aún ejecuta una versión de FOS v9.0.x y podría estar "en riesgo"
para encontrar los problemas descritos, se recomienda esperar el lanzamiento de FOS v9.1.1c antes de realizar la actualización.

Los directores y switches de 7.ª generación que actualmente operan en versiones v9.1.x o v9.2.0, y que están determinados a estar en riesgo,
deben implementar la solución alternativa. La desactivación de la acción de administración de sobresuscripción de Traffic Optimizer evitará
que se produzcan errores de sobresuscripción del búfer y de "verificación". Después de actualizar a v9.1.1c o v9.2.0a, la acción de administración de sobresuscripción
se puede volver a habilitar mediante el siguiente comando:
Emita el siguiente comando de la CLI desde la cuenta de mantenimiento para volver a habilitar el comportamiento de la acción de administración de sobresuscripción dentro de Traffic Optimizer
maintenance> serviceexec trafopt mainframe --enableosclassification 1
NOTA: El comando de mantenimiento se debe ejecutar en todos los switches lógicos del chasis.

Cualquier director o switch de 7.ª generación que ya haya detectado la falla de "desbordamiento de búfer" deberá realizar un reinicio
en frío para recuperarse por completo de la condición de falla:
Directores: Apagado/apagado de la ranura en los switches blade
de puerto afectados: Reinicie (reinicio en frío) el switch
Opción 1: Realice la acción de reinicio que se muestra anteriormente e implemente la solución alternativa para deshabilitar la acción de administración de sobresuscripción desde dentro de Traffic Optimizer
Opción 2: Actualice a una versión de FOS con la solución y, a continuación, realice la acción de reinicio que se mostró anteriormente.

La actualización a una versión de FOS con la solución proporcionada evitará que se produzca la falla de "desbordamiento del búfer", pero
una vez que se encuentre la condición de falla, solo un reinicio en frío de ASIC resolverá la condición de falla.
La actualización a una versión de FOS con la solución proporcionada evitará y recuperará automáticamente de la condición de error
de "verificación" sin ninguna otra acción.

Después de actualizar a una versión de FOS que contiene la solución, se realizará una comprobación de la memoria interna para determinar si el director o el switch ha detectado anteriormente la falla y requiere un reinicio para recuperarse de la condición de error.
Se mostrará el siguiente RASlog en caso de que se detecte la condición de falla después de actualizar FOS a una versión con la solución:
06/2023/01-17:07:50 (GMT), [C5-1057], 5, RANURA 2 | CHASIS, CRÍTICO, Switch_3,
S10, C0: El chip ASIC de hardware se encuentra en un estado incoherente = 0x1002.
Si se observa el RASlog anterior después de actualizar FOS, el director o el switch encontró anteriormente la falla de "desbordamiento del búfer
" antes de la actualización y deberá realizar un reinicio en frío para recuperarse por completo de la condición de falla:
Directores: Apagado/apagado de la ranura en los switches blade
de puerto afectados: Reinicie (reinicio en frío) el switch

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution