PowerScale: Isilon: Análisis en clúster de Isilon: Pools de red: soporte de actualización paralela

Summary: En este artículo de la base de conocimientos, se proporcionan más detalles sobre la comprobación de IOCA y una visión general de las actualizaciones paralelas.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

El análisis en clúster de Isilon informa resultados similares a los siguientes:
 
Network Pools - Parallel Upgrade Support          FAIL

CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2

Cause

  • Esto es así por diseño, ya que el clúster tiene redes externas inconexas en las que existe un posible riesgo de que todos los nodos de los pools de redes afectados se reinicien simultáneamente.
  • En ese caso, los clientes no pueden acceder al clúster a través del nombre de zona de SmartConnect (SCZN) asociado con ese pool de redes. 

Resolution

Antes de revisar la resolución, es bueno comprender cómo funcionan las actualizaciones paralelas.

Definiciones importantes:
 

  • Pool de discos:  Conjunto de discos distribuidos entre un subconjunto de nodos de clúster. 
  • Niveles/políticas de protección: A todos los archivos del sistema de archivos /ifs se les asigna un nivel de protección. OneFS fracciona o duplica el contenido de los archivos en los nodos y las unidades de un solo pool de discos. Un archivo con un nivel de protección de 2d+1n garantiza que el archivo seguirá estando disponible si quedan inactivas dos unidades o un nodo en el pool de discos envolvente.
  • Barrios:  Conjuntos de nodos que contienen en su totalidad uno o más pools de discos. Un subconjunto de nodos asignados a un pool de discos puede superponerse con un subconjunto de nodos asignados a otra vecindad. No hay superposición de pools de discos entre barrios. 
  • API de base de datos de pools de discos y reservas La API de la base de datos de pools de discos tiene una característica de reserva que permite que una aplicación del cliente, como Upgrade Framework, elimine un conjunto de nodos (es decir, reinicio) o unidades del clúster sin vulnerar la protección en ningún pool de discos.
  • Redes externas inconexas: Un clúster tiene redes externas inconexas si hay un conjunto de nodos con interfaces externas que no se superponen en todos los pools de discos

Actualizaciones paralelas: visión general del nivel superior:
  • Una actualización paralela instala el nuevo sistema operativo en todos los nodos y, a continuación, reinicia un subconjunto de nodos simultáneamente, hasta un nodo en cada pool de discos.
  • Cada nodo intenta hacer una reserva de su turno de reinicio hasta que se actualicen todos los nodos.  Los subconjuntos y las reservas de nodos se basan en el pool de discos y la disponibilidad de los nodos.
  • Durante una actualización paralela, los subconjuntos de nodos que no se reinician permanecen en línea y pueden continuar prestando servicios a los clientes.

Comprobar definición:
  • El clúster tiene redes externas inconexas (ejemplo de la base de conocimientos: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2)
  • Durante la actualización paralela, existe un posible riesgo de DU en esos pools de redes, ya que todos los nodos de los pools de redes afectados podrían reiniciarse al mismo tiempo (es decir, todos podrían tomar una reserva de pools de discos para reiniciarse simultáneamente). 
  • Si eso ocurre, no será posible acceder a SCZN del pool de red afectado. 

Notas sobre la resolución:
  • Dado que cada clúster tiene una configuración de red diferente, la solución no es la misma para todos los clústeres.
  • Para evitar tener una posible DU en el pool de redes inconexas durante la actualización paralela, se necesitará un cambio en la configuración de red en el clúster y en el entorno externo, lo que generalmente requiere varias aprobaciones en el extremo del cliente.
  • En este artículo de la base de conocimientos, no se incluirá una resolución directa de la falla de comprobación de IOCA debido a los puntos anteriores.
  • Sin embargo, la regla general es que existan al menos dos interfaces miembro externas en los pools de redes afectados en el mismo dominio de vecindad/falla para evitar un riesgo de red/DU inconexo para ese pool de redes de SmartConnect (es decir, agregar nodos del mismo dominio de vecindad/falla al pool de redes afectado). 
  • En el artículo de la base de conocimientos, se proporcionan comandos sobre cómo determinar los dominios de vecindad/falla del clúster y los nodos miembros en los pools de redes afectados.

Solución: 
  • Utilice el siguiente comando para determinar los nodos miembro en los pools de redes afectados (Nota: Reemplace el "<ID> de pool de red 1 | <ID> del pool de red 2 | <network-pool 3 ID"> con los ID de pool de red afectados de los detalles de comprobación de IOCA y separa entre ellos mediante el carácter '|'). 
# isi network pools list -v | egrep -i 'ID: |ifaces' | egrep -A1 '<network-pool 1 ID> | <network-pool 2 ID> | <network-pool 3 ID>'
  • Ejecute el siguiente comando para determinar los vecindarios del clúster (Nota: Reemplace el <Ubicación> del script de IOCA y <Nueva versión> de OneFS con sus valores correctos
# perl <IOCA script location> -o <New OneFS version>,parallel  -e -r "checkNetworkParallelUpgrade"  
  • Haga referencia cruzada a los resultados de los comandos anteriores para determinar qué cambios se deben realizar en los pools de redes del clúster.
  • Una solución rápida sería agregar todos los nodos de clústeres a los pools de red afectados, pero una vez más, eso no suele ser fácil, ya que es posible que el entorno de red externo no permita este cambio.
  • Después de aplicar los cambios necesarios, vuelva a ejecutar la comprobación de IOCA.
  • Si no puede determinar los cambios necesarios, abra un caso con el soporte para obtener más ayuda.
  • Ejemplo a continuación para determinar los cambios necesarios en un escenario de prueba:
1) Determine member nodes in affected network pools:
# isi network pools list -v | grep -i 'ID: |ifaces' | egrep -A1 'groupnet0.subnet0.pool1| groupnet0.subnet1.pool1| groupnet0.subnet1.pool2'
                     ID: groupnet0.subnet0.pool1
                 Ifaces: 1:10gige-agg-1, 2:10gige-agg-1, 4:10gige-agg-1, 3:10gige-agg-1
                     ID: groupnet0.subnet1.pool1
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1
                     ID: groupnet0.subnet1.pool2
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1

2) Run the IOCA check to determine cluster neighborhoods:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade"
Isilon On-Cluster Analysis                        0.1395
Cluster Name                                      TestCluster
Cluster GUID                                      0050569b6db2ad086861001a2f1dd1d02473
Node Count                                        52
Current OneFS Version                             8.2.2.0
Destination OneFS Version                         9.2.1.5
Destination OneFS Version                         WARN
  WARN: There is a newer patch release available for OneFS 9.2.1: 9.2.1.9
Network Pools - Parallel Upgrade Support          FAIL
  CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
  
  ==============================
  Node Neighborhoods
  ==============================
  1: [ 1, 7, 10, 16, 19, 24, 27, 31, 35, 40, 43, 45, 47 ]
  2: [ 2, 6, 9, 15, 18, 23, 26, 29, 33, 38, 41, 46, 48 ]
  3: [ 3, 5, 12, 14, 17, 22, 25, 30, 34, 37, 42, 50, 51 ]
  4: [ 4, 8, 11, 13, 20, 21, 28, 32, 36, 39, 44, 49, 52 ]

3) The possible resolution in this case would be to :

a) A quick fix would be to add all clusters nodes to the impacted network pools groupnet0.subnet0.pool1 & groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
b) Add more nodes to affected network pools ( suggested nodes are based on neighborhood command output ) :

- Possible resolution to groupnet0.subnet0.pool1 : at least add node 7  to the network pool as node 7 exists in the same neighborhood as nodes 1
- Possible resolution to groupnet0.subnet1.pool1 : at least add node 34 to the network pool as node 34 exists in the same neighborhood as nodes 37
- Possible resolution to groupnet0.subnet1.pool2 : at least add node 33 to the network pool as node 33 exists in the same neighborhood as nodes 38

4) After applying the network changes, re-run the IOCA check to confirm that there are no issues:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade" 

Article Properties
Article Number: 000196936
Article Type: Solution
Last Modified: 26 Nov 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.