PowerScale: Cómo determinar la controladora de subred de una fabric PowerScale InfiniBand

Samenvatting: Cómo determinar la controladora de subred de una fabric PowerScale InfiniBand.

Dit artikel is van toepassing op Dit artikel is niet van toepassing op Dit artikel is niet gebonden aan een specifiek product. Niet alle productversies worden in dit artikel vermeld.

Instructies

Introducción

OpenSM proporciona una implementación de un administrador de subred y administración de InfiniBand (IB) y se ejecuta sobre OpenIB. OpenSM debe funcionar correctamente para que todo el tráfico de InfiniBand (IB) que depende de OpenSM funcione correctamente. Si se produce un problema de IB, es posible que desee revisar los registros de OpenSM y, para hacerlo, debe saber qué registro revisar. El servicio OpenSM se ejecuta en todos los nodos y cada nodo tiene sus propios registros de OpenSM. Sin embargo, solo el principal de subred de la fabric de IB realiza detecciones de topología, por lo que solo su registro de OpenSM tiene información completa y precisa. Por lo tanto, para poder identificar qué dispositivo está actuando como el principal de subred del fabric.

En una configuración de switch doble, debe correlacionar el registro de OpenSM con la interfaz a la que está vinculado. Los archivos opensm-1.topo y opensm-2.topo no siempre se correlacionan directamente con las interfaces internal-a (int-a) e internal-b (int-b). Puede utilizar el valor de dirección de capa de vínculo de interfaz (lladdr) de IB para determinar qué archivo está asociado a cada interfaz. En el siguiente procedimiento, se describe cómo hacerlo.

NOTA
Se genera un archivo .topo cuando se inicia una conexión al switch IB y contiene la información recopilada en ese momento. Un archivo .log siempre acompañará al archivo .topo . El archivo .log contiene mensajes e información topográfica acerca de la conexión InfiniBand. Una vez que conozcas el master, podrás revisar el archivo . Archivo de registro para obtener información sobre un problema específico.  Solo se puede confiar en el archivo topográfico en el nodo para el maestro de OpenSM para una topología correcta de la fabric.  No se deben utilizar archivos topo de otros nodos.

 

 Procedimiento

1. Abra una conexión SSH en cualquier nodo en el clúster e inicie sesión con la cuenta “raíz”. Permanezca en el mismo nodo para realizar el resto de los pasos de este procedimiento.

2. Determine los maestros de OpenSM para cada switch:

En un entorno con dos switches, debe haber dos líneas de salida, una para cada switch.

isi_for_array -XI 'ps auxw | grep opensm' | grep master


En el siguiente ejemplo para un entorno con un solo switch InfiniBand, 0xe41d2d0300bc8fc2 corresponde al lladdr de la NIC de Isilon para ese nodo, e IsilonX210-S19-1 incluye el número de nodo para el nodo maestro.

IsilonX210-S19-3# isi_for_array -XI 'ps auxw | grep opensm' | grep master
IsilonX210-S19-1: root    3757   0.0  0.0  28536   5036  -  S    23Feb17      3:56.20 opensm: 0xe41d2d0300bc8fc2 master (opensm)


3. Para cada resultado del comando 2, determine a qué interfaz del nodo se hace referencia en el resultado anterior examinando el lladdr desde el resultado de ifconfig.  

Repita este paso para cada nodo en el resultado del paso 2 reemplazando <LNN> por el número de nodo

isi_for_array -n <LNN> 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status

For our example, the interface of the master would be ib1 (lladdr is separated by a dot in this output for clarity in reading and ends in bc.8f.c2, the same as from the example in command 2 above.)

IsilonX210-S19-3# isi_for_array -n 1 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
IsilonX210-S19-1: ib0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 4092
IsilonX210-S19-1:       lladdr 0.0.0.48.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c1
IsilonX210-S19-1:       status: inactive
IsilonX210-S19-1: ib1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 2044
IsilonX210-S19-1:       lladdr 0.0.0.49.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c2
IsilonX210-S19-1:       status: active

Extra informatie

Si una interfaz se muestra como inactiva en el paso 3, su estado se puede ignorar, ya que puede aparecer como maestra.   

Si hay varios maestros de OpenSM por switch y los maestros adicionales no se deben a una tarjeta de interfaz de red (NIC) inactiva, comuníquese con el soporte técnico de PowerScale.

Si no hay maestros OpenSM, confirme que no haya otros dispositivos conectados físicamente al switch que no formen parte del clúster.  Esto incluye los nodos que están encendidos si no se han agregado al clúster o si se han quitado de este.  Si no hay conexiones adicionales en el fabric InfiniBand, es posible que el switch haya asumido la función de ser el principal.

Cuando se configura de manera óptima, el principal de subred designado debe ser un nodo del clúster, no un switch IB ni un nodo no configurado.

En raras ocasiones, un switch IB se puede configurar como su propio maestro de subred. Esto puede causar problemas que son difíciles de diagnosticar. Es decir, una interfaz IB no aparece, el switch no enruta el tráfico IB correctamente o incluso impide que los nodos se unan al clúster.

Si el switch IB es el principal, comuníquese con el soporte técnico de PowerScale.

Getroffen producten

Isilon Switches

Producten

PowerScale OneFS
Artikeleigenschappen
Artikelnummer: 000004114
Artikeltype: How To
Laatst aangepast: 07 jan. 2026
Versie:  8
Vind antwoorden op uw vragen via andere Dell gebruikers
Support Services
Controleer of uw apparaat wordt gedekt door Support Services.