PowerScale: Come determinare il controller della subnet di una fabric PowerScale InfiniBand

Riepilogo: Come determinare il controller di subnet di una fabric PowerScale InfiniBand.

Questo articolo si applica a Questo articolo non si applica a Questo articolo non è legato a un prodotto specifico. Non tutte le versioni del prodotto sono identificate in questo articolo.

Istruzioni

Introduzione

OpenSM fornisce l'implementazione di una gestione e amministrazione della subnet InfiniBand (IB) e viene eseguito su OpenIB. OpenSM deve funzionare correttamente affinché tutto il traffico InfiniBand (IB) basato su OpenSM funzioni correttamente. Se si verifica un problema IB, è possibile esaminare i registri OpenSM e, a tal fine, è necessario sapere quale registro esaminare. Il servizio opensm viene eseguito su tutti i nodi e ogni nodo dispone dei propri registri OpenSM. Tuttavia, solo il master subnet del fabric IB effettua rilevamenti topologici, pertanto solo il relativo log OpenSM dispone di informazioni complete e accurate. Pertanto, per essere in grado di identificare quale dispositivo funge da subnet master del fabric.

In una configurazione a doppio switch, è necessario correlare il registro OpenSM all'interfaccia a cui è associato. I file opensm-1.topo e opensm-2.topo non sono sempre correlati direttamente alle interfacce internal-a (int-a) e internal-b (int-b). È possibile utilizzare il valore lladdr (IB interface link layer address) per determinare quale file è associato a quale interfaccia. La procedura riportata di seguito descrive come eseguire questa operazione.

NOTA
Quando viene avviata una connessione allo switch IB, viene generato un file .topo contenente le informazioni raccolte in quel momento. Il file .topo è accompagnato da un file .log. Il file .log contiene messaggi e informazioni topografiche sulla connessione InfiniBand. Una volta che si conosce il master, è possibile rivedere il file . file di registro per informazioni su un problema specifico.  È possibile fare affidamento solo sul file Topo sul nodo per il master OpenSM per una topologia corretta della fabric.  Non utilizzare i file Topo di altri nodi.

 

 Procedura

1. Aprire una connessione SSH a qualsiasi nodo nel cluster e accedere utilizzando l'account "root". Rimanere sullo stesso nodo per eseguire il resto dei passaggi descritti in questa procedura.

2. Determinare i master OpenSM per ogni switch:

In un ambiente con due switch, devono essere presenti due linee di output, una per ogni switch.

isi_for_array -XI 'ps auxw | grep opensm' | grep master


Nell'esempio riportato di seguito, per un ambiente con un singolo switch InfiniBand, 0xe41d2d0300bc8fc2 corrisponde al valore lladdr della scheda di rete Isilon per tale nodo e IsilonX210-S19-1 include il numero di nodo per il master.

IsilonX210-S19-3# isi_for_array -XI 'ps auxw | grep opensm' | grep master
IsilonX210-S19-1: root    3757   0.0  0.0  28536   5036  -  S    23Feb17      3:56.20 opensm: 0xe41d2d0300bc8fc2 master (opensm)


3. Per ogni risultato nel comando 2, determinare a quale interfaccia sul nodo si fa riferimento dall'output precedente esaminando lladdr dall'output di ifconfig.  

Ripetere questo passaggio per ogni nodo nell'output del passaggio 2, sostituendo <LNN> con il numero di nodo

isi_for_array -n <LNN> 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status

For our example, the interface of the master would be ib1 (lladdr is separated by a dot in this output for clarity in reading and ends in bc.8f.c2, the same as from the example in command 2 above.)

IsilonX210-S19-3# isi_for_array -n 1 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
IsilonX210-S19-1: ib0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 4092
IsilonX210-S19-1:       lladdr 0.0.0.48.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c1
IsilonX210-S19-1:       status: inactive
IsilonX210-S19-1: ib1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 2044
IsilonX210-S19-1:       lladdr 0.0.0.49.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c2
IsilonX210-S19-1:       status: active

Informazioni aggiuntive

Se un'interfaccia viene visualizzata come inattiva nel passaggio 3, il suo stato può essere ignorato in quanto potrebbe essere visualizzata come master.   

Se sono presenti più master OpenSM per switch e i master aggiuntivi non sono dovuti a una scheda di interfaccia di rete (NIC) inattiva, contattare il supporto tecnico PowerScale.

Se non sono presenti master OpenSM, verificare che non vi siano altri dispositivi fisicamente collegati allo switch che non fanno parte del cluster.  Ciò include i nodi che sono accesi se non sono stati aggiunti o rimossi dal cluster.  Se non sono presenti connessioni aggiuntive sulla fabric InfiniBand, lo switch potrebbe aver assunto il ruolo di master.

Se configurato in modo ottimale, il master della subnet designato deve essere un nodo cluster, non uno switch IB o un nodo non configurato.

In rari casi, uno switch IB potrebbe essere configurato come proprio subnet master. Ciò può causare problemi difficili da diagnosticare. Ad esempio, un'interfaccia IB non viene attivata, lo switch non instrada correttamente il traffico IB o impedisce ai nodi di unirsi al cluster.

Se lo switch IB è il master, contattare il supporto tecnico PowerScale.

Prodotti interessati

Isilon Switches

Prodotti

PowerScale OneFS
Proprietà dell'articolo
Numero articolo: 000004114
Tipo di articolo: How To
Ultima modifica: 07 gen 2026
Versione:  8
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.