PowerScale: Jak určit řadič podsítě topologie PowerScale InfiniBand
Samenvatting: Jak určit řadič podsítě topologie PowerScale InfiniBand.
Instructies
Úvod
OpenSM poskytuje implementaci správce a správy podsítě InfiniBand (IB) a běží nad OpenIB. OpenSM musí fungovat správně, aby veškerý provoz InfiniBand (IB), který závisí na OpenSM, fungoval správně. Pokud dojde k problému s IB, možná budete chtít zkontrolovat protokoly OpenSM a k tomu musíte vědět, který protokol se má zkontrolovat. Služba opensm běží na všech uzlech a každý uzel má vlastní protokoly OpenSM. Zjišťování topologie však provádí pouze hlavní podsíť topologie infrastruktury IB, takže úplné a přesné informace má pouze protokol OpenSM. Aby bylo možné identifikovat, které zařízení funguje jako hlavní podsíť topologie Fabric.
V konfiguraci se dvěma přepínači je nutné korelovat protokol OpenSM s rozhraním, ke kterému je vázán. Soubory opensm-1.topo a opensm-2.topo ne vždy přímo korelují s interními-a (int-a) a interním-b (int-b) rozhraními. Hodnotu adresy linkové vrstvy rozhraní IB (lladdr) můžete použít k určení, který soubor je přidružen ke kterému rozhraní. Níže uvedený postup popisuje, jak to provést.
POZNÁMKA
Při zahájení připojení k přepínači IB se vygeneruje soubor .topo , který obsahuje informace shromážděné v daném okamžiku. Soubor .log bude vždy doprovázet soubor .topo . Soubor .log obsahuje zprávy a topografické informace o připojení InfiniBand. Jakmile budete znát master, můžete zkontrolovat příslušný . log s informacemi o konkrétním problému. Pro správnou topologii topologie topologie se lze spolehnout pouze na topo soubor na uzlu pro OpenSM master. Topo soubory z jiných uzlů by se neměly používat.
Postup
1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí účtu „root“. Zůstaňte ve stejném uzlu a proveďte zbývající kroky tohoto postupu.
2. Určete OpenSM Master pro každý přepínač:
isi_for_array -XI 'ps auxw | grep opensm' | grep master
V níže uvedeném příkladu pro prostředí s jedním přepínačem InfiniBand odpovídá 0xe41d2d0300bc8fc2 lladdr síťové karty Isilon pro daný uzel a IsilonX210-S19-1 obsahuje číslo uzlu masteru.
IsilonX210-S19-3# isi_for_array -XI 'ps auxw | grep opensm' | grep master
IsilonX210-S19-1: root 3757 0.0 0.0 28536 5036 - S 23Feb17 3:56.20 opensm: 0xe41d2d0300bc8fc2 master (opensm)
3. Pro každý výsledek v příkazu 2 určete, na které rozhraní v uzlu se odkazuje z výše uvedeného výstupu, a to tak, že zkontrolujete lladdr z výstupu ifconfig.
isi_for_array -n <LNN> 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
For our example, the interface of the master would be ib1 (lladdr is separated by a dot in this output for clarity in reading and ends in bc.8f.c2, the same as from the example in command 2 above.)
IsilonX210-S19-3# isi_for_array -n 1 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
IsilonX210-S19-1: ib0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 4092
IsilonX210-S19-1: lladdr 0.0.0.48.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c1
IsilonX210-S19-1: status: inactive
IsilonX210-S19-1: ib1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 2044
IsilonX210-S19-1: lladdr 0.0.0.49.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c2
IsilonX210-S19-1: status: active
Extra informatie
Pokud se rozhraní v kroku 3 zobrazí jako neaktivní, lze jeho stav ignorovat, protože se může zobrazit jako hlavní.
Pokud je v každém přepínači více modulů OpenSM master a další mastery nejsou způsobeny neaktivní kartou NIC (Network Interface Card), obraťte se na technickou podporu PowerScale.
Pokud nejsou k dispozici žádné moduly PowerSM master, ověřte, zda k přepínači nejsou fyzicky připojena žádná další zařízení, která nejsou součástí clusteru. To zahrnuje uzly, které jsou zapnuté, pokud nebyly přidány do clusteru nebo z něj odebrány. Pokud na topologii InfiniBand nejsou žádná další připojení, je možné, že přepínač převzal roli hlavního serveru.
Po optimální konfiguraci by určeným hlavním uzlem podsítě měl být uzel clusteru, nikoli přepínač IB nebo nenakonfigurovaný uzel.
Ve vzácných případech může být přepínač IB nakonfigurován jako vlastní hlavní podsíť. To může způsobit problémy, které se obtížně diagnostikují. Tj. nespustí se rozhraní IB, přepínač nesměruje správně provoz IB nebo dokonce brání uzlům v připojení ke clusteru.
Pokud je přepínač IB master, obraťte se na technickou podporu PowerScale.