PowerScale: Określanie kontrolera podsieci sieci sieci szkieletowej PowerScale InfiniBand
Samenvatting: Określanie kontrolera podsieci sieci szkieletowej PowerScale InfiniBand.
Instructies
Wprowadzenie
OpenSM zapewnia implementację Menedżera podsieci InfiniBand (IB) i administracji i działa na OpenIB. OpenSM musi działać poprawnie, aby cały ruch InfiniBand (IB), który opiera się na OpenSM, działał prawidłowo. Jeśli wystąpi problem IB, warto przejrzeć dzienniki OpenSM i aby to zrobić, musisz wiedzieć, który dziennik należy przejrzeć. Usługa opensm działa na wszystkich węzłach, a każdy węzeł ma własne dzienniki OpenSM. Jednak tylko wzorzec podsieci sieci szkieletowej IB dokonuje odkryć topologii, więc tylko jego dziennik OpenSM zawiera pełne i dokładne informacje. W związku z tym, aby móc zidentyfikować, które urządzenie działa jako wzorzec podsieci sieci szkieletowej.
W przypadku konfiguracji z dwoma przełącznikami należy skorelować dziennik OpenSM z interfejsem, z którym jest powiązany. Pliki opensm-1.topo i opensm-2.topo nie zawsze są bezpośrednio skorelowane z interfejsami internal-a (int-a) i internal-b (int-b). Można użyć wartości Adres warstwy łącza interfejsu IB (lladdr), aby określić, który plik jest skojarzony z którym interfejsem. Procedura poniżej opisuje, jak to zrobić.
UWAGA
Plik .topo jest generowany podczas inicjowania połączenia z przełącznikiem IB i zawiera zebrane w tym czasie informacje. Plikowi .topo zawsze towarzyszy .log plik. Plik .log zawiera komunikaty i informacje topografii dotyczące połączenia InfiniBand. Gdy znasz mistrza, możesz przejrzeć odpowiedni plik . plik dziennika zawierający informacje o konkretnym problemie. Tylko na pliku topo w węźle dla mastera OpenSM można polegać na prawidłowej topologii sieci szkieletowej. Nie należy używać plików topo z innych węzłów.
Procedura
1. Otwórz połączenie SSH w węźle w klastrze i zaloguj się przy użyciu konta „root”. Pozostań na tym samym węźle, aby wykonać pozostałe czynności opisane w tej procedurze.
2. Określ mastery OpenSM dla każdego przełącznika:
isi_for_array -XI 'ps auxw | grep opensm' | grep master
W poniższym przykładzie dla środowiska z jednym przełącznikiem InfiniBand 0xe41d2d0300bc8fc2 odpowiada lladdr karty sieciowej Isilon dla tego węzła, a IsilonX210-S19-1 zawiera numer węzła dla węzła głównego.
IsilonX210-S19-3# isi_for_array -XI 'ps auxw | grep opensm' | grep master
IsilonX210-S19-1: root 3757 0.0 0.0 28536 5036 - S 23Feb17 3:56.20 opensm: 0xe41d2d0300bc8fc2 master (opensm)
3. Dla każdego wyniku polecenia 2 określ, do którego interfejsu w węźle odwołuje się powyższy wynik, sprawdzając lladdr z danych wyjściowych ifconfig.
isi_for_array -n <LNN> 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
For our example, the interface of the master would be ib1 (lladdr is separated by a dot in this output for clarity in reading and ends in bc.8f.c2, the same as from the example in command 2 above.)
IsilonX210-S19-3# isi_for_array -n 1 'ifconfig ib0 ; ifconfig ib1' | grep -E "ib[01]"\|lladdr\|status
IsilonX210-S19-1: ib0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 4092
IsilonX210-S19-1: lladdr 0.0.0.48.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c1
IsilonX210-S19-1: status: inactive
IsilonX210-S19-1: ib1: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 2044
IsilonX210-S19-1: lladdr 0.0.0.49.fe.80.0.0.0.0.0.0.e4.1d.2d.3.0.bc.8f.c2
IsilonX210-S19-1: status: active
Extra informatie
Jeśli w kroku 3 interfejs jest wyświetlany jako nieaktywny, jego stan można zignorować, ponieważ może być wyświetlany jako główny.
Jeśli na przełącznik przypada wiele masterów OpenSM, a dodatkowe mastery nie są spowodowane nieaktywną kartą interfejsu sieciowego (NIC), skontaktuj się z pomocą techniczną PowerScale.
Jeśli nie ma masterów OpenSM, upewnij się, że do przełącznika nie są fizycznie podłączone żadne inne urządzenia, które nie należą do klastra. Dotyczy to również węzłów, które są włączone, jeśli nie zostały dodane do klastra lub z niego usunięte. Jeśli w sieci szkieletowej InfiniBand nie ma żadnych dodatkowych połączeń, przełącznik mógł przyjąć rolę mastera.
Po optymalnej konfiguracji wyznaczony wzorzec podsieci powinien być węzłem klastra, a nie przełącznikiem IB lub węzłem nieskonfigurowanym.
W rzadkich przypadkach przełącznik IB może być skonfigurowany jako osobny wzorzec podsieci. Może to powodować problemy, które są trudne do zdiagnozowania. Oznacza to, że interfejs IB nie pojawia się, przełącznik nie kieruje prawidłowo ruchu IB lub nawet uniemożliwia węzłom dołączenie do klastra.
Jeśli przełącznik IB jest przełącznikiem głównym, skontaktuj się z pomocą techniczną PowerScale.