PowerScale: Isilon: Analiza klastra Isilon: Pule sieciowe — obsługa aktualizacji równoległych

Summary: Ten artykuł bazy wiedzy zawiera więcej szczegółów na temat kontroli IOCA oraz ogólne omówienie uaktualnień równoległych.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Analiza klastra Isilon raportuje wyniki podobne do następujących:
 
Network Pools - Parallel Upgrade Support          FAIL

CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2

Cause

  • Jest to celowe, ponieważ klaster ma rozłączne sieci zewnętrzne, w których istnieje ryzyko ponownego uruchomienia wszystkich węzłów w zagrożonych pulach sieciowych jednocześnie.
  • W takim przypadku klienci nie mogą uzyskać dostępu do klastra za pośrednictwem nazwy strefy SmartConnect (SCZN) skojarzonej z tą pulą sieci. 

Resolution

Przed przystąpieniem do rozwiązywania problemu dobrze jest zrozumieć, jak działają aktualizacje równoległe.

Ważne definicje:
 

  • Pula dysków:  Kolekcja dysków rozproszonych między podzbiorem węzłów klastra. 
  • Poziomy zabezpieczenia / zasady: Wszystkie pliki w systemie plików /ifs mają przypisany poziom ochrony. OneFS wykonuje striping lub mirroring zawartości plików pomiędzy węzłami i dyskami w ramach jednej puli dyskowej. Plik o poziomie ochrony 2d+1n gwarantuje, że plik będzie nadal dostępny, jeśli przestaną działać dwa dyski lub jeden węzeł w otaczającej go puli dysków.
  • Dzielnic:  Zestawy węzłów, które w całości zawierają co najmniej jedną pulę dysków. Podzbiór węzłów przypisanych do puli dysków może pokrywać się z podzbiorem węzłów przypisanych do innego sąsiedztwa. Nie ma możliwości nakładania się pul dyskowych pomiędzy sąsiedztwami. 
  • Interfejs API DB pul dyskowych i rezerwacje Interfejs API bazy danych pul dyskowych posiada funkcję rezerwacji, która pozwala aplikacji klienckiej, takiej jak Upgrade Framework, usunąć z klastra zestaw węzłów (tzn. uruchomić go ponownie) lub dysków bez naruszania ochrony żadnej z pul dyskowych.
  • Rozłączne sieci zewnętrzne: Klaster ma rozłączne sieci zewnętrzne, jeśli istnieje zbiór węzłów z interfejsami zewnętrznymi, które nie pokrywają się we wszystkich pulach dyskowych

Uaktualnienia równoległe — omówienie najwyższego poziomu:
  • Uaktualnienie równoległe instaluje nowy system operacyjny na wszystkich węzłach, a następnie uruchamia ponownie podzbiór węzłów jednocześnie, do jednego węzła w każdej puli dysków.
  • Każdy węzeł próbuje dokonać rezerwacji miejsca w kolejce do ponownego uruchomienia do czasu aktualizacji wszystkich węzłów.  Podzbiory węzłów i rezerwacje są oparte na dostępności puli dyskowej i węzłów.
  • Podczas aktualizacji równoległej podzbiory węzłów, które nie są uruchamiane ponownie, pozostają online i mogą nadal obsługiwać klientów.

Definicja kontrolna:
  • Klaster ma rozłączne sieci zewnętrzne (przykład bazy wiedzy : groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2)
  • Podczas uaktualniania równoległego istnieje ryzyko DU dla tych pul sieciowych, ponieważ wszystkie węzły w pulach sieciowych, których dotyczy problem, mogą zostać ponownie uruchomione w tym samym czasie (tj. wszystkie mogą przyjąć rezerwację pul dysków w celu ponownego uruchomienia jednocześnie). 
  • Jeśli tak się stanie, dostęp do SCZN dotkniętej puli sieciowej nie będzie możliwy. 

Uwagi dotyczące rozwiązania:
  • Ponieważ każdy klaster ma inną konfigurację sieci, rozwiązanie nie jest takie samo dla wszystkich klastrów.
  • Aby uniknąć ewentualnego DU na rozłącznej puli sieciowej podczas równoległej aktualizacji, konieczna będzie zmiana konfiguracji sieci na klastrze i w środowisku zewnętrznym, co zwykle wymaga kilku zatwierdzeń ze strony klienta.
  • Ten artykuł KB nie będzie zawierał bezpośredniego rozwiązania problemu niepowodzenia sprawdzenia IOCA z powodu powyższych punktów.
  • Jednak ogólna wytyczna jest taka, że co najmniej dwa interfejsy zewnętrznych węzłów w pulach sieciowych, których dotyczy problem, istnieją w tej samej domenie sąsiedztwa/awarii, aby uniknąć ryzyka rozłączenia sieci/DU dla tej puli sieci SmartConnect (tj. dodać węzły z tej samej domeny sąsiedztwa/awarii do puli sieci, której dotyczy problem). 
  • Artykuł bazy wiedzy zawiera polecenia dotyczące określania domen sąsiedztwa/awarii klastra oraz węzłów członkowskich w pulach sieciowych, których dotyczy problem.

Rozwiązanie: 
  • Użyj poniższego polecenia, aby określić węzły członkowskie w pulach sieciowych, których dotyczy problem (Uwaga: Zastąp "<network-pool 1 ID> | <identyfikator puli sieciowej 2> | <network-pool 3 ID>" z identyfikatorami puli sieciowej, których dotyczy problem, ze szczegółów sprawdzenia IOCA i oddziel je za pomocą znaku "|"). 
# isi network pools list -v | egrep -i 'ID: |ifaces' | egrep -A1 '<network-pool 1 ID> | <network-pool 2 ID> | <network-pool 3 ID>'
  • Uruchom poniższe polecenie, aby określić sąsiedztwo klastra (Uwaga: Zainstaluj przycisk <Lokalizacja> skryptu IOCA i <nowa wersja> OneFS z poprawnymi wartościami
# perl <IOCA script location> -o <New OneFS version>,parallel  -e -r "checkNetworkParallelUpgrade"  
  • Odwołaj się do danych wyjściowych powyższych poleceń, aby określić, jakie zmiany należy wprowadzić w pulach sieciowych klastra.
  • Szybkim rozwiązaniem byłoby dodanie wszystkich węzłów klastra do pul sieciowych, których to dotyczy, ale i to zwykle nie jest łatwe, ponieważ zewnętrzne środowisko sieciowe może nie pozwolić na taką zmianę.
  • Po zastosowaniu wymaganych zmian ponownie uruchom kontrolę IOCA.
  • Jeśli nie można określić niezbędnych zmian, otwórz sprawę w dziale pomocy technicznej, aby uzyskać dalszą pomoc.
  • Przykład poniżej, aby określić wymagane zmiany w scenariuszu testowym:
1) Determine member nodes in affected network pools:
# isi network pools list -v | grep -i 'ID: |ifaces' | egrep -A1 'groupnet0.subnet0.pool1| groupnet0.subnet1.pool1| groupnet0.subnet1.pool2'
                     ID: groupnet0.subnet0.pool1
                 Ifaces: 1:10gige-agg-1, 2:10gige-agg-1, 4:10gige-agg-1, 3:10gige-agg-1
                     ID: groupnet0.subnet1.pool1
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1
                     ID: groupnet0.subnet1.pool2
                 Ifaces: 37:10gige-agg-1, 38:10gige-agg-1, 39:10gige-agg-1, 40:10gige-agg-1

2) Run the IOCA check to determine cluster neighborhoods:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade"
Isilon On-Cluster Analysis                        0.1395
Cluster Name                                      TestCluster
Cluster GUID                                      0050569b6db2ad086861001a2f1dd1d02473
Node Count                                        52
Current OneFS Version                             8.2.2.0
Destination OneFS Version                         9.2.1.5
Destination OneFS Version                         WARN
  WARN: There is a newer patch release available for OneFS 9.2.1: 9.2.1.9
Network Pools - Parallel Upgrade Support          FAIL
  CRITICAL: A parallel upgrade runs the risk of making one or more external networks temporarily unavailable. Affected pools: groupnet0.subnet0.pool1, groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
  
  ==============================
  Node Neighborhoods
  ==============================
  1: [ 1, 7, 10, 16, 19, 24, 27, 31, 35, 40, 43, 45, 47 ]
  2: [ 2, 6, 9, 15, 18, 23, 26, 29, 33, 38, 41, 46, 48 ]
  3: [ 3, 5, 12, 14, 17, 22, 25, 30, 34, 37, 42, 50, 51 ]
  4: [ 4, 8, 11, 13, 20, 21, 28, 32, 36, 39, 44, 49, 52 ]

3) The possible resolution in this case would be to :

a) A quick fix would be to add all clusters nodes to the impacted network pools groupnet0.subnet0.pool1 & groupnet0.subnet1.pool1, groupnet0.subnet1.pool2
b) Add more nodes to affected network pools ( suggested nodes are based on neighborhood command output ) :

- Possible resolution to groupnet0.subnet0.pool1 : at least add node 7  to the network pool as node 7 exists in the same neighborhood as nodes 1
- Possible resolution to groupnet0.subnet1.pool1 : at least add node 34 to the network pool as node 34 exists in the same neighborhood as nodes 37
- Possible resolution to groupnet0.subnet1.pool2 : at least add node 33 to the network pool as node 33 exists in the same neighborhood as nodes 38

4) After applying the network changes, re-run the IOCA check to confirm that there are no issues:
# perl IOCA -o 9.2.1.5,parallel -e -r "checkNetworkParallelUpgrade" 

Article Properties
Article Number: 000196936
Article Type: Solution
Last Modified: 26 Nov 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.