PowerScale: Sporadyczne rozłączanie z dynamicznymi adresami IP węzła PowerScale

Summary: W tym artykule opisano sporadyczne rozłączanie z dynamicznymi adresami IP węzłów PowerScale podczas stopniowego ponownego uruchamiania lub stopniowego uaktualniania. Dzieje się tak z powodu nieprawidłowych (starych) wpisów protokołu ARP (Address Resolution Protocol) na kliencie. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Podczas stopniowego ponownego uruchamiania lub stopniowej aktualizacji niektórzy klienci w tej samej podsieci co klaster PowerScale mogą rozłączyć się z dynamicznymi adresami IP PowerScale. Problem dotyczy tylko klientów w tej samej podsieci, w której działa klaster Isilon. Klienci nie mogą nawet pingować dynamicznych adresów IP z problemem. Może się to również zdarzyć z innymi węzłami w tym samym klastrze Isilon. Niektóre węzły w klastrze nie mogą wysyłać poleceń ping do żadnych dynamicznych adresów IP w innych węzłach. Sprawdzenie tabeli ARP na komputerze klienckim, który nie może pingować dynamicznego adresu IP, pokazuje nieprawidłowy wpis. W tabeli ARP nadal znajduje się stary wpis, który mapuje dynamiczny adres IP na nieprawidłowy adres MAC.

Na przykład węzeł 11 został ponownie uruchomiony, a dynamiczny adres IP 10.x.x.43 został przeniesiony do węzła 10, aby uniknąć przestoju. Następnie węzeł 1 zaczął nie pingować adresu IP.


Po przejrzeniu tabeli ARP w węźle 1 wpis dla węzła 11 był nieprawidłowy. Okazało się, że adres IP 10.x.x.43 był nadal mapowany na adres MAC ec:0d:xx:xx:c5:00 węzła 11.

node-1# arp -a

? (10.x.x.43) at ec:0d:xx:xx:c5:00 on mlxen1 expires in 232 seconds [ethernet]

Adres MAC węzła 11 to ec:0d:xx:xx:c5:00.

node-11: mlxen0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 1500
node-11: options=d07bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,TSO4,TSO6,LRO,VLAN_HWFILTER,VLAN_HWTSO,LINKSTATE>
node-11: ether ec:0d:xx:xx:c5:00
node-11: inet 10.x.x.43 netmask 0xffffff00 broadcast 10.x.x.255 zone 1 
node-11: nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>
node-11: media: Ethernet autoselect (40Gbase-CR4 <full-duplex,rxpause,txpause>)
node-11: status: active

Po ponownym uruchomieniu węzła 11 adres IP 10.x.x.43 został przeniesiony do węzła 10.

2018-11-15T16:06:45+09:00 <3.6> node-1 isi_smartconnect[5222]: Assigned unused IP 10.x.x.43 to { key=10,40gige-1 addr_idx=0 lni=40gige-1 nic=mlxen0[Up] vlan_nic=<NULL> addrs={ 10.x.x.43 } }
.
2018-11-15T16:06:45+09:00 <3.6> node-1 isi_smartconnect[5222]: FLXAPI: OP: FLXAPI_OP_CURRENT_STATE Pool[2:1:1:1]: subnet0 zones: filer25.xxx.com IP[18]: 10.x.x.21:up IP[18]: 10.x.x.54:up IP[17]: 10.x.x.32:up IP[17]: 10.x.x.56:up IP[17]: 10.x.x.30:up IP[16]: 10.x.x.37:up IP[16]: 10.x.x.39:up IP[16]: 10.x.x.45:up IP[15]: 10.x.x.29:up IP[15]: 10.x.x.33:up IP[15]: 10.x.x.49:up IP[14]: 10.x.x.31:up IP[14]: 10.x.x.34:up IP[13]: 10.x.x.38:up IP[13]: 10.x.x.40:up IP[13]: 10.x.x.46:up IP[12]: 10.x.x.41:up IP[12]: 10.x.x.36:up IP[10]: 10.x.x.53:up IP[10]: 10.x.x.43:up IP[9]: 10.x.x.44:up IP[9]: 10.x.x.28:up IP[8]: 10.x.x.51:up IP[8]: 10.x.x.26:up IP[7]: 10.x.x.55:up IP[7]: 10.x.x.35:up IP[6]: 10.x.x.42:up IP[6]: 10.x.x.24:up IP[5]: 10.x.x.52:up IP[5]: 10.x.x.25:up IP[4]: 10.x.x.48:up IP[4]: 10.x.x.50:up IP[3]: 10.x.x.22:up IP[3]: 10.x.x.27:up IP[2]: 10.x.x.47:up IP[2]: 10.x.x.23:up

Adres MAC węzła 10 to ec:0d:xx:xx:c0:80.

node-10: mlxen0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 1500
node-10: options=d07bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,TSO4,TSO6,LRO,VLAN_HWFILTER,VLAN_HWTSO,LINKSTATE>
node-10: ether ec:0d:xx:xx:c0:80
node-10: inet 10.x.x.43 netmask 0xffffff00 broadcast 10.x.x.255 zone 1 
node-10: nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>
node-10: media: Ethernet autoselect (40Gbase-CR4 <full-duplex,rxpause,txpause>)
node-10: status: active

Wpis ARP w węźle 1 został zmapowany na nieprawidłowy (stary) adres MAC. Powoduje to, że żaden klient lub węzeł nie może połączyć się z adresem IP, dopóki nie zostanie naprawiony.

Cause

Zgodnie z dokumentem "Zagadnienia dotyczące projektowania sieci PowerScale"
https://infohub.delltechnologies.com/es-es/t/dell-powerscale-network-design-considerations/

strefa SmartConnect z dynamiczną alokacją adresów IP natychmiast przenosi jeden adres IP w uszkodzonym węźle do jednego z trzech pozostałych węzłów w klastrze. Wysyła kilka bezpłatnych żądań protokołów rozwiązywania adresów (ARP) do podłączonego przełącznika, dzięki czemu we/wy klienta są kontynuowane bez zakłóceń".

Hosty w tej samej podsieci nie otrzymały bezpłatnych pakietów ARP (GARP) z węzła 10 po przypisaniu adresu IP. W związku z tym wpis ARP nie został poprawnie zaktualizowany na hostach, co spowodowało problem z połączeniem sieciowym. Przyczyną jest to, że emisje ARP są przerywane lub blokowane na poziomie sieci. Infrastruktura Cisco Application Centric (ACI) przyczyniła się do tych problemów z powodu nieprawidłowej konfiguracji.

Resolution

Rozwiązanie:

Jako rozwiązanie długoterminowe "Nieuzasadnione zalewanie ARP" musi być włączone po stronie przełącznika.

Poniższe artykuły merytoryczne mają na celu opisanie (szczegółowo) skumulowanych zaleceń dotyczących Cisco ACI.

Obejście problemu:

Aby obejść ten problem, przestarzały wpis ARP może zostać usunięty za pomocą polecenia "arp -d" na hostach, których dotyczy problem. Hosty rozgłaszają nowe żądanie rozdzielczości ARP dla adresu IP i aktualizują swoje tabele ARP o zaktualizowany adres MAC.

Additional Information

Problem ten można rozwiązać dalej dzięki przechwytywaniu pakietów na wszystkich węzłach PowerScale i komputerach klienckich. Dowodzi to, że węzeł odebrał pakiety GARP zgodnie z projektem. Jednak host, na którym wystąpił problem, nie otrzymał pakietów GARP.

Kiedy adres IP 10.x.x.43 został przeniesiony do węzła 10, węzeł 10 rzeczywiście wysłał pakiety GARP dotyczące adresu IP 10.x.x.43.

[~]$ tshark -t ad -r node-10_mlxen0.pcap | grep ARP | grep Gratui
3781 2018-11-15 16:06:47.711230 ec:0d:xx:xx:c0:80 Broadcast ARP 42 Gratuitous ARP for 10.x.x.43 (Request)
3783 2018-11-15 16:06:47.753820 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3784 2018-11-15 16:06:47.753841 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3791 2018-11-15 16:06:48.823611 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3792 2018-11-15 16:06:48.823633 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3799 2018-11-15 16:06:49.835902 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3800 2018-11-15 16:06:49.835926 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3807 2018-11-15 16:06:50.933966 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3808 2018-11-15 16:06:50.934000 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3815 2018-11-15 16:06:52.034005 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3816 2018-11-15 16:06:52.034048 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3824 2018-11-15 16:06:53.084292 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3825 2018-11-15 16:06:53.084343 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3832 2018-11-15 16:06:54.134719 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3833 2018-11-15 16:06:54.134764 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3840 2018-11-15 16:06:55.222125 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3841 2018-11-15 16:06:55.222171 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3848 2018-11-15 16:06:56.283997 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3849 2018-11-15 16:06:56.284023 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3856 2018-11-15 16:06:57.370114 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3857 2018-11-15 16:06:57.370142 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)

Przechwytywanie pakietów pokazuje, że węzeł 1 nie otrzymał żadnych pakietów GARP dotyczących ruchu adresu IP 10.x.x.43.

[~]$ tshark -t ad -r node-1_mlxen1.pcap | grep -i arp | grep Gratuitous | grep 10.x.x.43
[~]$

Przechwytywanie pakietów pokazuje, że klient również nie odebrał pakietów GAP.

[~]$ tshark -t ad -r client.pcap | grep ARP | grep Gratuitous | grep 10.x.x.43
[~]$

Gdy hosty nie odbierają pakietów GARP, ich wpisy w tabeli ARP dla adresu IP 10.x.x.43 nie zostały zaktualizowane. Nadal są one mapowane na nieprawidłowy adres MAC ec:0d:xx:xx:c5:00. W związku z tym nie mogli osiągnąć IP 10.x.x.43.

Affected Products

Isilon

Products

Isilon A2000, Isilon F800, Isilon F810, Isilon Gen6, Isilon H400, Isilon H500, Isilon H5600, Isilon H600, Isilon HD400, Isilon IQ 10000X-SSD, Isilon IQ 108000X, Isilon IQ 12000, Isilon IQ 12000X, Isilon IQ 1920i, Isilon IQ 3000X, Isilon IQ 32000X-SSD , Isilon IQ 36000X, Isilon IQ 5400S, Isilon IQ 6000X, Isilon IQ 72000X, Isilon IQ 9000X, Isilon IQ-Series, Isilon NL-Series, Isilon NL400, Isilon NL410, PowerScale OneFS, Isilon Performance Accelerator, Isilon S-Series, Isilon S200, Isilon S210, Isilon Scale-out NAS, Isilon SmartConnect, Isilon X-Series, Isilon X200, Isilon X210, Isilon X400, Isilon X410 ...
Article Properties
Article Number: 000056945
Article Type: Solution
Last Modified: 03 Jun 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.