PowerScale: Periodisk afbrydelse til dynamiske PowerScale-node-IP er

Summary: Denne artikel beskriver periodisk afbrydelse af forbindelsen til PowerScale-nodernes dynamiske IP-adresser under rullende genstart eller rullende opgradering. Dette sker på grund af ugyldige (gamle) ARP-poster (Address Resolution Protocol) på klienten. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Under en rullende genstart eller rullende opgradering kan nogle klienter på det samme undernet som PowerScale-klyngen afbryde forbindelsen til dynamiske PowerScale-IP er. Kun klienterne på det samme undernet med Isilon-klyngen har problemet. Klienterne kan ikke engang pinge de dynamiske IP'er med problemet. Dette kan også ske med de andre noder i den samme Isilon-klynge. Nogle noder i klyngen kan ikke pinge dynamiske IP'er på andre noder. Kontrol af ARP-tabellen på en klientcomputer, der ikke kan pinge en dynamisk IP, viser en ugyldig post. ARP-tabellen har stadig den gamle post, der knytter den dynamiske IP til den forkerte MAC-adresse.

For eksempel blev node 11 genstartet, og den dynamiske IP 10.x.x.43 blev flyttet til node 10 for at undgå nedetid. Derefter begyndte node 1 ikke at pinge IP'en.


Efter gennemgang af ARP-tabellen på node 1 var posten for node 11 ugyldig. Det viste, at IP 10.x.x.43 stadig var kortlagt til node 11's MAC ec: 0d: xx: xx: xx: c5: 00.

node-1# arp -a

? (10.x.x.43) at ec:0d:xx:xx:c5:00 on mlxen1 expires in 232 seconds [ethernet]

MAC-adressen for node 11 er ec:0d:xx:xx:c5:00.

node-11: mlxen0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 1500
node-11: options=d07bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,TSO4,TSO6,LRO,VLAN_HWFILTER,VLAN_HWTSO,LINKSTATE>
node-11: ether ec:0d:xx:xx:c5:00
node-11: inet 10.x.x.43 netmask 0xffffff00 broadcast 10.x.x.255 zone 1 
node-11: nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>
node-11: media: Ethernet autoselect (40Gbase-CR4 <full-duplex,rxpause,txpause>)
node-11: status: active

Når node 11 genstartes, blev IP 10.x.x.43 flyttet til node 10.

2018-11-15T16:06:45+09:00 <3.6> node-1 isi_smartconnect[5222]: Assigned unused IP 10.x.x.43 to { key=10,40gige-1 addr_idx=0 lni=40gige-1 nic=mlxen0[Up] vlan_nic=<NULL> addrs={ 10.x.x.43 } }
.
2018-11-15T16:06:45+09:00 <3.6> node-1 isi_smartconnect[5222]: FLXAPI: OP: FLXAPI_OP_CURRENT_STATE Pool[2:1:1:1]: subnet0 zones: filer25.xxx.com IP[18]: 10.x.x.21:up IP[18]: 10.x.x.54:up IP[17]: 10.x.x.32:up IP[17]: 10.x.x.56:up IP[17]: 10.x.x.30:up IP[16]: 10.x.x.37:up IP[16]: 10.x.x.39:up IP[16]: 10.x.x.45:up IP[15]: 10.x.x.29:up IP[15]: 10.x.x.33:up IP[15]: 10.x.x.49:up IP[14]: 10.x.x.31:up IP[14]: 10.x.x.34:up IP[13]: 10.x.x.38:up IP[13]: 10.x.x.40:up IP[13]: 10.x.x.46:up IP[12]: 10.x.x.41:up IP[12]: 10.x.x.36:up IP[10]: 10.x.x.53:up IP[10]: 10.x.x.43:up IP[9]: 10.x.x.44:up IP[9]: 10.x.x.28:up IP[8]: 10.x.x.51:up IP[8]: 10.x.x.26:up IP[7]: 10.x.x.55:up IP[7]: 10.x.x.35:up IP[6]: 10.x.x.42:up IP[6]: 10.x.x.24:up IP[5]: 10.x.x.52:up IP[5]: 10.x.x.25:up IP[4]: 10.x.x.48:up IP[4]: 10.x.x.50:up IP[3]: 10.x.x.22:up IP[3]: 10.x.x.27:up IP[2]: 10.x.x.47:up IP[2]: 10.x.x.23:up

MAC-adressen for node 10 er ec:0d:xx:xx:c0:80.

node-10: mlxen0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 1500
node-10: options=d07bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,TSO4,TSO6,LRO,VLAN_HWFILTER,VLAN_HWTSO,LINKSTATE>
node-10: ether ec:0d:xx:xx:c0:80
node-10: inet 10.x.x.43 netmask 0xffffff00 broadcast 10.x.x.255 zone 1 
node-10: nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>
node-10: media: Ethernet autoselect (40Gbase-CR4 <full-duplex,rxpause,txpause>)
node-10: status: active

ARP-posten på node 1 blev knyttet til en ugyldig (gammel) MAC-adresse. Dette resulterer i, at en klient eller node ikke kan forbinde IP-adressen, før den er rettet.

Cause

I henhold til "PowerScale Network Design Considerations"
https://infohub.delltechnologies.com/es-es/t/dell-powerscale-network-design-considerations/

" flytter en SmartConnect-zone med dynamisk allokering til IP-adresser straks den ene IP-adresse på den defekte node til en af de andre tre noder i klyngen. Den sender adskillige anmodninger om gratis adresseløsningsprotokoller (ARP) til den tilsluttede switch, så klientens I/O fortsætter uafbrudt."

Værterne på det samme undernet modtog ikke GARP-pakker (Gratuitous ARP) fra node 10, efter at IP-adressen blev tildelt. Således blev ARP-posten ikke opdateret korrekt på værterne, hvilket resulterer i et netværksforbindelsesproblem. Årsagen er, at ARP-udsendelser enten droppes eller blokeres på netværksniveau. Cisco Application Centric Infrastructure (ACI) har bidraget til disse problemer på grund af fejlkonfiguration.

Resolution

Løsning:

Som en langsigtet løsning skal "Gratuitous ARP Flooding" være aktiveret på switchsiden.

Følgende videnartikler er beregnet til at beskrive (detaljeret) kumulative anbefalinger med Cisco ACI.

Løsning:

Som en løsning kan den forældede ARP-post slettes med kommandoen "arp -d" på de berørte værter. Værterne udsender en ny ARP-opløsningsanmodning for IP'en og opdaterer deres ARP-tabeller med den opdaterede MAC-adresse.

Additional Information

Dette problem kan yderligere fejlløses med et pakkeregister på alle PowerScale-noder og klientmaskiner. Dette beviser, at noden modtog GARP-pakkerne som designet. Den vært, der oplevede problemet, modtog dog ikke GARP-pakker.

Da IP 10.x.x.43 blev flyttet til node 10, sendte node 10 faktisk GARP-pakker vedrørende IP 10.x.x.43.

[~]$ tshark -t ad -r node-10_mlxen0.pcap | grep ARP | grep Gratui
3781 2018-11-15 16:06:47.711230 ec:0d:xx:xx:c0:80 Broadcast ARP 42 Gratuitous ARP for 10.x.x.43 (Request)
3783 2018-11-15 16:06:47.753820 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3784 2018-11-15 16:06:47.753841 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3791 2018-11-15 16:06:48.823611 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3792 2018-11-15 16:06:48.823633 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3799 2018-11-15 16:06:49.835902 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3800 2018-11-15 16:06:49.835926 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3807 2018-11-15 16:06:50.933966 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3808 2018-11-15 16:06:50.934000 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3815 2018-11-15 16:06:52.034005 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3816 2018-11-15 16:06:52.034048 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3824 2018-11-15 16:06:53.084292 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3825 2018-11-15 16:06:53.084343 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3832 2018-11-15 16:06:54.134719 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3833 2018-11-15 16:06:54.134764 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3840 2018-11-15 16:06:55.222125 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3841 2018-11-15 16:06:55.222171 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3848 2018-11-15 16:06:56.283997 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3849 2018-11-15 16:06:56.284023 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3856 2018-11-15 16:06:57.370114 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3857 2018-11-15 16:06:57.370142 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)

Pakkeregistreringen viser, at node 1 ikke modtog nogen GARP-pakker vedrørende flytningen af IP 10.x.x.43.

[~]$ tshark -t ad -r node-1_mlxen1.pcap | grep -i arp | grep Gratuitous | grep 10.x.x.43
[~]$

Pakkeoptagelsen viser, at klienten heller ikke modtog GARP-pakkerne.

[~]$ tshark -t ad -r client.pcap | grep ARP | grep Gratuitous | grep 10.x.x.43
[~]$

Når værterne ikke modtager GARP-pakker, blev deres ARP-tabelposter for IP 10.x.x.43 ikke opdateret. De er stadig knyttet til den forkerte MAC ec:0d:xx:xx:c5:00. De kunne således ikke nå IP 10.x.x.43.

Affected Products

Isilon

Products

Isilon A2000, Isilon F800, Isilon F810, Isilon Gen6, Isilon H400, Isilon H500, Isilon H5600, Isilon H600, Isilon HD400, Isilon IQ 10000X-SSD, Isilon IQ 108000X, Isilon IQ 12000, Isilon IQ 12000X, Isilon IQ 1920i, Isilon IQ 3000X, Isilon IQ 32000X-SSD , Isilon IQ 36000X, Isilon IQ 5400S, Isilon IQ 6000X, Isilon IQ 72000X, Isilon IQ 9000X, Isilon IQ-Series, Isilon NL-Series, Isilon NL400, Isilon NL410, PowerScale OneFS, Isilon Performance Accelerator, Isilon S-Series, Isilon S200, Isilon S210, Isilon Scale-out NAS, Isilon SmartConnect, Isilon X-Series, Isilon X200, Isilon X210, Isilon X400, Isilon X410 ...
Article Properties
Article Number: 000056945
Article Type: Solution
Last Modified: 03 Jun 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.