PowerScale: Ajoittainen yhteyden katkeaminen dynaamisiin PowerScale-solmun IP-osoitteisiin

Summary: Tässä artikkelissa kuvataan ajoittaista katkomista PowerScale-solmujen dynaamisiin IP-osoitteisiin jatkuvan uudelleenkäynnistyksen tai jatkuvan päivityksen aikana. Tämä johtuu asiakkaan virheellisistä (vanhoista) ARP (Address Resolution Protocol) -merkinnöistä. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Jatkuvan uudelleenkäynnistyksen tai jatkuvan päivityksen aikana jotkin PowerScale-klusterin kanssa samassa aliverkossa olevat asiakkaat saattavat muodostaa yhteyden PowerScalen dynaamisiin IP-osoitteisiin. Ongelma koskee vain saman aliverkon Isilon-klusterilla olevia asiakkaita. Asiakkaat eivät voi edes pingata dynaamisia IP-osoitteita ongelman kanssa. Näin voi käydä myös saman Isilon-klusterin muille solmuille. Jotkin klusterin solmut eivät voi pingata toisten solmujen dynaamisia IP-osoitteita. ARP-taulukon tarkistaminen asiakaskoneella, joka ei voi pingata dynaamista IP-osoitetta, näyttää virheellisen merkinnän. ARP-taulukossa on edelleen vanha merkintä, joka kartoittaa dynaamisen IP: n väärään MAC-osoitteeseen.

Esimerkiksi solmu 11 käynnistyi uudelleen ja dynaaminen IP 10.x.x.43 siirrettiin solmuun 10 seisokkien välttämiseksi. Sitten solmu 1 alkoi pingata IP-osoitetta.


Solmun 1 ARP-taulukon tarkistamisen jälkeen solmun 11 merkintä ei kelpaanut. Se osoitti, että IP 10.x.x.43 oli edelleen yhdistetty solmun 11 MAC: hen ec: 0d: xx: xx: c5: 00.

node-1# arp -a

? (10.x.x.43) at ec:0d:xx:xx:c5:00 on mlxen1 expires in 232 seconds [ethernet]

Solmun 11 MAC-osoite on ec:0d:xx:xx:c5:00.

node-11: mlxen0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 1500
node-11: options=d07bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,TSO4,TSO6,LRO,VLAN_HWFILTER,VLAN_HWTSO,LINKSTATE>
node-11: ether ec:0d:xx:xx:c5:00
node-11: inet 10.x.x.43 netmask 0xffffff00 broadcast 10.x.x.255 zone 1 
node-11: nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>
node-11: media: Ethernet autoselect (40Gbase-CR4 <full-duplex,rxpause,txpause>)
node-11: status: active

Kun solmu 11 käynnistetään uudelleen, IP 10.x.x.43 siirrettiin solmuun 10.

2018-11-15T16:06:45+09:00 <3.6> node-1 isi_smartconnect[5222]: Assigned unused IP 10.x.x.43 to { key=10,40gige-1 addr_idx=0 lni=40gige-1 nic=mlxen0[Up] vlan_nic=<NULL> addrs={ 10.x.x.43 } }
.
2018-11-15T16:06:45+09:00 <3.6> node-1 isi_smartconnect[5222]: FLXAPI: OP: FLXAPI_OP_CURRENT_STATE Pool[2:1:1:1]: subnet0 zones: filer25.xxx.com IP[18]: 10.x.x.21:up IP[18]: 10.x.x.54:up IP[17]: 10.x.x.32:up IP[17]: 10.x.x.56:up IP[17]: 10.x.x.30:up IP[16]: 10.x.x.37:up IP[16]: 10.x.x.39:up IP[16]: 10.x.x.45:up IP[15]: 10.x.x.29:up IP[15]: 10.x.x.33:up IP[15]: 10.x.x.49:up IP[14]: 10.x.x.31:up IP[14]: 10.x.x.34:up IP[13]: 10.x.x.38:up IP[13]: 10.x.x.40:up IP[13]: 10.x.x.46:up IP[12]: 10.x.x.41:up IP[12]: 10.x.x.36:up IP[10]: 10.x.x.53:up IP[10]: 10.x.x.43:up IP[9]: 10.x.x.44:up IP[9]: 10.x.x.28:up IP[8]: 10.x.x.51:up IP[8]: 10.x.x.26:up IP[7]: 10.x.x.55:up IP[7]: 10.x.x.35:up IP[6]: 10.x.x.42:up IP[6]: 10.x.x.24:up IP[5]: 10.x.x.52:up IP[5]: 10.x.x.25:up IP[4]: 10.x.x.48:up IP[4]: 10.x.x.50:up IP[3]: 10.x.x.22:up IP[3]: 10.x.x.27:up IP[2]: 10.x.x.47:up IP[2]: 10.x.x.23:up

Solmun 10 MAC-osoite on ec:0d:xx:xx:c0:80.

node-10: mlxen0: flags=8843<UP,BROADCAST,RUNNING,SIMPLEX,MULTICAST> metric 0 mtu 1500
node-10: options=d07bb<RXCSUM,TXCSUM,VLAN_MTU,VLAN_HWTAGGING,JUMBO_MTU,VLAN_HWCSUM,TSO4,TSO6,LRO,VLAN_HWFILTER,VLAN_HWTSO,LINKSTATE>
node-10: ether ec:0d:xx:xx:c0:80
node-10: inet 10.x.x.43 netmask 0xffffff00 broadcast 10.x.x.255 zone 1 
node-10: nd6 options=29<PERFORMNUD,IFDISABLED,AUTO_LINKLOCAL>
node-10: media: Ethernet autoselect (40Gbase-CR4 <full-duplex,rxpause,txpause>)
node-10: status: active

Solmun 1 ARP-merkintä yhdistettiin virheelliseen (vanhaan) MAC-osoitteeseen. Tämän seurauksena mikään asiakas tai solmu ei pysty muodostamaan IP-osoitetta, ennen kuin se on korjattu.

Cause

PowerScale Network Design Aspects
-https://infohub.delltechnologies.com/es-es/t/dell-powerscale-network-design-considerations/ SmartConnect-vyöhyke, joka mahdollistaa IP-osoitteiden dynaamisen varauksen,

siirtää vikaantuneen solmun IP-osoitteen välittömästi johonkin klusterin kolmesta muusta solmusta. Se lähettää useita ilmaisia osoitteenselvitysprotokollia (ARP) liitetylle kytkimelle, jotta asiakkaan I/O jatkuu keskeytyksettä."

Saman aliverkon isännät eivät vastaanottaneet GARP (Gratuitous ARP) -paketteja solmusta 10 IP-osoitteen määrittämisen jälkeen. Siten ARP-merkintää ei päivitetty oikein isännissä, mikä johtaa verkkoyhteysongelmaan. Syynä on, että ARP-lähetykset joko pudotetaan tai estetään verkkotasolla. Cisco Application Centric Infrastructure (ACI) on vaikuttanut näihin ongelmiin virheellisten määritysten vuoksi.

Resolution

Ratkaisu:

Pitkän aikavälin ratkaisuna "Ilmainen ARP-tulva" on otettava käyttöön kytkimen puolella.

Seuraavissa tietämyskannan artikkeleissa kuvataan (yksityiskohtaisesti) Cisco ACI:n kumulatiiviset suositukset.

Kiertotapa:

Voit kiertää ongelman poistamalla tarpeettoman ARP-merkinnän komennolla arp -d isännissä, joita ongelma koskee. Isännät lähettävät uuden ARP-resoluutiopyynnön IP: lle ja päivittävät ARP-taulukkonsa päivitetyllä MAC-osoitteella.

Additional Information

Ongelman vianmääritys jatkuu pakettien sieppauksella kaikissa PowerScale-solmuissa ja asiakaskoneissa. Tämä osoittaa, että solmu vastaanotti GARP-paketit suunnitellusti. Ongelman kokenut isäntä ei kuitenkaan vastaanottanut GARP-paketteja.

Kun IP 10.x.x.43 siirrettiin solmuun 10, solmu 10 todellakin lähetti GARP-paketit IP 10.x.x.43:een.

[~]$ tshark -t ad -r node-10_mlxen0.pcap | grep ARP | grep Gratui
3781 2018-11-15 16:06:47.711230 ec:0d:xx:xx:c0:80 Broadcast ARP 42 Gratuitous ARP for 10.x.x.43 (Request)
3783 2018-11-15 16:06:47.753820 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3784 2018-11-15 16:06:47.753841 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3791 2018-11-15 16:06:48.823611 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3792 2018-11-15 16:06:48.823633 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3799 2018-11-15 16:06:49.835902 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3800 2018-11-15 16:06:49.835926 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3807 2018-11-15 16:06:50.933966 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3808 2018-11-15 16:06:50.934000 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3815 2018-11-15 16:06:52.034005 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3816 2018-11-15 16:06:52.034048 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3824 2018-11-15 16:06:53.084292 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3825 2018-11-15 16:06:53.084343 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3832 2018-11-15 16:06:54.134719 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3833 2018-11-15 16:06:54.134764 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3840 2018-11-15 16:06:55.222125 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3841 2018-11-15 16:06:55.222171 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3848 2018-11-15 16:06:56.283997 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3849 2018-11-15 16:06:56.284023 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3856 2018-11-15 16:06:57.370114 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)
3857 2018-11-15 16:06:57.370142 ec:0d:xx:xx:c0:80 Broadcast ARP 60 Gratuitous ARP for 10.x.x.43 (Request)

Pakettisieppaus osoittaa, että solmu 1 ei vastaanottanut GARP-paketteja IP 10.x.x.43: n liikkumiseen liittyen.

[~]$ tshark -t ad -r node-1_mlxen1.pcap | grep -i arp | grep Gratuitous | grep 10.x.x.43
[~]$

Pakettisieppaus osoittaa, että asiakas ei myöskään vastaanottanut GARP-paketteja.

[~]$ tshark -t ad -r client.pcap | grep ARP | grep Gratuitous | grep 10.x.x.43
[~]$

Kun isännät eivät vastaanota GARP-paketteja, niiden ARP-taulukon merkintöjä IP 10.x.x.43: lle ei päivitetty. Ne on edelleen yhdistetty väärään MAC : hen ec: 0d: xx: xx: c5: 00. Siten he eivät päässeet IP 10.x.x.43: een.

Affected Products

Isilon

Products

Isilon A2000, Isilon F800, Isilon F810, Isilon Gen6, Isilon H400, Isilon H500, Isilon H5600, Isilon H600, Isilon HD400, Isilon IQ 10000X-SSD, Isilon IQ 108000X, Isilon IQ 12000, Isilon IQ 12000X, Isilon IQ 1920i, Isilon IQ 3000X, Isilon IQ 32000X-SSD , Isilon IQ 36000X, Isilon IQ 5400S, Isilon IQ 6000X, Isilon IQ 72000X, Isilon IQ 9000X, Isilon IQ-Series, Isilon NL-Series, Isilon NL400, Isilon NL410, PowerScale OneFS, Isilon Performance Accelerator, Isilon S-Series, Isilon S200, Isilon S210, Isilon Scale-out NAS, Isilon SmartConnect, Isilon X-Series, Isilon X200, Isilon X210, Isilon X400, Isilon X410 ...
Article Properties
Article Number: 000056945
Article Type: Solution
Last Modified: 03 Jun 2025
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.