PowerScale: SyncIQ-replicatieproblemen wanneer jumboframes zijn ingeschakeld op PowerScale clusters

Summary: SyncIQ-replicatietaken kunnen af en toe mislukken als gevolg van het opnieuw opstarten van SyncIQ-medewerkers en netwerkgerelateerde fouten. Deze problemen worden vaak waargenomen in omgevingen waar PowerScale-subnetten zijn geconfigureerd voor het gebruik van jumboframes. De Knowledge Base (KB) beschrijft procedures om te valideren of de end-to-end netwerkinfrastructuur jumboframes ondersteunt wanneer IP-pakketten worden verzonden met de vlag "Do Not Fragment" (DF) in de IP-header. Wanneer de DF-bit is ingeschakeld, kunnen tussenliggende apparaten geen extra grote pakketten fragmenteren. Als een segment van het netwerkpad de geconfigureerde MTU-grootte niet ondersteunt (meestal 9000 bytes voor jumboframes), kunnen deze pakketten worden verwijderd, wat mogelijk kan leiden tot fouten in het SyncIQ-werkproces en instabiliteit van de replicatietaak. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

SyncIQ-replicatie kan mislukken met de volgende fout: "SyncIQ policy failed. A work item has been restarted too many times." 

 

  • SyncIQ-taken voor het repliceren van kleine datasets worden doorgaans met succes voltooid.
  • SyncIQ-taken met grotere datasets kunnen mislukken tijdens de uitvoering.
  • SyncIQ Replicatietaken zonder versleuteling slagen, terwijl die met versleuteling onmiddellijk mislukken.

Cause

Dit probleem kan af en toe optreden of willekeurig optreden in omgevingen waar dynamische routering is ingeschakeld. In dergelijke gevallen kan SyncIQ-verkeer af en toe worden gerouteerd via een netwerkpad dat pakketfragmentatie niet ondersteunt, wat leidt tot fouten.



Probleemoplossing:
 

  1. Gebruik de ping-opdracht om te controleren of de netwerkinfrastructuur jumboframes ondersteunt door end-to-end MTU-compatibiliteit te testen. 
     
Gebruik de ping opdracht van de replicatie-interface van het broncluster naar de replicatie-interface van het doelcluster, waarbij een payloadgrootte van 8972 bytes wordt opgegeven zonder de vlag 'Do Not Fragment' (DF) in te stellen.
   
        isi_for_array -n<lnn> 'ping -S <source-ip> -s 8972 <target-ip>'
source-1# isi_for_array -n1 'ping -c 4 -S xxx.xxx.xxx.xxx -s 8972 yyy.yyy.yyy.yyy'     
source-1: PING yyy.yyy.yyy.yyy (10.0.1.231) from xxx.xxx.xxx.xxx: 8972 data bytes
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=0 ttl=64 time=0.944 ms
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=1 ttl=64 time=0.797 ms
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=2 ttl=64 time=0.912 ms

            De uitvoer laat zien dathet netwerk met succes pakketten doorgeeft wanneer de vlag "Do Not Fragment" (DF) niet is ingesteld, wat suggereert dat pakketten tijdens het transport kunnen worden gefragmenteerd. 
   

 Volg deze stappen om jumbopakketondersteuning te verifiëren door een ping te verzenden van de replicatie-interface van het broncluster naar de replicatie-interface van het doelcluster met de vlag "Do Not Fragment" ingeschakeld: 
   
          isi_for_array -n<lnn> 'ping -S <source-ip> -D -s 8972 <target-ip>'  

source-1# isi_for_array -n1 'ping -c 4 -S xxx.xxx.xxx.xxx -D -s 8972 yyy.yyy.yyy.yyy'                                                 
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long

            De uitvoer laat zien dat de pakketoverdracht mislukt wanneer de "Do Not Fragment" (DF)-bit is ingesteld, wat wijst op mogelijke MTU-beperkingen of problemen met pad-MTU-detectie. 

 

OPMERKING: De pingtest moet worden uitgevoerd op alle netwerkpaden en op alle bron- en doelclusterinterfaces die betrokken zijn bij SyncIQ-replicatie.

 

  1. Gebruik traceroute met MTU-tests om tussenliggende netwerkhops te identificeren die mogelijk geen jumbo-frames ondersteunen. 

    Testen met het opgeven van een payloadgrootte van 8972 bytes met de vlag "Do Not Fragment" (DF) uitgeschakeld.

              isi_for_array -n<lnn> 'traceroute -s <source-ip> -p 5667 <target-ip> 8972'
source-1# isi_for_array -n1 'traceroute -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'                                              
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
 1  example.name.internal (aaa.aaa.aaa.aaa)  0.577 ms  0.470 ms  0.472 ms
 2  bbb.bbb.bbb.bbb (bbb.bbb.bbb.bbb)  24.810 ms
    ccc.ccc.ccc.ccc (ccc.ccc.ccc.ccc)  23.418 ms  23.366 ms
 3  yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy)  23.639 ms  23.596 ms  23.608 ms

            De output laat zien dat de traceroute-test met succes is voltooid terwijl de 'Do Not Fragment' (DF)-vlag niet was ingesteld.

source-1# isi_for_array -n1 'traceroute -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
 1  * * *
 2  * * *
 3  yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy)  23.661 ms  23.618 ms  23.743 ms

            Uit de output blijkt dat de traceroute-test met succes is voltooid wanneer de "Do Not Fragment" (DF)-vlag niet was ingesteld, maar fragmentatie-indicatoren werden waargenomen langs het netwerkpad. 
 

Testen met het opgeven van een payloadgrootte van 8972 bytes met de markering "Do Not Fragment" (DF).

     isi_for_array -n<lnn> 'traceroute -F -s <source-ip> -p 5667 <target-ip> 8972'

source-1# isi_for_array -n1 'traceroute -F -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
traceroute: sendto: Message too long
 1 traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *
traceroute: sendto: Message too long
 2 traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 *traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
 * 

           De uitvoer geeft aan dat de traceroute naar het doel is mislukt, wat wijst op mogelijke MTU-beperkingen of fragmentatieproblemen langs het netwerkpad.                     

Resolution

Tijdelijke oplossing:

  1. Als het PowerScale-subnet dat is aangewezen voor SyncIQ-verkeer is geconfigureerd met een MTU van 9000 bytes, is het van cruciaal belang om ervoor te zorgen dat het volledige netwerkpad tussen de deelnemende PowerScale-clusters jumboframes volledig ondersteunt.
  2. Als het netwerkpad tussen deelnemende PowerScale clusters geen jumboframes ondersteunt, moet u ervoor zorgen dat het PowerScale subnet dat is toegewezen aan SyncIQ-verkeer is geconfigureerd met een MTU van 1500 bytes op zowel het bron- als het doelsysteem.

 

OPMERKING: Het aanpassen van de MTU-instelling kan lopende datastromen onderbreken en kan van invloed zijn op services die afhankelijk zijn van consistente pakketbezorging, zoals SyncIQ-replicatie of NFS-bewerkingen. Het wordt aanbevolen om dergelijke wijzigingen tijdens een onderhoudsvenster uit te voeren. Zorg voor de juiste coördinatie en validatie in alle netwerksegmenten voordat u wijzigingen toepast.

Affected Products

Isilon

Products

Isilon, Isilon SyncIQ
Article Properties
Article Number: 000056217
Article Type: Solution
Last Modified: 27 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.