PowerScale: SyncIQ-replikointiongelmat, kun jumbo-kehykset on otettu käyttöön PowerScale-klustereissa
Summary: SyncIQ-replikointityöt voivat ajoittain epäonnistua SyncIQ-työntekijöiden uudelleenkäynnistysten ja verkkoon liittyvien virheiden vuoksi. Näitä ongelmia esiintyy usein ympäristöissä, joissa PowerScale-aliverkot on määritetty käyttämään jumbokehyksiä. Tietämyskannassa (KB) kuvataan menettelyt, joilla tarkistetaan, tukeeko päästä päähän -verkkoinfrastruktuuri jumbokehyksiä, kun IP-paketteja lähetetään IP-otsikossa asetettu "Älä fragmentoi" (DF) -lippu. Kun DF-bitti on käytössä, välilaitteet eivät pysty pirstomaan ylisuuria paketteja. Jos jokin verkkopolun segmentti ei tue määritettyä MTU-kokoa (yleensä 9 000 tavua jumbokehyksille), nämä paketit voidaan pudottaa, mikä voi johtaa SyncIQ-työprosessin virheisiin ja replikointityön epävakauteen. ...
Symptoms
SyncIQ-replikointi voi epäonnistua seuraavan virheen vuoksi: "SyncIQ policy failed. A work item has been restarted too many times."
- SyncIQ-työt, jotka replikoivat pieniä tietojoukkoja, suoritetaan yleensä onnistuneesti.
- Suuria tietojoukkoja sisältävät SyncIQ-työt voivat epäonnistua suorituksen aikana.
- Ilman salausta suoritettavat SyncIQ-replikointityöt onnistuvat, kun taas salausta käyttävät epäonnistuvat välittömästi.
Cause
Tämä ongelma voi ilmetä ajoittain tai satunnaisesti ympäristöissä, joissa dynaaminen reititys on käytössä. Tällaisissa tapauksissa SyncIQ-liikenne saatetaan joskus reitittää sellaisen verkkopolun kautta, joka ei tue pakettien pirstoutumista, mikä johtaa virheisiin.
Vianmääritys:
- Tarkista ping-komennolla, tukeeko verkkoinfrastruktuuri jumbokehyksiä testaamalla päästä päähän MTU-yhteensopivuutta.
ping komento lähdeklusterin replikointirajapinnasta kohdeklusterin replikointirajapintaan määrittämällä hyötykuorman kooksi 8972 tavua asettamatta Do Not Fragment (DF) -merkintää.
isi_for_array -n<lnn> 'ping -S <source-ip> -s 8972 <target-ip>'
source-1# isi_for_array -n1 'ping -c 4 -S xxx.xxx.xxx.xxx -s 8972 yyy.yyy.yyy.yyy'
source-1: PING yyy.yyy.yyy.yyy (10.0.1.231) from xxx.xxx.xxx.xxx: 8972 data bytes
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=0 ttl=64 time=0.944 ms
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=1 ttl=64 time=0.797 ms
source-1: 1528 bytes from yyy.yyy.yyy.yyy: icmp_seq=2 ttl=64 time=0.912 ms
Tulos osoittaa, ettäverkko läpäisee paketit onnistuneesti, kun "Do Not Fragment" (DF) -lippua ei ole asetettu, mikä viittaa siihen, että paketit voivat olla pirstoutuneet kuljetuksen aikana.
Voit tarkistaa jumbopakettien tuen lähettämällä ping-kutsun lähdeklusterin replikointiliittymästä kohdeklusterin replikointiliittymään Do Not Fragment -merkinnän ollessa käytössä, toimimalla seuraavasti:
isi_for_array -n<lnn> 'ping -S <source-ip> -D -s 8972 <target-ip>'
source-1# isi_for_array -n1 'ping -c 4 -S xxx.xxx.xxx.xxx -D -s 8972 yyy.yyy.yyy.yyy'
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
source-1: ping: sendto: Message too long
Tulos osoittaa, että pakettilähetys epäonnistuu, kun "Do Not Fragment" (DF) -bitti on asetettu, mikä viittaa mahdollisiin MTU-rajoituksiin tai ongelmiin polun MTU-tunnistuksessa.
- Käyttö
tracerouteMTU-testauksella, jotta voidaan tunnistaa keskitason verkkohypyt, jotka eivät välttämättä tue jumbokehyksiä.
Testaus, joka määrittää hyötykuorman kooksi 8972 tavua ja jossa "Do Not Fragment" (DF) -merkintä on irrotettu.
isi_for_array -n<lnn> 'traceroute -s <source-ip> -p 5667 <target-ip> 8972'
source-1# isi_for_array -n1 'traceroute -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972' traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets 1 example.name.internal (aaa.aaa.aaa.aaa) 0.577 ms 0.470 ms 0.472 ms 2 bbb.bbb.bbb.bbb (bbb.bbb.bbb.bbb) 24.810 ms ccc.ccc.ccc.ccc (ccc.ccc.ccc.ccc) 23.418 ms 23.366 ms 3 yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) 23.639 ms 23.596 ms 23.608 ms
Tulos osoittaa, että traceroute-testi suoritettiin onnistuneesti, kun Do Not Fragment (DF) -lippua ei asetettu.
source-1# isi_for_array -n1 'traceroute -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972' traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets 1 * * * 2 * * * 3 yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) 23.661 ms 23.618 ms 23.743 ms
Tulos osoittaa, että jäljitysreittitesti suoritettiin onnistuneesti, kun DF-merkintää (Do Not Fragment) ei asetettu, mutta pirstoutumisindikaattoreita havaittiin verkkopolun varrella .
Testaus, jonka määrittämällä 8972 tavun hyötykuormakooksi määritetään "Do Not Fragment" (DF) -merkintä.
isi_for_array -n<lnn> 'traceroute -F -s <source-ip> -p 5667 <target-ip> 8972'
source-1# isi_for_array -n1 'traceroute -F -s xxx.xxx.xxx.xxx -p 5667 yyy.yyy.yyy.yyy 8972'
traceroute to yyy.yyy.yyy.yyy (yyy.yyy.yyy.yyy) from xxx.xxx.xxx.xxx, 64 hops max, 8972 byte packets
traceroute: sendto: Message too long
1 traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
*traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
*traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
*
traceroute: sendto: Message too long
2 traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
*traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
*traceroute: sendto: Message too long
traceroute: wrote yyy.yyy.yyy.yyy 8972 chars, ret=-1
*
Tulos ilmaisee, että jäljitysreitti kohteeseen epäonnistui, mikä viittaa mahdollisiin MTU-rajoituksiin tai pirstoutumisongelmiin verkkopolun varrella.
Resolution
Kiertotapa:
- Jos SyncIQ-liikenteelle määritetyn PowerScale-aliverkon MTU on 9 000 tavua, on tärkeää varmistaa, että osallistuvien PowerScale-klustereiden välinen koko verkkopolku tukee täysin jumbokehyksiä.
- Jos osallistuvien PowerScale-klustereiden välinen verkkopolku ei tue jumbokehyksiä, varmista, että SyncIQ-liikenteelle varattuun PowerScale-aliverkkoon on määritetty 1 500 tavun MTU sekä lähde- että kohdejärjestelmässä.