Data Domain - Fejlfinding af netværksrammefejl
Summary: Rammefejl i en netværksgrænseflade indikerer et problem med datapakkerne, når de krydser mellem din enhed og netværket.
Symptoms
I denne artikel beskrives, hvordan du foretager fejlfinding af netværksrammefejl på Data Domain.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Indramningsfejl kan komme fra forskellige faktorer, der ofte indikerer potentielle hardware- eller kompatibilitetsproblemer. Nogle almindelige årsager omfatter:
- Kompatibilitetsproblem mellem de to transceivere, selvom dette også kan vises som valg af lavere hastighed, når du bruger autoneg.
- Synkroniseringsproblemer, relateret til nummer 1, men det kan forekomme mellem kompatible transceivere.
- Forkert kabeltype. For eksempel ved at bruge et InfiniBand-kabel i stedet for et standard, understøttet Ethernet-kabel.
- Et dårligt kabel
- Et defekt stik på Data Domain eller switchen.
- Hardwaretransceiveren på Data Domain eller switchen er dårlig.
- Hardware-transceiveren er af den forkerte slags eller understøttes ikke.
- For kobber kan eksterne signaler forårsage støj på linjen og forårsage indramningsfejl.
Resolution
Gå gennem de otte punkter, der er anført ovenfor, for at se, om nogen af disse elementer bidrager til problemet.
Åbn en sag hos Data Domain support for at få mere fejlfinding, hvis ingen af disse elementer løser problemet.
Kontroller for rammefejl i den tidligere automatiske support og historisk med elysium.
- Rammefejl indikerer en defekt komponent, såsom et dårligt kabel eller små formfaktor-pluggbare transceivere.
- Hvis der er tusindvis af rammefejl, og grænsefladen er fiber, kan det være en dårlig transceiver på dd-siden, et dårligt optisk kabel eller en dårlig transceiver på kundens switch-side.
- Kunden er ansvarlig for at udskifte kabler og transceivere på deres side.
- Hvis grænsefladen er intermitterende eller nede, og der er rammefejl, skal komponenterne udskiftes.
- Rammefejl bidrager også til langsom ydeevne, da pakker skal videresendes flere gange.
- Afsnittet net show configuration i autosupporten viser eksemplet med grænsefladestatistik nedenfor med en grænseflade med mange rammefejl.
Kommandoen til at liste grænsefladestatistikken i CLI er:
# net show config Additional Information
Sådan påvirker rammefejl Data Domains ydeevne
Rammefejl på en netværksgrænseflade indikerer beskadigede Ethernet-rammer – ofte forårsaget af dårlig kabelføring, dupleksuoverensstemmelser eller fysiske lagproblemer. Disse fejl tvinger netværksstakken til at droppe og videresende pakker, hvilket har en kaskadeeffekt på Data Domain-systemet:
1. Øgede retransmissioner
- Hver beskadiget ramme betyder, at afsenderen skal sende data igen.
- For Data Domain er replikerings- og sikkerhedskopieringstrafik tung og kontinuerlig. Retransmissioner mangedobler arbejdsbyrden, fordi:
- De samme datasegmenter læses igen fra disken.
- Komprimerings- og deduplikeringslogik genkøres for retransmitterede bidder.
2. Højere CPU- og hukommelsesudnyttelse
- Data Domain bruger CPU-intensive processer til:
- Deduplikering (fingeraftrykssegmenter)
- Komprimering
- Kryptering (hvis aktiveret)
- Når rammer fejler, og data sendes igen, gentages disse processer unødigt, hvilket bruger ekstra CPU-cyklusser og hukommelse.
3. Filsystembelastning
- DDFS-filsystemet (DDFS) er optimeret til sekventielle skrivninger og segmentopslag.
- Retransmissioner forårsager ikke-sekventielle I/O-mønstre, hvilket tvinger filsystemet til at:
- Læs segmenter igen.
- Genberegn hashes.
- Bevar ensartethed for delvist fuldførte skrivninger.
- Dette fører til ekstra disksøgninger og cache-tryk, hvilket bremser den samlede gennemstrømning.
4. Varigheden af sikkerhedskopieringen øges
- Da den effektive netværksgennemstrømning falder (på grund af gentransmissioner og fejl), tager sikkerhedskopier meget længere tid.
- DD-systemet føles beskattet, fordi:
- Det gør mere arbejde pr. leveret dataenhed.
- Netværksboder forårsager ineffektivitet i rørledningen; Tråde venter på data, hvilket øger latenstiden.
Hovedsagen er
Rammefejl skaber en ond cirkel:
- Dårlige billeder → retransmissioner → gentagen dedup/komprimering → ekstra disk I/O- → CPU-belastning → langsommere sikkerhedskopieringer.
Anbefalet rettelse
- Tjek det fysiske netværks tilstand:
- Udskift defekte kabler.
- Kontroller netværksinterfacekortets (NIC) hastighed eller dupleksindstillinger.
- Overvåg switch-portfejl.
- Sørg for, at MTU-indstillingerne stemmer overens på tværs af stien.
- Hvis fejlene fortsætter, skal du overveje problemer med netværkskort eller switchhardware.