Data Domain – Feilsøke feil på nettverksrammer
Summary: Rammefeil i et nettverksgrensesnitt indikerer et problem med datapakkene når de krysser mellom enheten og nettverket.
Symptoms
Denne artikkelen beskriver hvordan du feilsøker feil i nettverksrammer på Data Domain.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Innrammingsfeil kan komme fra ulike faktorer som ofte indikerer potensielle maskinvare- eller kompatibilitetsproblemer. Noen vanlige årsaker inkluderer:
- Kompatibilitetsproblem mellom de to transceiverne, selv om dette også kan vises som lavere hastighetsvalg når du bruker autoneg.
- Synkroniseringsproblemer, relatert til nummer 1, men det kan oppstå mellom kompatible sendere/mottakere.
- Feil kabeltype. For eksempel ved å bruke en InfiniBand-kabel i stedet for en standard, støttet Ethernet-kabel.
- En dårlig kabel
- En dårlig kobling på Data Domain eller på svitsjen.
- Maskinvaresender/mottaker på Data Domain eller svitsjen er dårlig.
- Maskinvaremottakeren er feil type eller støttes ikke.
- For kobber kan eksterne signaler forårsake støy på linjen og forårsake innrammingsfeil.
Resolution
Gå gjennom de åtte elementene som er oppført ovenfor for å se om noen av disse elementene bidrar til problemet.
Åpne en sak med Data Domain-støtte for mer feilsøking hvis ingen av disse elementene løser dette problemet.
Se etter rammefeil i forrige autostøtte og historisk med elysium.
- Rammefeil indikerer en defekt komponent, for eksempel en dårlig kabel eller pluggbare sender/mottakere med liten formfaktor.
- Hvis det er tusenvis av rammefeil og grensesnittet er Fiber, kan det være en dårlig transceiver på dd-siden, en dårlig optisk kabel eller en dårlig transceiver på kundebyttesiden.
- Kunden er selv ansvarlig for å skifte kabler og sender/mottakere på sin side.
- Hvis grensesnittet er periodisk eller nede, og det er rammefeil, må komponentene byttes ut.
- Rammefeil bidrar også til treg ytelse siden pakker må sendes på nytt flere ganger.
- Konfigurasjonsdelen for nettshow i den automatiske støtten viser eksemplet med grensesnittstatistikk nedenfor med et grensesnitt med mange rammefeil.
Kommandoen for å liste grensesnittstatistikken i CLI er:
# net show config Additional Information
Hvordan rammefeil påvirker Data Domain-ytelsen
Rammefeil på et nettverksgrensesnitt indikerer ødelagte Ethernet-rammer – ofte forårsaket av dårlig kabling, dupleksavvik eller problemer med fysiske lag. Disse feilene tvinger nettverksstakken til å slippe og sende pakker på nytt, noe som har en gjennomgripende effekt på Data Domain-systemet:
1. Økte resendinger
- Hver ødelagt ramme betyr at avsenderen må sende data på nytt.
- For Data Domain er replikerings- og sikkerhetskopieringstrafikken stor og kontinuerlig. Retransmisjoner multipliserer arbeidsbelastningen fordi:
- De samme datasegmentene leses fra disk igjen.
- Komprimerings- og dedupliseringslogikken kjøres på nytt for deler som sendes på nytt.
2. Høyere CPU- og minneutnyttelse
- Data Domain bruker CPU-intensive prosesser for:
- Deduplisering (segmenter med fingeravtrykk)
- Komprimering
- Kryptering (hvis aktivert)
- Når rammer svikter og data sendes på nytt, gjentas disse prosessene unødvendig og forbruker ekstra CPU-sykluser og minne.
3. Filsystemstamme
- DD-filsystemet (DDFS) er optimalisert for sekvensiell skriving og segmentoppslag.
- Retransmisjoner forårsaker ikke-sekvensielle I/O-mønstre, noe som tvinger filsystemet til å:
- Les segmentene på nytt.
- Beregn hashes på nytt.
- Oppretthold konsekvens for delvis fullførte skriveoperasjoner.
- Dette fører til ekstra disksøk og hurtigbuffertrykk, noe som reduserer den totale gjennomstrømningen.
4. Sikkerhetskopieringsvarigheten øker
- Fordi den effektive nettverksgjennomstrømningen synker (på grunn av nye overføringer og feil), tar sikkerhetskopier mye lengre tid.
- DD-systemet føles beskattet fordi:
- Det gjør mer arbeid per enhet av data levert.
- Nettverksboder forårsaker ineffektivitet i rørledningen; Tråder venter på data, noe som øker ventetiden.
Bunnlinjen
Rammefeil skaper en ond sirkel:
- Ugyldige rammer → nye sendinger → gjentatt deopp-/komprimering → ekstra I/O-→ CPU-belastning for disk → tregere sikkerhetskopiering.
Anbefalt løsning
- Kontroller fysisk nettverkstilstand:
- Bytt ut defekte kabler.
- Kontroller nettverksgrensesnittkortets hastighet (NIC) eller dupleksinnstillinger.
- Overvåk feil på svitsjporten.
- Kontroller at MTU-innstillingene samsvarer på tvers av banen.
- Hvis feilen vedvarer, bør du vurdere problemer med nettverkskortet eller bytte maskinvare.