Data Domain - Odstraňování problémů s chybami síťového rámce
Summary: Chyby rámců v síťovém rozhraní značí problém s datovými pakety, které procházejí mezi zařízením a sítí.
Symptoms
Tento článek popisuje, jak odstraňovat chyby síťového rámce v systému Data Domain.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Chyby rámců mohou pocházet z různých faktorů, které často naznačují potenciální problémy s hardwarem nebo kompatibilitou. Mezi běžné příčiny patří:
- Problém s kompatibilitou mezi dvěma transceivery, i když se může také projevit jako nižší výběr rychlosti při použití autonegu.
- Problémy se synchronizací související s číslem 1, ale může k nim dojít mezi kompatibilními transceivery.
- Nesprávný typ kabelu. Například použití kabelu InfiniBand místo standardního podporovaného ethernetového kabelu.
- Špatný kabel
- Vadný konektor v systému Data Domain nebo na přepínači.
- Hardwarový vysílač s přijímačem v systému Data Domain nebo přepínači je vadný.
- Hardwarový transceiver je nesprávného typu nebo není podporován.
- U mědi mohou externí signály způsobit šum na vedení a způsobit chyby rámování.
Resolution
Projděte si osm výše uvedených položek a zjistěte, zda některá z nich přispívá k problému.
Pokud žádná z těchto položek tento problém nevyřeší, otevřete případ s podporou Data Domain, kde získáte další informace.
Zkontrolujte, zda nedošlo k chybám rámců v předchozí automatické podpoře a historicky u elysia.
- Chyby rámce značí vadnou součást, například vadný kabel nebo zásuvné transceivery v provedení Small Form-Factor.
- Pokud dochází k tisícům chyb rámců a rozhraní je Fiber, může se jednat o vadný transceiver na straně dd, špatný optický kabel nebo špatný transceiver na straně přepínače zákazníka.
- Zákazník je zodpovědný za výměnu kabelů a transceiverů na své straně.
- Pokud je rozhraní přerušované nebo nefunguje a dochází k chybám rámců, je nutné komponenty vyměnit.
- Chyby rámce také přispívají ke snížení výkonu, protože pakety musí být přenášeny vícekrát.
- Část net show configuration automatické podpory zobrazuje níže uvedený příklad statistiky rozhraní s rozhraním s mnoha chybami rámců.
Příkaz pro výpis statistik rozhraní v rozhraní příkazového řádku:
# net show config Additional Information
Jak chyby rámců ovlivňují výkon datové domény
Chyby rámců v síťovém rozhraní značí poškozené ethernetové rámce – často způsobené špatnou kabeláží, neshodami duplexů nebo problémy s fyzickou vrstvou. Tyto chyby vynutí zahození a opětovný přenos paketů v síťovém zásobníku, což má kaskádový vliv na systém Data Domain:
1. Zvýšený počet opakovaných převodů
- Každý poškozený rámec znamená, že odesílatel musí data odeslat znovu.
- V případě systému Data Domain je provoz replikace a zálohování velký a nepřetržitý. Opakované přenosy znásobují pracovní zátěž, protože:
- Z disku se znovu načítají stejné datové segmenty.
- Logika komprese a deduplikace se opakuje pro znovu přenesené bloky.
2. Vyšší využití procesoru a paměti
- Systém Data Domain využívá procesy náročné na procesor pro:
- Deduplikace (segmenty digitální stopy)
- Komprese
- Šifrování (je-li povoleno)
- Když dojde k selhání rámců a opakovanému odeslání dat, tyto procesy se zbytečně opakují a spotřebovávají další cykly procesoru a paměť.
3. Kmen systému souborů
- Systém souborů DD (DDFS) je optimalizován pro sekvenční zápisy a vyhledávání segmentů.
- Opakované přenosy způsobují nesekvenční vzory I/O, což nutí systém souborů:
- Znovu si přečtěte segmenty.
- Přepočítejte hodnoty hash.
- Zachovejte konzistenci pro částečně dokončené zápisy.
- To vede k dalšímu vyhledávání disku a tlaku na cache, což zpomaluje celkovou propustnost.
4. Prodlužuje se doba zálohování
- Vzhledem k tomu, že efektivní propustnost sítě klesá (kvůli opakovaným přenosům a chybám), zálohování trvá mnohem déle.
- Systém DD je zdaněn, protože:
- Odvádí více práce na jednotku dodaných dat.
- Zastavení sítě způsobuje neefektivitu potrubí; Vlákna čekají na data, což zvyšuje latenci.
Sečteno a podtrženo
Chyby snímků vytvářejí začarovaný kruh:
- Chybné rámce → opakovaných přenosů → opakované odstranění duplicit/komprese → další vstupně-výstupní operace disku → procesoru zatěžují → pomalejší zálohování.
Doporučená oprava
- Kontrola stavu fyzické sítě:
- Vyměňte vadné kabely.
- Ověřte rychlost síťové karty (NIC) nebo nastavení duplexního režimu.
- Sledujte chyby portu přepínače.
- Ujistěte se, že se nastavení MTU shoduje v celé cestě.
- Pokud chyby přetrvávají, zvažte problémy se síťovou kartou nebo hardwarem přepínače.