Data Domain — rozwiązywanie problemów z błędami ramki sieciowej
Summary: Błędy ramek w interfejsie sieciowym wskazują na problem z pakietami danych przechodzącymi między urządzeniem a siecią.
Symptoms
W tym artykule opisano sposób rozwiązywania problemów z błędami ramki sieciowej w Data Domain.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Błędy kadrowania mogą wynikać z różnych czynników, które często wskazują na potencjalne problemy ze sprzętem lub zgodnością. Niektóre typowe przyczyny to:
- Problem ze zgodnością między dwoma przekaźnikami, chociaż może to być również widoczne jako wybór niższej prędkości podczas korzystania z autoneg.
- Problemy z synchronizacją, związane z numerem 1, ale mogą wystąpić między zgodnymi przekaźnikami.
- Niewłaściwy typ kabla. Na przykład przy użyciu kabla InfiniBand zamiast standardowego, obsługiwanego kabla Ethernet.
- Uszkodzony kabel
- Nieprawidłowy łącznik w Data Domain lub na przełączniku.
- Sprzętowy przekaźnik w Data Domain lub przełączniku jest uszkodzony.
- Przekaźnik sprzętowy jest niewłaściwego rodzaju lub nie jest obsługiwany.
- W przypadku miedzi sygnały zewnętrzne mogą powodować szumy na linii i powodować błędy kadrowania.
Resolution
Przejrzyj osiem elementów wymienionych powyżej, aby sprawdzić, czy któryś z nich przyczynia się do problemu.
Otwórz zgłoszenie do pomocy technicznej Data Domain, aby uzyskać więcej informacji na temat rozwiązywania problemów, jeśli żaden z tych elementów nie rozwiązał tego problemu.
Sprawdź błędy ramek w poprzedniej automatycznej obsłudze i historycznie w elysium.
- Błędy ramki wskazują na wadliwy komponent, taki jak uszkodzony kabel lub podłączane urządzenia nadawczo-odbiorcze o małej wielkości.
- Jeśli występują tysiące błędów ramek, a interfejsem jest światłowód, może to być zły przekaźnik po stronie dd, zły kabel optyczny lub zły przekaźnik po stronie przełącznika klienta.
- Klient jest odpowiedzialny za wymianę kabli i przekaźników po swojej stronie.
- Jeśli interfejs jest niestabilny lub nie działa i występują błędy ramki, elementy należy wymienić.
- Błędy ramek również przyczyniają się do niskiej wydajności, ponieważ pakiety muszą być wielokrotnie przesyłane.
- Sekcja net show configuration automatycznej pomocy technicznej pokazuje poniższy przykład statystyk interfejsu z interfejsem z wieloma błędami ramek.
Polecenie do wyświetlenia statystyk interfejsu w interfejsie wiersza poleceń to:
# net show config Additional Information
Jak błędy ramek wpływają na wydajność urządzenia Data Domain
Błędy ramek w interfejsie sieciowym wskazują na uszkodzone ramki Ethernet — często spowodowane nieprawidłowym okablowaniem, niezgodnością dupleksu lub problemami z warstwą fizyczną. Błędy te wymuszają na stosie sieciowym odrzucanie i ponowne przesyłanie pakietów, co ma efekt kaskadowy w systemie Data Domain:
1. Zwiększona liczba retransmisji
- Każda uszkodzona ramka oznacza, że nadawca musi ponownie wysłać dane.
- W przypadku Data Domain ruch związany z replikacją i tworzeniem kopii zapasowych jest duży i ciągły. Retransmisje zwielokrotniają obciążenie, ponieważ:
- Te same segmenty danych są ponownie odczytywane z dysku.
- Ponowne uruchomienie logiki kompresji i deduplikacji dla retransmitowanych fragmentów.
2. Wyższe wykorzystanie procesora i pamięci
- Data Domain używa procesów intensywnie korzystających z procesora w następujących celach:
- Deduplikacja (odciski palców segmentów)
- Kompresja
- Szyfrowanie (jeśli włączone)
- Gdy ramki ulegają awarii i dane są ponownie wysyłane, procesy te powtarzają się niepotrzebnie, zużywając dodatkowe cykle procesora i pamięć.
3. Obciążenie systemu plików
- System plików DD (DDFS) jest zoptymalizowany pod kątem zapisu sekwencyjnego i wyszukiwania segmentów.
- Retransmisje powodują niesekwencyjne wzorce we/wy, wymuszając na systemie plików:
- Przeczytaj ponownie segmenty.
- Ponowne obliczanie skrótów.
- Zachowaj spójność częściowo ukończonych operacji zapisu.
- Prowadzi to do dodatkowego wyszukiwania dysku i wykorzystania pamięci podręcznej, spowalniając ogólną przepustowość.
4. Czas trwania kopii zapasowej wydłuża się
- Ponieważ efektywna przepustowość sieci spada (z powodu ponownych transmisji i błędów), tworzenie kopii zapasowych trwa znacznie dłużej.
- System DD czuje się obciążony, ponieważ:
- Wykonuje więcej pracy na jednostkę dostarczonych danych.
- Przestoje w sieci powodują nieefektywność rurociągów; Wątki czekają na dane, zwiększając opóźnienie.
Najważniejsze
Błędy ramek tworzą błędne koło:
- Nieprawidłowe ramki → retransmisje → powtarzającą się deduplikacją/kompresją → dodatkowym obciążeniem we/wy dysku → procesora → wolniejszym tworzeniem kopii zapasowych.
Zalecana poprawka
- Sprawdź kondycję sieci fizycznej:
- Wymień uszkodzone kable.
- Sprawdź ustawienia karty sieciowej (NIC) lub szybkości dupleksu.
- Monitoruj błędy portów przełączników.
- Upewnij się, że ustawienia MTU są takie same w całej ścieżce.
- Jeśli błędy nie ustąpią, rozważ problemy z kartą sieciową lub przełącznikiem sprzętowym.