Data Domain – Troubleshooting bei Netzwerkframe-Fehlern
Summary: Frame-Fehler in einer Netzwerkschnittstelle weisen auf ein Problem mit den Datenpaketen hin, wenn sie zwischen Ihrem Gerät und dem Netzwerk übertragen werden.
Symptoms
In diesem Artikel wird beschrieben, wie Sie Netzwerkframefehler in Data Domain beheben.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Framing-Fehler können auf verschiedene Faktoren zurückzuführen sein, die häufig auf potenzielle Hardware- oder Kompatibilitätsprobleme hinweisen. Einige häufige Ursachen sind:
- Kompatibilitätsproblem zwischen den beiden Transceivern, obwohl dies auch als Auswahl einer niedrigeren Geschwindigkeit bei Verwendung von Autoneg angezeigt werden kann.
- Synchronisierungsprobleme im Zusammenhang mit Nummer 1, die jedoch zwischen kompatiblen Transceivern auftreten können.
- Falscher Kabeltyp. Zum Beispiel die Verwendung eines InfiniBand-Kabels anstelle eines standardmäßigen, unterstützten Ethernetkabels.
- Ein fehlerhaftes Kabel
- Ein fehlerhafter Konnektor auf der Data Domain oder auf dem Switch.
- Der Hardware-Transceiver auf der Data Domain oder dem Switch ist fehlerhaft.
- Der Hardware-Transceiver ist von der falschen Art oder wird nicht unterstützt.
- Bei Kupfer können externe Signale Rauschen auf der Leitung verursachen und Framing-Fehler verursachen.
Resolution
Gehen Sie die acht oben aufgeführten Punkte durch, um zu sehen, ob eines dieser Elemente zu dem Problem beiträgt.
Öffnen Sie einen Fall mit Data Domain-Support für weiteres Troubleshooting, wenn keines dieser Elemente dieses Problem behebt.
Prüfen Sie auf Frame-Fehler in der vorherigen automatischen Unterstützung und in der Vergangenheit mit elysium.
- Frame-Fehler weisen auf eine fehlerhafte Komponente hin, z. B. ein defektes Kabel oder anschlussbare Transceiver mit kleinem Formfaktor.
- Wenn Tausende von Framefehlern vorliegen und die Schnittstelle Glasfaser ist, kann es sich um einen fehlerhaften Transceiver auf der dd-Seite, ein fehlerhaftes optisches Kabel oder einen fehlerhaften Transceiver auf der Kundenswitchseite handeln.
- Der Kunde ist für den Austausch von Kabeln und Transceivern auf seiner Seite verantwortlich.
- Wenn die Schnittstelle zeitweilig oder inaktiv ist und Frame-Fehler auftreten, müssen die Komponenten ausgetauscht werden.
- Framefehler tragen auch zu einer langsamen Performance bei, da Pakete mehrmals erneut übertragen werden müssen.
- Der Abschnitt net show configuration des automatischen Supports zeigt das Beispiel für Schnittstellenstatistiken unten mit einer Schnittstelle mit vielen Frame-Fehlern.
Der Befehl zum Auflisten der Schnittstellenstatistiken in der CLI lautet:
# net show config Additional Information
Auswirkungen von Frame-Fehlern auf die Data Domain-Performance
Frame-Fehler auf einer Netzwerkschnittstelle weisen auf beschädigte Ethernet-Frames hin, die häufig durch fehlerhafte Verkabelung, Duplexabweichungen oder Probleme mit der physischen Schicht verursacht werden. Diese Fehler zwingen den Netzwerkstapel, Pakete zu verwerfen und erneut zu übertragen, was einen kaskadierenden Effekt auf das Data Domain-System hat:
1. Erhöhte Anzahl von Neuübertragungen
- Jeder beschädigte Frame bedeutet, dass der Absender die Daten erneut senden muss.
- Bei Data Domain ist der Replikations- und Backupdatenverkehr sehr umfangreich und kontinuierlich. Erneute Übertragungen vervielfachen die Workload aus folgenden Gründen:
- Dieselben Datensegmente werden erneut von der Festplatte gelesen.
- Komprimierungs- und Deduplizierungslogik wird für erneut übertragene Blöcke erneut ausgeführt.
2. Höhere CPU- und Arbeitsspeicherauslastung
- Data Domain verwendet CPU-intensive Prozesse für:
- Deduplizierung (Fingerabdrucksegmente)
- Komprimierung
- Verschlüsselung (falls aktiviert)
- Wenn Frames fehlschlagen und Daten erneut gesendet werden, wiederholen sich diese Prozesse unnötigerweise und verbrauchen zusätzliche CPU-Zyklen und Arbeitsspeicher.
3. Dateisystembelastung
- Das DD-Dateisystem (DDFS) ist für sequenzielle Schreibvorgänge und Segmentabfragen optimiert.
- Erneute Übertragungen führen zu nicht-sequenziellen I/O-Mustern, die das Dateisystem zu Folgendem zwingen:
- Segmente erneut lesen.
- Hashes neu berechnen.
- Behalten Sie die Konsistenz für teilweise abgeschlossene Schreibvorgänge bei.
- Dies führt zu zusätzlichen Festplatten-Suchvorgängen und Cache-Auslastung, wodurch der Gesamtdurchsatz verlangsamt wird.
4. Erhöhung der Backupdauer
- Da der effektive Netzwerkdurchsatz sinkt (aufgrund von erneuten Übertragungen und Fehlern), dauern Backups viel länger.
- Das DD-System fühlt sich aus folgenden Gründen belastet:
- Pro bereitgestellter Dateneinheit wird mehr Arbeit geleistet.
- Netzwerkausfälle führen zu Pipeline-Ineffizienzen; Threads warten auf Daten, was die Latenz erhöht.
Fazit
Framefehler erzeugen einen Teufelskreis:
- Ungültige Frames → erneute Übertragungen → wiederholter Deduplizierung/Komprimierung → zusätzlicher Festplatten-I/O → CPU-Belastung → langsameren Backups.
Empfohlene Lösung
- Überprüfen Sie die Integrität des physischen Netzwerks:
- Tauschen Sie fehlerhafte Kabel aus.
- Überprüfen Sie die Geschwindigkeits- oder Duplexeinstellungen der Netzwerkschnittstellenkarte (NIC).
- Überwachen von Switchportfehlern.
- Stellen Sie sicher, dass die MTU-Einstellungen auf dem Pfad übereinstimmen.
- Wenn der Fehler weiterhin besteht, ziehen Sie Probleme mit der NIC oder der Switch-Hardware in Betracht.