Data Domain - Dépannage des erreurs de trame réseau
Summary: Les erreurs de trame dans une interface réseau indiquent un problème avec les paquets de données lorsqu’ils transitent entre votre appareil et le réseau.
Symptoms
Cet article explique comment résoudre les erreurs de trame réseau sur le système Data Domain.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Les erreurs de trame peuvent provenir de divers facteurs qui indiquent souvent des problèmes matériels ou de compatibilité potentiels. Voici quelques causes courantes :
- Problème de compatibilité entre les deux émetteurs-récepteurs, bien que cela puisse également se manifester par une sélection de vitesse inférieure lors de l’utilisation de l’autoneg.
- Des problèmes de synchronisation, liés au numéro 1, mais qui peuvent se produire entre des émetteurs-récepteurs compatibles.
- Type de câble incorrect. Par exemple, en utilisant un câble InfiniBand au lieu d’un câble Ethernet standard pris en charge.
- Un câble défectueux
- Un mauvais connecteur sur le système Data Domain ou sur le commutateur.
- L’émetteur-récepteur matériel du Data Domain ou du commutateur est défectueux.
- L’émetteur-récepteur matériel n’est pas du bon type ou n’est pas pris en charge.
- Pour le cuivre, les signaux externes peuvent provoquer du bruit sur la ligne et provoquer des erreurs de trame.
Resolution
Passez en revue les huit éléments répertoriés ci-dessus pour voir si l’un d’entre eux contribue au problème.
Ouvrez un incident auprès du support Data Domain pour un dépannage supplémentaire si aucun de ces éléments ne résout le problème.
Vérifiez les erreurs de trame dans le support automatique précédent et historiquement avec elysium.
- Les erreurs de trame indiquent un composant défectueux, tel qu’un câble défectueux ou des émetteurs-récepteurs enfichables de format compact.
- S’il y a des milliers d’erreurs de trame et que l’interface est en fibre, il peut s’agir d’un émetteur-récepteur défectueux du côté dd, d’un câble optique défectueux ou d’un émetteur-récepteur défectueux du côté du commutateur client.
- Le client est responsable du remplacement des câbles et des émetteurs-récepteurs de son côté.
- Si l’interface est intermittente ou en panne et qu’il existe des erreurs de trame, les composants doivent être remplacés.
- Les erreurs de trame contribuent également à ralentir les performances, car les paquets doivent être retransmis plusieurs fois.
- La section net show configuration de l’autosupport affiche l’exemple de statistiques d’interface ci-dessous avec une interface comportant de nombreuses erreurs de trame.
La commande permettant de répertorier les statistiques de l’interface dans l’interface de ligne de commande est la suivante :
# net show config Additional Information
Impact des erreurs de trame sur les performances de Data Domain
Les erreurs de trame sur une interface réseau indiquent une corruption des trames Ethernet, souvent causées par un mauvais câblage, des incompatibilités duplex ou des problèmes de couche physique. Ces erreurs forcent la pile réseau à abandonner et à retransmettre des paquets, ce qui a un effet en cascade sur le système Data Domain :
1. Retransmissions accrues
- Chaque trame corrompue signifie que l’expéditeur doit renvoyer des données.
- Pour Data Domain, le trafic de réplication et de sauvegarde est important et continu. Les retransmissions multiplient la charge applicative, car :
- Les mêmes segments de données sont à nouveau lus à partir du disque.
- Réexécutez la logique de compression et de déduplication pour les fragments retransmis.
2. Utilisation plus élevée du processeur et de la mémoire
- Data Domain utilise des processus gourmands en ressources de processeur pour :
- Déduplication (segments d’empreintes digitales)
- Compression
- Chiffrement (s’il est activé)
- Lorsque les trames échouent et que les données sont renvoyées, ces processus se répètent inutilement, consommant ainsi des cycles CPU et de la mémoire supplémentaires.
3. Contrainte du système de fichiers
- Le système de fichiers DD (DDFS) est optimisé pour les écritures séquentielles et les recherches de segments.
- Les retransmissions provoquent des schémas d’E/S non séquentiels, forçant le système de fichiers à :
- Relisez les segments.
- Recalculer les hachages.
- Maintenir la cohérence pour les écritures partiellement terminées.
- Cela entraîne des recherches de disque supplémentaires et une pression de cache, ce qui ralentit le débit global.
4. Augmentation de la durée des sauvegardes
- Étant donné que le débit réseau effectif diminue (en raison de retransmissions et d’erreurs), les sauvegardes prennent beaucoup plus de temps.
- Le système DD se sent taxé pour les raisons suivantes :
- Elle effectue plus de travail par unité de données fournie.
- Les blocages de réseau entraînent des inefficacités en matière de pipelines ; Les threads attendent les données, ce qui augmente la latence.
Conclusion
Les erreurs de trame créent un cercle vicieux :
- Les trames → les retransmissions incorrectes → les déduplications/compressions répétées → les E/S disque supplémentaires → sollicitent le processeur → les sauvegardes plus lentes.
Correctif recommandé
- Vérifiez l’intégrité du réseau physique :
- Remplacez les câbles défectueux.
- Vérifiez la vitesse de la carte d’interface réseau (NIC) ou les paramètres duplex.
- Surveillez les erreurs de port du commutateur.
- Assurez-vous que les paramètres MTU correspondent sur l’ensemble du chemin.
- Si les erreurs persistent, envisagez des problèmes matériels de carte NIC ou de commutateur.