VxRail : vérification de la MTU (ping avec une taille de paquet volumineuse) (en anglais)
Summary: Cet article explique les étapes de dépannage lorsque la vérification MTU (ping avec une grande taille de paquet) affiche un avertissement.
Symptoms
À partir du cluster -> Surveiller -> vSAN
Cause
L’avertissement de vérification de la MTU (ping avec une grande taille de paquet) peut provenir d’une MTU incompatible entre le commutateur et l’environnement vSphere.
Cela peut provoquer une défaillance si vmknic a une MTU de 9000, puis que le commutateur physique applique une MTU de 1500. Cela est dû au fait que la source ne fragmente pas le paquet et que le commutateur physique abandonne le paquet.
Un matériel réseau défectueux (nœud SFP, carte réseau, câble, port de commutation/SFP) déclenche également l’avertissement de vérification de la MTU (ping avec une grande taille de paquet).
Resolution
Procédure de dépannage :
-
Vérifiez la taille de la MTU sur le commutateur haut de rack et sur tous les composants vSphere ; DVS, vmks, vmnics.
Si aucun problème n’a été trouvé avec la taille MTU, passez à l’étape 2. -
Recherchez des erreurs crc sur les ports du commutateur, ESXi ou les deux hôtes.
Consultez https://kb.vmware.com/kb/2108285pour plus d’informations sur ce test de bilan de santé.
Vérifiez les paramètres MTU :
Vérifiez les paramètres MTU du commutateur haut de rack conformément à la documentation du fournisseur du commutateur.
Vérifiez les paramètres MTU de vSphere :
vérifiez le paramètre MTU du nœud/groupe de ports référencé dans le message d’avertissement MTU :
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Vérifiez le paramètre MTU du DVS :
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Vérifiez la MTU sur les vmnics :
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Recherchez les erreurs crc :
Si la configuration MTU semble correcte, recherchez les erreurs crc.
Pour vérifier les erreurs crc sur un commutateur, consultez la documentation du fournisseur du commutateur pour connaître la commande appropriée.
Pour Brocade par exemple :
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Recherchez les erreurs crc sur l’hôte esx :
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
Si des erreurs crc sont détectées, actualisez (exécutez à nouveau) la commande toutes les quelques secondes pour voir si les erreurs crc s’incrémentent.
Si c’est le cas, accédez au dépannage du matériel réseau (nœud SFP, câble réseau, commutateur SFP/port, etc.) pour isoler le problème à un composant spécifique et remplacer le composant défectueux.
Une fois le composant défectueux remplacé, exécutez la commande ci-dessus toutes les quelques secondes pour confirmer que les erreurs crc ne s’incrémentent plus.
Le compteur d’erreurs crc sur esx est effacé avec un redémarrage, donc bien que les erreurs existantes puissent toujours être présentes, l’important est qu’elles cessent de s’incrémenter.
Une fois le problème résolu, exécutez à nouveau les tests de bilan de santé vSAN pour confirmer que l’avertissement de vérification de la MTU (ping avec une grande taille de paquet) n’est plus présent.