VxRail: MTU check (ping with large packet size) (in inglese)
Summary: Questo articolo illustra la procedura di risoluzione dei problemi quando il controllo MTU (ping con pacchetti di grandi dimensioni) mostra un avviso.
Symptoms
Da cluster -> Monitoraggio -> vSAN
Cause
L'avviso di controllo MTU (ping con pacchetti di grandi dimensioni) può provenire da una MTU non corrispondente tra lo switch e l'ambiente vSphere.
Ciò che può causare un errore è se la vmknic ha una MTU di 9000 e quindi lo switch fisico applica una MTU di 1500. Ciò è dovuto al fatto che l'origine non frammenta il pacchetto e lo switch fisico lo scarta.
È noto anche che hardware di rete difettoso (sfp nodo, scheda di rete, cavo, porta switch/sfp) attiva l'avviso di controllo MTU (ping con pacchetti di grandi dimensioni).
Resolution
Procedura per la risoluzione dei problemi:
-
Controllare le dimensioni MTU sullo switch top-of-rack e su tutti i componenti vSphere; DVS, vmks, vmnics.
Se non sono stati rilevati problemi con le dimensioni MTU, andare al passaggio 2. -
Controllare le porte dello switch, esxi o entrambi gli host per verificare la presenza di errori crc.
Per ulteriori informazioni su questo test di controllo integrità, consultare https://kb.vmware.com/kb/2108285di riferimento.
Controllare le impostazioni MTU:
Controllare le impostazioni MTU dello switch top-of-rack in base alla documentazione del fornitore dello switch.
Controllare le impostazioni MTU di vSphere:
controllare l'impostazione MTU per il nodo/portgroup a cui si fa riferimento nel messaggio di avvertenza MTU:
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Controllare l'impostazione MTU per il DVS:
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Controllare la MTU sulle vmnic:
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Verificare la presenza di errori CRC:
Se la configurazione MTU risulta corretta, verificare la presenza di errori crc.
Per controllare gli errori CRC su uno switch, consultare la documentazione del fornitore dello switch per il comando appropriato.
Per Brocade, ad esempio:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Verificare la presenza di errori CRC sull host ESX:
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
Se vengono rilevati errori crc, aggiornare (rieseguire) il comando a intervalli di pochi secondi per verificare se gli errori crc stanno aumentando.
In caso affermativo, andare alla sezione Risoluzione dei problemi hardware di rete (sfp del nodo, cavo di rete, sfp switch/porta e così via) per isolare il problema su un componente specifico e sostituire il componente difettoso.
Una volta sostituito il componente difettoso, eseguire il comando precedente a intervalli di pochi secondi per verificare che gli errori crc non siano più incrementati.
Il contatore degli errori crc su esx viene cancellato con un riavvio, quindi anche se gli errori esistenti possono essere ancora presenti, l'importante è che smettano di aumentare.
Una volta risolto il problema, eseguire nuovamente i test di controllo integrità di vsan per verificare che l'avviso di controllo MTU (ping con pacchetti di grandi dimensioni) non sia più presente.