VxRail: MTU-sjekk (ping med stor pakkestørrelse) (på engelsk)
Summary: Denne artikkelen forklarer feilsøkingstrinnene når MTU-kontrollen (ping med stor pakkestørrelse) viser Advarsel.
Symptoms
Fra klynge –> skjerm –> vSAN
Cause
MTU-kontrolladvarselen (ping med stor pakkestørrelse) kan være fra en MTU som ikke samsvarer mellom svitsjen og vSphere-miljøet.
Det som kan forårsake en feil er hvis vmknic har en MTU på 9000 og deretter den fysiske bryteren håndhever en MTU på 1500. Dette er fordi kilden ikke fragmenterer pakken, og den fysiske bryteren slipper pakken.
Defekt nettverksmaskinvare (node-SFP, nettverkskort, kabel, svitsjport/SFP) er også kjent for å utløse MTU-kontrolladvarselen (ping med stor pakkestørrelse).
Resolution
Feilsøkingstrinn:
-
Sjekk MTU-størrelsen på topp-of-rack-svitsjen og på alle vSphere-komponenter. DVS, vmks, vmnics.
Hvis det ikke oppdages problemer med MTU-størrelsen, går du til trinn 2. -
Kontroller bryterporter, ESXI eller begge vertene for CRC-feil.
Se https://kb.vmware.com/kb/2108285for mer informasjon om denne helsesjekktesten.
Kontroller MTU-innstillingene:
Kontroller MTU-innstillingene for svitsjer på toppen av racket i henhold til dokumentasjonen fra svitsjleverandøren.
Kontroller vSphere MTU-innstillinger:
Kontroller MTU-innstillingen for noden/portgruppen det refereres til i MTU-advarselsmeldingen:
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Kontroller MTU-innstillingen for DVS:
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Kontroller MTU på VMNIC-er:
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Se etter CRC-feil:
Hvis MTU-konfigurasjonen ser ut til å være ok, kan du se etter crc-feil.
Hvis du vil kontrollere CRC-feil på en svitsj, kan du se dokumentasjonen for svitsjleverandøren for riktig kommando.
For Brocade for eksempel:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Se etter CRC-feil på esx-vert:
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
Hvis crc-feil oppdages, oppdater (kjør på nytt) kommandoen med noen sekunders mellomrom for å se om crc-feilene øker.
Hvis de er det, kan du gå til feilsøke nettverksmaskinvaren (node-SFP, nettverkskabel, svitsj-SFP/-port og så videre) for å isolere problemet til en bestemt komponent og erstatte den defekte komponenten.
Når den defekte komponenten er erstattet, kjører du kommandoen ovenfor med noen sekunders mellomrom for å bekrefte at crc-feilene ikke lenger øker.
CRC-feiltelleren på esx fjernes med en omstart, så selv om de eksisterende feilene fortsatt kan være til stede, er det viktig at de slutter å øke.
Når problemet er løst, kjører du vsan Health Check-testene på nytt for å bekrefte at MTU-kontrolladvarselen (ping med stor pakkestørrelse) ikke lenger er til stede.