VxRail: MTU-kontrol (ping med stor pakkestørrelse)
Summary: Denne artikel forklarer fejlfindingstrinnene, når MTU-kontrollen (ping med stor pakkestørrelse) viser Advarsel.
Symptoms
Fra klynge –> skærm –> vSAN
Cause
Advarslen MTU Check (ping med stor pakkestørrelse) kan være fra en uoverensstemmende MTU mellem switchen og vSphere-miljøet.
Hvad der kan forårsage en fejl er, hvis vmknic har en MTU på 9000, og den fysiske switch derefter håndhæver en MTU på 1500. Dette skyldes, at kilden ikke fragmenterer pakken, og den fysiske switch taber pakken.
Defekt netværkshardware (node sfp, netværkskort, kabel, switchport / sfp) har også været kendt for at udløse MTU Check (ping med stor pakkestørrelse) advarsel.
Resolution
Fejlfindingstrin:
-
Kontrollér MTU-størrelsen på switchen øverst i racket og på alle vSphere-komponenter. DVS, vmks, vmnics.
Hvis der ikke blev fundet nogen problemer med MTU-størrelsen, skal du gå til trin 2. -
Kontroller switchporte, esxi eller begge værter for crc-fejl.
Se https://kb.vmware.com/kb/2108285for at få flere oplysninger om denne tilstandskontroltest.
Kontrollér MTU-indstillinger:
Kontrollér MTU-indstillingerne for switchen øverst i racket i henhold til leverandørdokumentationen for switchen.
Kontrollér vSphere MTU-indstillinger:
Kontrollér MTU-indstillingen for den node/portgruppe, der henvises til i MTU-advarselsmeddelelsen:
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Kontroller MTU-indstillingen for DVS:
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Kontroller MTU'en på vmnics:
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Kontroller for crc-fejl:
Hvis MTU-konfigurationen ser ud til at være ok, skal du kontrollere, om der er crc-fejl.
Hvis du vil kontrollere crc-fejl på en switch, skal du se dokumentationen til switchleverandøren for den relevante kommando.
For Brocade for eksempel:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Kontroller for crc-fejl på esx-vært:
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
Hvis der findes crc-fejl, skal du opdatere (genkøre) kommandoen hvert par sekunder for at se, om crc-fejlene øges.
Hvis det er tilfældet, skal du gå til fejlfinding af netværkshardwaren (node sfp, netværkskabel, switch sfp/port osv.) for at isolere problemet til en bestemt komponent og udskifte den defekte komponent.
Når den defekte komponent er blevet udskiftet, skal du køre ovenstående kommando med få sekunders mellemrum for at bekræfte, at crc-fejlene ikke længere øges.
CRC-fejltælleren på esx ryddes med en genstart, så selvom de eksisterende fejl stadig kan være til stede, er det vigtige, at de holder op med at stige.
Når problemet er løst, skal du køre vsan-tilstandstjekketestene igen for at bekræfte, at advarslen MTU-kontrol (ping med stor pakkestørrelse) ikke længere vises.