VxRail: MTU-kontroll (ping med stor paketstorlek) (på engelska)
Summary: Den här artikeln beskriver felsökningsstegen när MTU-kontrollen (ping med stor paketstorlek) visar Varning.
Symptoms
Från kluster –> övervaka –> vSAN
Cause
MTU Check-varningen (ping med stor paketstorlek) kan komma från en felaktig MTU mellan switchen och vSphere-miljön.
Det som kan orsaka ett fel är om vmknic har ett MTU på 9000 och den fysiska switchen sedan tillämpar ett MTU på 1500. Det beror på att källan inte fragmenterar paketet och den fysiska växeln släpper paketet.
Felaktig nätverksmaskinvara (nod-SFP, nätverkskort, kabel, switchport/SFP) har också varit känd för att utlösa MTU Check-varningen (ping med stor paketstorlek).
Resolution
Felsökningssteg:
-
Kontrollera MTU-storleken på den övre rackswitchen och på alla vSphere-komponenter. DVS, vmks, vmnics.
Om du inte hittar några problem med MTU-storleken går du till steg 2. -
Kontrollera switchportarna, esxi eller båda värdarna för crc-fel.
Se https://kb.vmware.com/kb/2108285för mer information om detta hälsokontrolltest.
Kontrollera MTU-inställningarna:
Kontrollera MTU-inställningarna för den övre rackswitchen enligt switchleverantörens dokumentation.
Kontrollera MTU-inställningarna
för vSphere:Kontrollera MTU-inställningen för noden/portgruppen som refereras i MTU-varningsmeddelandet:
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Kontrollera MTU-inställningen för DVS:
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Kontrollera MTU på vmnics:
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Kontrollera om det finns crc-fel:
Om MTU-konfigurationen verkar vara ok kontrollerar du om det finns CRC-fel.
Information om hur du kontrollerar crc-fel på en switch finns i switchleverantörens dokumentation för rätt kommando.
För Brocade, till exempel:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Kontrollera om det finns crc-fel på esx-värden:
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
Om crc-fel hittas uppdaterar du kommandot med några sekunders mellanrum för att se om crc-felen ökar.
Om så är fallet går du till Felsöka nätverksmaskinvaran (nod-SFP, nätverkskabel, switch-SFP/port osv.) för att isolera problemet till en specifik komponent och byta ut den felaktiga komponenten.
När den felaktiga komponenten har bytts ut kör du kommandot ovan med några sekunders mellanrum för att bekräfta att CRC-felen inte längre ökar.
CRC-felräknaren på esx rensas med en omstart, så även om de befintliga felen fortfarande kan finnas är det viktiga att de slutar öka.
När problemet har lösts kör du vsan-hälsokontrolltesterna igen för att bekräfta att MTU-kontrollvarningen (ping med stor paketstorlek) inte längre finns.