VxRail. проверка MTU (запрос ping с большим размером пакета)
Summary: В этой статье описаны действия по устранению неполадок, когда при проверке MTU (пинг с большим размером пакета) отображается предупреждение.
Symptoms
Кластер —> монитор —> vSAN
Cause
Предупреждение о проверке MTU (проверка связи с большим размером пакета) может быть вызвано несовпадением MTU между коммутатором и средой vSphere.
Причиной сбоя может быть ситуация, когда vmknic имеет MTU 9000, а затем физический коммутатор принудительно устанавливает MTU 1500. Это связано с тем, что исходный ресурс не фрагментирует пакет, а физический коммутатор отбрасывает пакет.
Известно также, что неисправное сетевое оборудование (модуль SFP узла, сетевая плата, кабель, порт коммутатора/SFP) вызывает предупреждение о проверке MTU (проверка связи с пакетом большого размера).
Resolution
Пошаговые инструкции по поиску и устранению неисправностей:
-
Проверьте размер MTU на ToR-коммутаторе и на всех компонентах vSphere. ДВС, ВМКС, ВМНИКС.
Если проблем с размером MTU не обнаружено, перейдите к шагу 2. -
Проверьте порты коммутатора, ESXi или оба хоста на наличие ошибок crc.
Дополнительные сведения об этом тесте для диагностики системы см. в https://kb.vmware.com/kb/2108285.
Проверьте настройки MTU:
Проверьте настройки MTU стоечного коммутатора верхнего уровня в соответствии с документацией поставщика коммутатора.
Проверьте настройку MTU vSphere.Проверьте
настройку MTU для узла/группы портов, на которую ссылается предупреждение MTU:
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Проверьте настройку MTU для DVS:
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Проверьте MTU на vmnics:
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Проверка наличия ошибок crc:
Если конфигурация MTU работает нормально, проверьте наличие ошибок crc.
Для проверки ошибок crc на коммутаторе см. документацию поставщика коммутатора для соответствующей команды.
Например, для Brocade:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Проверьте наличие ошибок crc на хосте esx:
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
При обнаружении ошибок crc обновляйте (повторяйте) команду каждые несколько секунд, чтобы проверить, увеличивается ли количество ошибок crc.
Если да, перейдите к устранению неисправностей сетевого оборудования (узла SFP, сетевого кабеля, SFP/порта коммутатора и т. д.), чтобы локализовать проблему в конкретном компоненте и заменить неисправный компонент.
После замены неисправного компонента выполняйте указанную выше команду каждые несколько секунд, чтобы убедиться, что ошибки crc больше не увеличиваются.
Счетчик ошибок crc на esx очищается при перезагрузке, поэтому, хотя существующие ошибки все еще могут присутствовать, важно, чтобы они перестали увеличиваться.
После устранения проблемы повторно запустите диагностику системы vsan, чтобы убедиться в отсутствии предупреждения о проверке MTU (проверка связи ping с большим размером пакета).