VxRail: verificação de MTU (ping com tamanho de pacote grande)
Summary: Este artigo explica as etapas de solução de problemas quando a verificação de MTU (ping com o tamanho do pacote grande) mostra Warning.
Symptoms
Do cluster -> monitor -> vSAN
Cause
O aviso de verificação de MTU (ping com tamanho de pacote grande) pode ser proveniente de uma MTU incompatível entre o switch e o ambiente vSphere.
O que pode causar uma falha é se a vmknic tiver uma MTU de 9000 e, em seguida, o switch físico impor uma MTU de 1500. Isso ocorre porque a origem não fragmenta o pacote e o switch físico descarta o pacote.
O hardware de rede com defeito (SFP do nó, placa de rede, cabo, porta do switch/SFP) também é conhecido por acionar o aviso MTU Check (ping com tamanho de pacote grande).
Resolution
Etapas para a solução de problemas:
-
Verifique o tamanho da MTU no switch topo de rack e em todos os componentes do vSphere; DVS, vmks, vmnics.
Se nenhum problema for encontrado com o tamanho da MTU, vá para a Etapa 2. -
Verifique se há erros de crc nas portas do switch, no ESXi ou em ambos os hosts.
Consulte https://kb.vmware.com/kb/2108285para obter mais informações sobre esse teste de verificação de integridade.
Verifique as configurações de MTU:
Verifique as configurações de MTU do switch topo de rack de acordo com a documentação do fornecedor do switch.
Verifique as configurações de MTU do vSphere:
verifique a configuração de MTU para o grupo de portas/nós mencionado na mensagem de aviso de MTU:
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
Verifique a configuração de MTU para o DVS:
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
Verifique a MTU nas vmnics:
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
Verifique se há erros de crc:
Se a configuração de MTU parecer estar ok, verifique se há erros crc.
Para verificar erros de crc em um switch, consulte a documentação do fornecedor do switch para obter o comando apropriado.
Para a Brocade, por exemplo:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
Verifique se há erros de CRC no host do ESX:
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
Se forem encontrados erros de crc, atualize (execute novamente) o comando a cada poucos segundos para ver se os erros crc estão aumentando.
Se estiverem, vá para a solução de problemas do hardware de rede (SFP do nó, cabo de rede, sfp/porta do switch e assim por diante) para isolar o problema em um componente específico e substituir o componente com falha.
Depois que o componente com defeito for substituído, execute o comando acima a cada poucos segundos para confirmar que os erros crc não estão mais aumentando.
O contador de erros de CRC no ESX é apagado com uma reinicialização, portanto, embora os erros existentes ainda possam estar presentes, o importante é que eles parem de incrementar.
Depois que o problema for resolvido, execute novamente os testes de verificação de integridade do vsan para confirmar se o aviso de verificação de MTU (ping com tamanho de pacote grande) não está mais presente.