「VxRail:MTUチェック(大きなパケット サイズのping)(英語)」
Summary: この記事では、MTUチェック(大きなパケット サイズのping)に警告が表示される場合のトラブルシューティング手順について説明します。
Symptoms
クラスターから -> monitor -> vSAN
Cause
MTUチェック(大きなパケット サイズのping)警告は、スイッチとvSphere環境間のMTUの不一致が原因である可能性があります。
障害の原因となり得るのは、vmknicのMTUが9000で、物理スイッチがMTUを1500に設定した場合です。これは、送信元がパケットをフラグメント化せず、物理スイッチがパケットをドロップするためです。
障害のあるネットワークハードウェア(ノードSFP、ネットワークカード、ケーブル、スイッチポート/SFP)も、MTUチェック(大きなパケットサイズのping)警告をトリガーすることが知られています。
Resolution
トラブルシューティング手順:
-
トップオブラック スイッチとすべてのvSphereコンポーネントのMTUサイズを確認します。DVS、vmks、vmnics。
MTUサイズに問題がない場合は、手順2に進みます。 -
スイッチ ポート、ESXi、または両方のホストにCRCエラーがないか確認します。
このヘルス チェック テストの詳細については、 https://kb.vmware.com/kb/2108285を参照してください。
MTU設定の確認:
スイッチ ベンダーのドキュメントに従って、トップオブラック スイッチのMTU設定を確認します。
vSphere MTU設定の確認:
MTU警告メッセージで参照されているノード/ポートグループのMTU設定を確認します。
[vxrail@vxnode03:~] esxcfg-vmknic -l | grep vmk2 vmk2 16384 IPv4 192.168.121.3 255.255.255.0 192.168.121.255 00:50:56:6f:e3:c9 1500 65535 true STATIC defaultTcpipStack vmk2 16384 IPv6 fe80::250:56ff:fe6f:e3c9 64 00:50:56:6f:e3:c9 1500 65535 true STATIC, PREFERRED defaultTcpipStack
DVSのMTU設定を確認します。
[vxrail@vxnode03:~] esxcfg-vswitch -l DVS Name Num Ports Used Ports Configured Ports MTU Uplinks VMware HCIA Distributed Switch 4352 9 512 1500 vmnic1,vmnic0 DVPort ID In Use Client 0 1 vmnic0 1 1 vmnic1 2 0 3 0 4101 1 vmk1 8205 1 vmk0 16400 1 vmk2 8208 1 vmk3
vmnicsのMTUを確認します。
[vxrail@vxnode03:~] esxcfg-nics -l Name PCI Driver Link Speed Duplex MAC Address MTU Description vmnic0 0000:01:00.0 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:de 1500 Intel Corporation Ethernet Controller X540-AT2 vmnic1 0000:01:00.1 ixgbe Up 10000Mbps Full 2c:60:0c:af:ee:df 1500 Intel Corporation Ethernet Controller X540-AT2
CRCエラーを確認します:
MTU構成に問題がないと思われる場合は、CRCエラーを確認します。
スイッチのCRCエラーを確認するには、スイッチ ベンダーのマニュアルで適切なコマンドを参照してください。
たとえば、Brocadeの場合:
sw0# show int stats detail int Ten 2/0/34 Interface TenGigabitEthernet 2/0/34 statistics (ifindex 8993701921) RX TX Packets 7165702349 4603884761 Bytes 8633656075975 2910244530614 Unicasts 7154910149 4565459180 Multicasts 10782937 24109494 Broadcasts 9263 14316087 Errors 0 0 Discards 691 643 Overruns 0 Underruns 0 Runts 0 Jabbers 0 CRC 0 64-byte pkts 0 Over 64-byte pkts 932783488 Over 127-byte pkts 587058087 Over 255-byte pkts 19035776 Over 511-byte pkts 93628206 Over 1023-byte pkts 631386310 Over 1518-byte pkts 4901810482 Mbits/Sec 0.000000 0.000456 Packet/Sec 0 0 Line-rate 0.00% 0.00%
ESXホストでCRCエラーを確認します。
[vxrail@vxnode03:~] esxcli network nic stats get -n vmnic1 NIC statistics for vmnic1 Packets received: 135817879 Packets sent: 82253912 Bytes received: 156239259329 Bytes sent: 53856798358 Receive packets dropped: 0 Transmit packets dropped: 0 Multicast packets received: 637031 Broadcast packets received: 0 Multicast packets sent: 0 Broadcast packets sent: 0 Total receive errors: 32614 Receive length errors: 1866 Receive over errors: 0 Receive CRC errors: 32596 Receive frame errors: 0 Receive FIFO errors: 0 Receive missed errors: 0 Total transmit errors: 0 Transmit aborted errors: 0 Transmit carrier errors: 0 Transmit FIFO errors: 0 Transmit heartbeat errors: 0 Transmit window errors: 0
crcエラーが見つかった場合は、数秒ごとにコマンドを更新(再実行)して、crcエラーが増加しているかどうかを確認します。
その場合は、ネットワーク ハードウェア(ノードsfp、ネットワーク ケーブル、スイッチsfp/ポートなど)のトラブルシューティングに移動して、問題を特定のコンポーネントに切り分け、障害のあるコンポーネントを交換します
障害のあるコンポーネントを交換したら、数秒ごとに上記のコマンドを実行して、CRCエラーが増加していないことを確認します
esxのcrcエラー カウンターは再起動するとクリアされるため、既存のエラーがまだ存在する可能性がありますが、重要なことは、エラーの増加が停止することです
問題が解決したら、vSANヘルス チェック テストを再実行して、MTUチェック(大きなパケット サイズのping)警告が表示されなくなったことを確認します。