PowerFlex: Ekstremalnie duże opóźnienia sieciowe między SVM po zainstalowaniu NSX
Summary: Maszyny SVM (ale także zwykłe maszyny wirtualne i interfejsy VMkernel) mogą wykazywać duże opóźnienie sieci (do kilku sekund) po zainstalowaniu NSX.
Symptoms
Scenariusz
NSX jest instalowany na hostach ESXi biorących udział w klastrze PowerFlex. Zbieranie statystyk reguł NSX Distributed Firewall jest uruchomione, a wersja NSX mieści się w przedziale 6.4.2–6.4.5.
Objawy
W zależności od wpływu na wydajność spowodowanego przez NSX, objawy mogą być następujące:
- Wysokie opóźnienia sieciowe między maszynami SVM lub hostami ESXi, sięgające nawet kilku sekund:
- Hosty ESXi tracą dostęp do pamięci masowej PowerFlex
- Sporadyczne odłączenia i odbudowy SDS
- DU (DATA_FAILED) w przypadku jednoczesnego rozłączenia wielu serwerów SDS
Cause
Wpływ
Skutki mogą być różne — od spadku wydajności i tymczasowej niemożności uzyskania dostępu do pamięci masowej po scenariusz pełnego DU.
Główny powód
W tym konkretnym przypadku problem został spowodowany przez błąd NSX opisany w artykule bazy wiedzy VMware Sporadyczne opóźnienia podczas korzystania z NSX 6.4.2 lub nowszej oraz dużą liczbę reguł zapory rozproszonej — zbieranie statystyk reguł NSX Distributed Firewall wprowadza znaczne opóźnienie w stosie sieciowym vSphere, wpływając na wszystkie maszyny wirtualne (w tym SVM) i interfejsy VMkernel.
Aby poinformować, podobne zachowanie może być spowodowane innymi błędami NSX lub błędną konfiguracją, dlatego ważne jest, aby zapoznać się z NSX z ekspertem VMware.
Resolution
Obejście problemu
Potencjalnym tymczasowym rozwiązaniem jest dodanie maszyn wirtualnych PowerFlex do listy wykluczeń zapory NSX, ale przed podjęciem jakichkolwiek działań należy skonsultować się z ekspertami ds. sieci VMware.
Wersje, których dotyczy problem
Nie dotyczy — nie jest to problem związany z PowerFlex
Naprawiono w wersji
Nie dotyczy