PowerFlex: extreem hoge netwerklatentie tussen SVM's wanneer NSX is geïnstalleerd
Summary: SVM's (maar ook gewone VM's en VMkernel-interfaces) kunnen een hoge netwerklatentie vertonen (tot een paar seconden) wanneer NSX is geïnstalleerd.
Symptoms
Scenario
NSX wordt geïnstalleerd op de ESXi-hosts die deelnemen aan het PowerFlex-cluster. Het verzamelen van NSX gedistribueerde firewallregelstatistieken wordt uitgevoerd en de NSX-versie ligt tussen 6.4.2-6.4.5.
Symptomen
Afhankelijk van de prestatie-impact veroorzaakt door NSX, kunnen de symptomen als volgt zijn:
- Hoge netwerklatentie tussen SVM's of ESXi-hosts tot enkele seconden:
- ESXi-hosts verliezen toegang tot PowerFlex-storage
- Af en toe losgekoppeld en opnieuw opbouwen van de SDS
- DU (DATA_FAILED) als meerdere SDS-servers gelijktijdig worden losgekoppeld
Cause
Impact
De impact kan variëren, van prestatieverlies en tijdelijk onvermogen om toegang te krijgen tot storage tot een volledig DU-scenario.
Hoofdoorzaak
In dit specifieke geval werd het probleem veroorzaakt door een NSX-bug die wordt beschreven in het VMware KB-artikel Intermitterende latentie bij gebruik van NSX 6.4.2 of hoger en een groot aantal Distributed Firewall-regels - Het verzamelen van statistieken over gedistribueerde firewallregels voor NSX introduceert een aanzienlijke vertraging in de vSphere-netwerkstack die van invloed is op alle VM's (inclusief SVM's) en VMkernel-interfaces.
Om u te laten weten, vergelijkbaar gedrag kan worden veroorzaakt door andere NSX-bugs of verkeerde configuratie, dus het is essentieel om NSX te bekijken met een VMware-expert.
Resolution
Tijdelijke oplossing
Een mogelijke tijdelijke oplossing is om PowerFlex SVM's toe te voegen aan de NSX-firewalluitsluitingslijst, maar VMware-netwerkexperts moeten worden geraadpleegd voordat u actie onderneemt.
Versies waarop dit van toepassing is
N.v.t. - geen PowerFlex-probleem
Opgelost in versie
N.v.t.