Extrem hohe Netzwerklatenz zwischen den SVMs, wenn NSX installiert ist
Summary: SVMs (aber auch reguläre VMs und VMkernel-Schnittstellen) zeigen möglicherweise eine hohe Netzwerklatenz (bis zu einigen Sekunden) an, wenn NSX installiert ist.
Symptoms
Beispiel
NSX ist auf den ESXi-Hosts installiert, die Teil des PowerFlex-Clusters sind. Die Erfassung von NSX Distributed Firewall-Regelstatistiken wird ausgeführt und NSX-Version zwischen 6.4.2 und 6.4.5.
Problem
Je nach den durch NSX verursachten Leistungsbeeinträchtigungen können die folgenden Symptome auftreten:
- Hohe Netzwerklatenz zwischen SVMs oder ESXi-Hosts, die bis zu wenigen Sekunden reicht:
- ESXi-Hosts verlieren Zugriff auf PowerFlex-Storage
- Gelegentliche Trennungen und Neuerstellungen des SDS
- DU (DATA_FAILED), wenn mehrere SDSs gleichzeitig getrennt werden
Cause
Auswirkungen
Die Auswirkungen können variieren – von Leistungseinbußen und vorübergehender Unfähigkeit, auf Speicher zuzugreifen, bis hin zu einem vollständigen DU-Szenario.
Ursache
In diesem speziellen Fall wurde das Problem durch einen NSX-Fehler verursacht, der im VMware KB-Artikel Zeitweilige Latenz bei Verwendung von NSX 6.4.2 oder höher und eine große Anzahl von verteilten Firewallregeln – die Erfassung von NSX Distributed Firewall-Regelstatistiken beschrieben wird. Dies führt zu einer erheblichen Verzögerung im vSphere-Netzwerk-Stack, die sich auf alle VMs (einschließlich SVMs) und VMkernel-Schnittstellen auswirkt.
Ein ähnliches Verhalten kann durch andere NSX-Bugs oder Fehlkonfigurationen verursacht werden. Daher ist es wichtig, NSX mit einem VMware-Experten zu besprechen.
Resolution
Problemumgehung
Ein möglicher vorübergehender Workaround besteht darin, PowerFlex-SVMs zur NSX-Firewall-Ausschlussliste hinzuzufügen, aber vor dem Ergreifen von Maßnahmen sollten VMware-Netzwerkexperten konsultiert werden.
Betroffene Versionen
N/A – kein PowerFlex-Problem
Behoben in Version
N. z.