PowerFlex: Häufige MDM-Verbindungsabbrüche
Summary: PowerFlex-Komponenten wie der MDM werden schnell und häufig getrennt und wieder verbunden. Verbindung unterbrochen, gefolgt von Verbindung in MDM-Ereignissen gefunden; Verbindung wird nach 80–190 ms hergestellt ...
Instructions
Problem
MDM-Ereignisprotokolle, die häufiges Trennen und erneutes Verbinden der MDM-Komponente anzeigen:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
SAR-Ausgabe vom MDM-Server, der die Verbindung trennt und hohe TCP-Neuübertragungen anzeigt:
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Auswirkungen
Kurzzeitereignisse für heruntergestufte MDM-Cluster
Leistungsverschlechterung
Ursache
Der MDM-Server wurde gepatcht und der Linux-Kernel wurde von 3.x auf 5.x aktualisiert. Dieses Kernel-Upgrade ändert viele der Standard-BS-Parameter in andere Werte. In diesem Fall war unter anderem der TCP-Parameter "net.ipv4tcp_fack" deaktiviert, aber dieser schien die hohen TCP-Wiederholungen verursacht zu haben.
Der SDS-RPM stellt eine Konfigurationsdatei namens emc.conf im Verzeichnis /opt/emc/scaleio/sds/cfg/ bereit. Diese Datei enthält viele empfohlene Betriebssystemparameter von Dell.
Wenn es sich um eine PowerFlex Rack/Appliance-Umgebung handelt, kopiert PowerFlex Manager automatisch die Datei emc.conf von "/opt/emc/scaleio/sds/cfg" in die systcl.conf.conf der Server und wendet sie an. Dies geschieht nur bei der ersten Node-Bereitstellung. Es besteht die Möglichkeit, dass die sysctl.conf nicht ordnungsgemäß aktualisiert wurde. Wenn die Datei sysctl.conf nach einem Kernel-Upgrade auf 5.x nicht mit den richtigen Werten vorhanden ist, ist es möglich, dass sich einige wichtige Parameter ändern.
Problemumgehung
Wenn in einer PowerFlex Rack/Appliance-Umgebung die Datei sysctl.conf nicht alle Parameter von emc.conf enthält, wird empfohlen, die Datei emc.conf in jede Serverdatei /etc/sysctl.conf zu kopieren. So wenden Sie die Änderungen auf dem Server an. Der Server kann entweder neu gestartet werden oder der Befehl "sysctl -p" kann ausgeführt werden, um die Änderungen aus /etc/sysctl.conf zu übernehmen. Stellen Sie sicher, dass bei der Durchführung dieser Änderungen die richtigen Best Practices für die Wartung angewendet werden.
In einer reinen Softwareumgebung empfiehlt Dell Technologies, diese Linux-Parameter auf jeden Server anzuwenden, aber letztendlich ist dies Sache des Unternehmens. Wenden Sie sich an den Betriebssystemanbieter, um Best Practices zu erhalten oder Fragen zu haben.
Betroffene Versionen
Alle PowerFlex-Versionen