PowerFlex: Hyppige MDM-frakoblinger
Summary: PowerFlex-komponenter, for eksempel MDM, kobles fra og kobles til igjen raskt og ofte. Mistet tilkobling etterfulgt av tilkoblet funnet i MDM-hendelser Tilkobling etter 80–190 ms
Instructions
Symptomer
MDM-hendelseslogger viser hyppig frakobling og tilkobling av MDM-komponenten på nytt:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
Sar-utdata fra MDM-serveren som kobles fra, viser høye TCP-overføringer:
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Innvirkning
Korte hendelser for degradert MDM-klynge
Redusert ytelse
Hovedårsak
MDM-tjeneren ble patchet, og Linux-kjernen ble oppgradert fra 3.x til 5.x. Denne kjerneoppgraderingen endrer mange av de standard OS-parametrene til andre verdier. I dette tilfellet ble TCP-parameteren "net.ipv4tcp_fack" deaktivert, blant andre, men denne så ut til å ha forårsaket de høye TCP-overføringene.
SDS RPM har en oppsettsfil kalt emc.conf i katalogen /opt/emc/scaleio/sds/cfg/. Denne filen inneholder mange anbefalte parametere for operativsystemet fra Dell.
Hvis dette er et PowerFlex Rack-/apparatmiljø, kopierer PowerFlex Manager automatisk emc.conf-filen fra "/opt/emc/scaleio/sds/cfg" til hver av serverens systcl.conf og bruker den. Dette skjer bare ved den første nodedistribusjonen. Det er mulighet for at sysctl.conf ikke ble oppdatert riktig. Hvis filen sysctl.conf ikke eksisterer med de riktige verdiene, etter en kjerneoppgradering til 5.x, er det mulig at noen viktige parametere vil endres.
Omgåelse av problemet
I et PowerFlex Rack/Appliance-miljø, hvis sysctl.conf ikke inkluderer alle parametrene som emc.conf har, anbefales det å kopiere over emc.conf til hver server /etc/sysctl.conf-fil. For å bruke endringene på serveren. Tjeneren kan enten startes på nytt, eller kommandoen "sysctl -p" kan kjøres for å bruke endringene fra /etc/sysctl.conf. Sørge for at riktig beste vedlikeholdspraksis utføres når du gjør disse endringene.
I et miljø med bare programvare anbefaler Dell Technologies at disse Linux-parametrene brukes på hver av serverne, men til syvende og sist er det opp til virksomheten. Kontakt leverandøren av operativsystemet for beste praksis eller hvis du har spørsmål.
Berørte versjoner
Alle PowerFlex-versjoner