PowerFlex: Hyppige MDM-afbrydelser
Summary: PowerFlex-komponenter som MDM afbrydes hurtigt og ofte igen. Mistet forbindelse efterfulgt af forbindelse fundet i MDM-hændelser Tilslutning efter 80-190 ms
Instructions
Symptomer
MDM-hændelseslogfiler, der viser MDM-komponentens hyppige afbrydelse og gentilslutning:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
Sar-output fra MDM-serveren, der afbryder forbindelsen og viser høje TCP-retransmissioner:
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Påvirkning
Kort beskrivelse af forringede hændelser i MDM-klyngen
Forringet ydeevne
Problem
MDM-serveren blev rettet, og Linux-kernen blev opgraderet fra 3.x til 5.x. Denne kerneopgradering ændrer mange af OS-standardparametrene til forskellige værdier. I dette tilfælde blev TCP-parameteren "net.ipv4tcp_fack" blandt andet deaktiveret, men denne syntes at have forårsaget de høje TCP-retransmissioner.
SDS RPM indeholder en konfigurationsfil kaldet emc.conf i mappen /opt/emc/scaleio/sds/cfg/. Denne fil indeholder mange anbefalede OS-parametre fra Dell.
Hvis dette er et PowerFlex Rack/Appliance-miljø, kopierer PowerFlex Manager automatisk filen emc.conf fra "/opt/emc/scaleio/sds/cfg" til hver af serverens systcl.conf og anvender den. Dette sker kun ved den indledende nodeimplementering. Der er mulighed for, at sysctl.conf ikke blev opdateret korrekt. Hvis filen sysctl.conf ikke findes med de korrekte værdier, er det muligt, at nogle vigtige parametre ændres efter en kerneopgradering til 5.x.
Løsning
Hvis sysctl.conf ikke indeholder alle de parametre, som emc.conf har i et PowerFlex-rack/apparat-miljø, anbefales det at kopiere emc.conf til hver server /etc/sysctl.conf-fil. For at anvende ændringerne på serveren. Serveren kan enten genstartes, eller kommandoen "sysctl -p" kan køres for at anvende ændringerne fra /etc/sysctl.conf. Sørg for, at der udføres korrekt bedste praksis for vedligeholdelse, når du foretager disse ændringer.
I et miljø, der kun er software, anbefaler Dell Technologies, at disse Linux-parametre anvendes på hver enkelt server, men i sidste ende er det op til virksomheden. Kontakt OS-leverandøren for at få oplysninger om bedste fremgangsmåder, eller hvis der er spørgsmål.
Påvirkede versioner
Alle PowerFlex-versioner