PowerFlex: Częste rozłączania MDM
Summary: Elementy PowerFlex, takie jak MDM, szybko i często się rozłączają i ponownie podłączają. Utracono połączenie, a następnie znaleziono połączenie w zdarzeniach MDM Nawiązywanie połączenia po 80–190 ms ...
Instructions
Objawy
Dzienniki zdarzeń MDM pokazujące częste rozłączanie i ponowne podłączanie składnika MDM:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
Dane wyjściowe SAR z rozłączającego się serwera MDM, pokazujące wysoką liczbę retransmisji TCP:
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Wpływ
Krótkie zdarzenia degradacji klastra MDM
Pogorszenie wydajności
Główny powód
Serwer MDM został poprawiony, a jądro Linuksa zostało uaktualnione z 3.x do 5.x. Ta aktualizacja jądra zmienia wiele domyślnych parametrów systemu operacyjnego na inne wartości. W tym przypadku wyłączono m.in. parametr TCP "net.ipv4tcp_fack", ale ten wydawał się powodować wysokie retransmisje TCP.
Plik RPM SDS zawiera plik konfiguracyjny o nazwie emc.conf w katalogu /opt/emc/scaleio/sds/cfg/. Ten plik zawiera wiele zalecanych parametrów systemu operacyjnego firmy Dell.
Jeśli jest to środowisko szafy serwerowej/urządzenia PowerFlex, PowerFlex Manager automatycznie skopiuje plik emc.conf z folderu "/opt/emc/scaleio/sds/cfg" do każdego pliku systcl.conf serwera i zastosuje go. Nastąpi to tylko podczas początkowego wdrożenia węzła. Istnieje możliwość, że plik sysctl.conf nie został poprawnie zaktualizowany. Jeśli plik sysctl.conf nie istnieje z poprawnymi wartościami, po aktualizacji jądra do wersji 5.x możliwe jest, że niektóre ważne parametry ulegną zmianie.
Obejście problemu
W środowisku szafy serwerowej/urządzenia PowerFlex, jeśli plik sysctl.conf nie zawiera wszystkich parametrów pliku emc.conf, zaleca się skopiowanie pliku emc.conf do każdego pliku /etc/sysctl.conf serwera. Aby zastosować zmiany na serwerze. Serwer może zostać ponownie uruchomiony lub można uruchomić polecenie "sysctl -p", aby zastosować zmiany z pliku /etc/sysctl.conf. Upewnij się, że podczas wprowadzania tych zmian zastosowano odpowiednie najlepsze praktyki konserwacyjne.
Firma Dell Technologies zaleca zastosowanie tych parametrów systemu Linux do każdego z serwerów, ale ostatecznie zależy to od firmy. W razie jakichkolwiek pytań skontaktuj się z dostawcą systemu operacyjnego, aby poznać najlepsze praktyki.
Wersje, których dotyczy problem
Wszystkie wersje PowerFlex