PowerFlex 4.X: Zpoždění opětovného připojení MDM kvůli vypršení časového limitu DNS
Shrnutí: V určitých prostředích může restartování uzlu MDM trvat přibližně 20 sekund, než se znovu připojí ke clusteru. K tomuto zpoždění dochází během inicializace ActiveMQ CMS, která je součástí spouštěcí sekvence MDM. Pokud je překlad názvů DNS pomalý nebo nesprávně nakonfigurovaný, inicializace CMS blokuje, dokud nevyprší časový limit vyhledávání DNS. ...
Příznaky
-
Po spuštění démona MDM se v protokolech zobrazí následující informace:
-
Události MDM – jiné MDM, které se začaly připojovat po 20 sekundách
2025/12/12 20:53:06.835 MDM_CLI_CONF_COMMAND_RECEIVED INFO Command SWITCH_MDM_OWNERSHIP received, User: 'admin'.
2025/12/12 20:53:27.065 REMOTE_SYSLOG_MODULE_INITIALIZED INFO Initialized the remote syslog module
2025/12/12 20:53:27.065 MDM_MANAGER_START INFO MDM started with the role of Manager
2025/12/12 20:53:27.133 MDM_CLUSTER_CONNECTED INFO The MDM, server-014 (ID 000000000000000e), connected after 2000ms
- V protokolech trasování MDM je možné během inicializace CMS pozorovat ~20sekundovou mezeru:
2025/12/12 20:53:07.022040 LOW:000000000000:mosTrcLayer_Create:00210: ---------- Process started. Version private PowerFlex R4_5.4000.111_Release, CodeBase , Feb 20 2025. PID 9138 ----------
2025/12/12 20:53:07.061777 LOW:7fe11c4fadb0:amqEventMgr_Init:00037: Starting AMQ CMS initialization <<<=======
2025/12/12 20:53:27.064872 LOW:7fe11c4fadb0:amqProducer_Create:00323: Creating events handler
2025/12/12 20:53:27.065210 LOW:7fe11c4fadb0:amqEventMgr_Init:00048: Finished AMQ CMS initialization <<<=======
Důsledky
Čas spuštění démona MDM se prodlouží, čímž se prodlouží doba potřebná k opětovnému připojení MDM ke clusteru. Toto zpoždění je možné pozorovat během operací, které restartují MDM, například:
- Přepnutí vlastnictví ve službě MDM
- Restart služby MDM
- Restart uzlu
- Další události, které aktivují restartování MDM
V důsledku toho bude mít paměť MDM_CLUSTER_CONNECTED se zobrazí přibližně 20 sekund po restartování, nikoli okamžitě.
Příčina
Když se démon MDM spustí a pokusí se znovu připojit ke clusteru, provede několik kroků interní inicializace, než začne fungovat. Jedním z těchto kroků je inicializace rámce událostí a oznámení (ActiveMQ CMS), který se používá pro systémové výstrahy a monitorování.
V současné době je tato inicializace:
- Synchronní
- Vyžadováno před navázáním členství v clusteru
Proto se uzel MDM nemůže připojit ke clusteru, dokud se nedokončí inicializace CMS. Pokud je překlad názvů DNS v uzlu pomalý nebo nesprávně nakonfigurovaný, může inicializace CMS čekat na vypršení časového limitu dotazů DNS, což má za následek přibližně 20sekundové zpoždění při spuštění.
Řešení
Ověřte, že konfigurace DNS a překlad názvů hostitelů na uzlech MDM fungují správně.
K testování výkonu překladu názvů hostitelů lze použít následující příkazy:
-
Ověřte latenci DNS:
Poznámka: Tyto kontroly proveďte na sekundárním uzlu MDM nebo neprimárním uzlu. Nespouštějte je v primárním uzlu MDM.time hostname -f time getent hosts $(hostname -f)Skutečný čas by měl být kratší než 1 sekunda.
Pokud příkazy trvají ~20 sekund nebo vyprší časový limit, značí to problém s překladem DNS.
-
Ověření konfigurace
DNSZkontrolujte nakonfigurovaný server DNS v/etc/resolv.conf-
Ověřte, zda je
nameserverPoložky existují. -
Ověřte, zda jsou nakonfigurované servery DNS dostupné.
Opravte konfiguraci DNS nebo nastavení překladu názvů hostitelů na dotčeném uzlu a znovu spusťte testy.
Poznámka: Tyto kontroly proveďte na sekundárním uzlu MDM nebo neprimárním uzlu. Nespouštějte je v primárním uzlu MDM. -
-
Ověření dostupnosti serveru DNS
Otestujte připojení ke konfigurovaným serverům DNS:
ping <dns_server_ip>
-
Znovu otestujte latenci DNS uvedenou v kroku 1.
-
Jakmile překlad DNS funguje správně, můžete provést test restartováním démona MDMn a otestovat, zda se MDM znovu připojí ke clusteru přibližně za několik sekund.
Poznámka: Restartování démona MDM provádějte pouze na sekundárním nebo pohotovostním MDM. Nerestartujte démona na primárním uzlu MDM. Stav clusteru můžete zkontrolovat pomocí 'scli --query_cluster'
Dotčené verze
PowerFlex 4.x
Opraveno ve verzi
Není k dispozici – problém s prostředím/konfigurací