RecoverPoint for Virtual Machine: Smyčka skupiny konzistence mezi inicializací a chybovým stavem v prostředí škálování
Summary: RecoverPoint for Virtual Machine: Smyčka skupiny konzistence mezi inicializací a chybovým stavem v prostředí škálování
Symptoms
k dispozici Smyčka skupiny konzistence mezi inicializačním a chybovým stavem v prostředí
škálování způsobující nedostupnost replikace dat (DRU).
Příznaky zjištěné v protokolech:
Protokoly rozdělovače ESX:
Níže uvedené protokoly značí, že čtení souboru /vmfs/volumes/vsan:5xxxxxxxxxx-dxxxxxxxxxxxxxxxxxxx se nezdařilo, takže všechny svazky RPVS v síti VSAN budou odstraněny.
spl_esx_discover_RPvStorage_clusters_in_datastore: Nepodařilo se přečíst adresář /vmfs/volumes/vsan:5xxxxxxxxxxxxxxxxxxxxxx-dxxxxxxxxxxxxxxxx, vráceno se stavem Časový limit
update_rpvs_db: Jednotka LUN 1 nebyla při posledním zařízení zkontrolována. RPVS_ClusterLuns_removeLunInfo aktualizace
zobrazení: volá se pro LUN = 1 (název RPVS_Lun00001.vmdk). ID clusteru = 2xxxxxxxxxxxx
update_rpvs_db: Jednotka LUN 12 nebyla při poslední aktualizaci
zobrazení zařízení zkontrolována. RPVS_ClusterLuns_removeLunInfo: volala se pro LUN=12 (název RPVS_Lun00012.vmdk). ID clusteru = 2xxxxxxxxxxx
update_rpvs_db: Jednotka LUN 13 nebyla při poslední aktualizaci zobrazení zařízení zkontrolována...
* Proces zjišťování RPVS proběhne úspěšně, a proto se všechny svazky RPVS přidají zpět:
parse_vmdk_file: volá se souborem /vmfs/volumes/vsan:5xxxxxxxxxxxxxxxx/RPvStorage/4xxxxxxxxxxx/RPVS_Lun00001.vmdk
parse_vmdk_file: capacity=12000000, thinLun=0, flat_filename=RPVS_Lun00001-flat.vmdk, rawguid=0x6xxxxxxxxxxxxxxxxxx
RPVS_ClusterLuns_addLunInfo: Přidán LUN 1, cluster 4xxxxxxxxxxxxxxxx parse_vmdk_file: Volá se se souborem /vmfs/volumes/vsan:5xxxxxxxxxxxxxx-dxxxxxxxxxxxxxxxx/RPvStorage_23d5fb88838940xxx_010/RPVS_Lun00012.vmdk parse_vmdk_file: capacity=524288000, thinLun=0, flat_filename=RPVS_Lun00012-flat.vmdk, rawguid=0x6xxxxxxxxxxxxxxxx RPVS_ClusterLuns_addLunInfo: Přidán LUN 12, cluster 2xxxxxxxxxxxxxxx
* Protokol značí, že proces zjišťování RPVS trvá dlouho.
CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 32585607 mikrosekundách, počet příkazů ve frontě: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 33277695 mikrosekund, počet příkazů ve frontě: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 35834242 mikrosekund, num příkazů ve frontě: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 36488014 mikrosekundách, počet příkazů ve frontě: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 37767728 mikrosekund, počet příkazů ve frontě: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 49355575 mikrosekund, počet příkazů ve frontě: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), doba chodu 109257427 mikrosekund, počet příkazů ve frontě: 19
Dotčené všechny verze RP4VM
Cause
Rozdělovač ESX vyhledává svazek RPVS (žurnál a úložiště) každé t_rpvsDiscoveryPeriodicTimerInterval (výchozí: 30) sekund.
Kontrola se provádí přečtením souboru /vmfs/volumes/ a procházením jednotlivých adresářů v něm vyhledáním souboru RPVS_LunXXXXX.vmdk
Svazek RPVS se nachází ve složce /vmfs/volumes/<datastore>/<cluster=id>/. V prostředí VSAN by se nacházel ve složce /vmfs/volumes/vsan:vsan-id<>/<cluster=id>/
Pokud čtení libovolného adresáře v adresáři /vmfs/volume/ selže (vypršení časového limitu, přechodná chyba atd.), dojde k odstranění všech svazků RPVS v adresáři, u kterého došlo k chybě.
Pokud se v následujících spuštěních podaří přečíst a najít soubor RPVS_LunXXXXX.vmdk, přidají se zpět odpovídající svazky RPVS.
To je důvod, proč se CG zacyklí mezi chybou a inicialitou.
Problém se zvětší, když velký počet hostitelů v síti VSAN současně čte adresáře v umístění /vmfs/volumes/.
Resolution
V každém hostiteli ESX v clusteru aktualizujte hodnotu t_rpvsDiscoveryPeriodicTimerInterval
v rozdělovači na náhodnou hodnotu mezi 180–600 sekundami a restartujte kdriver.
ESX Splitter Tweak najdete na adrese
/etc/kdriver/tweak/tweak.params.splitter nebo /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter.
Usnesení:
Technický tým společnosti Dell EMC v současné době tento problém zkoumá. Stále probíhá vytvoření trvalé opravy. Obraťte se na středisko zákaznické podpory Dell EMC nebo na zástupce technické podpory a uveďte ID tohoto řešení.