RecoverPoint for virtuell maskin: Konsistensgruppeløkking mellom init- og feiltilstand i et skalamiljø
Summary: RecoverPoint for virtuell maskin: Konsistensgruppeløkking mellom init- og feiltilstand i et skalamiljø
Symptoms
mellom init- og feiltilstand i et skalamiljø
Forårsaker datareplikering utilgjengelig (DRU).
Symptomer funnet i loggene:
ESX-splitterlogger:
Loggene nedenfor indikerer at lesing av /vmfs/volumes/vsan:5xxxxxxxxxxxx-dxxxxxxx mislyktes, så alle RPVS-volumer i VSAN blir fjernet.
spl_esx_discover_RPvStorage_clusters_in_datastore: Kunne ikke lese katalogen /vmfs/volumes/vsan:5xxxxxxxx-dxxxxxx, returnert med statusen Tidsavbrudd
update_rpvs_db: Lun 1 ble ikke skannet på siste enhetsvisningsoppdatering
RPVS_ClusterLuns_removeLunInfo: kalt for Lun=1 (navn RPVS_Lun00001.vmdk). Klynge-id=2xxxxxxxxxxxx
update_rpvs_db: Lun 12 ble ikke skannet på siste enhetsvisningsoppdatering
RPVS_ClusterLuns_removeLunInfo: kalt for Lun=12 (navn RPVS_Lun00012.vmdk). Klynge-id=2xxxxxxxxxxx
update_rpvs_db: Lun 13 ble ikke skannet på siste enhetsvisningsoppdatering ...
* RPVS oppdagelsesprosessen lykkes, derfor alle RPVS volumer er lagt tilbake:
parse_vmdk_file: called with file /vmfs/volumes/vsan:5xxxxxxxxxx/RPvStorage/4xxxxxxxxxxx/RPVS_Lun00001.vmdk
parse_vmdk_file: capacity=12000000, thinLun=0, flat_filename=RPVS_Lun00001-flat.vmdk, rawguid=0x6xxxx
RPVS_ClusterLuns_addLunInfo: added lun 1, cluster 4xxxxxxxx parse_vmdk_file: called with file /vmfs/volumes/vsan:5xxxxxxxx-dxxxxxx/RPvStorage_23d5fb88838940xxx_010/RPVS_Lun00012.vmdk parse_vmdk_file: capacity=524288000, thinLun=0, flat_filename=RPVS_Lun00012-flat.vmdk, rawguid=0x6xxxxxxxxxxxxxx RPVS_ClusterLuns_addLunInfo: added lun 12, cluster 2xxxxxxxxxxx
* Log som indikerer at RPVS-oppdagelsesprosessen har tatt lang tid
CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 32585607 mikrosekunder, num kommandoer i kø: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 33277695 mikrosekunder, num kommandoer i kø: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 35834242 mikrosekunder, num kommandoer i kø: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 36488014 mikrosekunder, num kommandoer i kø: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 37767728 mikrosekunder, num kommandoer i kø: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 49355575 mikrosekunder, num kommandoer i kø: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), kjøretid 109257427 mikrosekunder, num kommandoer i kø: 19
Berørte alle RP4VM-versjoner
Cause
ESX-splitter skanner etter RPVS-volum (journal og repositorium) hver t_rpvsDiscoveryPeriodicTimerInterval (standard: 30) sekunder.
Skanningen utføres ved å lese /vmfs/volumes/ og krysse hver katalog i den, på jakt etter RPVS_LunXXXXX.vmdk
Et RPVS-volum ligger i /vmfs/volumes/<datastore>/cluster=<id>/. I VSAN-miljøet vil den ligge i /vmfs/volumes/vsan:<vsan-id>/<cluster=id>/
Hvis lesing av en katalog i /vmfs/volumes/ mislykkes (tidsavbrudd, forbigående feil osv.), vil det føre til fjerning av alle RPVS-volumer i den mislykkede katalogen.
Hvis rpvs-oppdagelsesprosessen lykkes med å lese og finne RPVS_LunXXXXX.vmdk i alle etterfølgende kjøringer, blir de tilsvarende RPVS-volumene lagt til på nytt.
Dette er grunnen til at CG-ene går mellom Error og Init.
Problemet blir større når et stort antall verter i VSAN leser kataloger under /vmfs/volumes/ samtidig.
Resolution
I hver ESX-vert i klyngen oppdaterer du delingsjusteringsverdien for t_rpvsDiscoveryPeriodicTimerInterval
til tilfeldig verdi mellom 180 og 600 sekunder, og starter kdriveren på nytt.
ESX Splitter Tweak finner du på
/ etc / kdriver / tweak / tweak.params.splitter eller / etc / config / emc / rp / kdriver / tweak / tweak.params.splitter.
Resolusjon:
Dell EMC COR jobber for tiden med å undersøke dette problemet. En permanent korrigering pågår fortsatt. Kontakt kundestøttesenteret i Dell EMC eller servicerepresentanten din hvis du trenger hjelp, og oppgi denne løsnings-ID-en.