RecoverPoint för virtuell maskin: Konsekvensgruppslinga mellan init- och feltillstånd i en skalningsmiljö
Summary: RecoverPoint för virtuell maskin: Konsekvensgruppslinga mellan init- och feltillstånd i en skalningsmiljö
Symptoms
Konsekvensgruppslinga mellan init- och feltillstånd i en skalningsmiljö
som orsakar datareplikering otillgänglig (DRU).
Symptom som finns i loggarna :
ESX splitter logs:
Loggarna nedan indikerar att läsning /vmfs/volumes/vsan:5xxxxxxxxxxx-dxxxxxxxxxxxxxxx misslyckades, så alla RPVS-volymer i VSAN tas bort.
spl_esx_discover_RPvStorage_clusters_in_datastore: Det gick inte att läsa katalogen /vmfs/volumes/vsan:5xxxxxxxxxxxxxxxxxxx-dxxxxxxxxxxxxxxxx, returnerad med statusen Timeout
update_rpvs_db: LUN 1 genomsöktes inte vid den senaste uppdateringen av enhetsvyn
RPVS_ClusterLuns_removeLunInfo: anropade LUN=1 (namn RPVS_Lun00001.vmdk). Kluster-id=2xxxxxxxxxxxx
update_rpvs_db: lun 12 genomsöktes inte vid den senaste uppdateringen
av enhetsvyn RPVS_ClusterLuns_removeLunInfo: anropade lun=12 (namn RPVS_Lun00012.vmdk). Kluster-id=2xxxxxxxxxxx
update_rpvs_db: lun 13 genomsöktes inte vid den senaste uppdateringen av enhetsvyn ...
* RPVS-identifieringsprocessen lyckas, vilket innebär att alla RPVS-volymer läggs till igen:
parse_vmdk_file: anropad med filen /vmfs/volumes/vsan:5xxxxxxxxxxxxxxxx/RPvStorage/4xxxxxxxxxxx/RPVS_Lun00001.vmdk
parse_vmdk_file: capacity=12000000, thinLun=0, flat_filename=RPVS_Lun00001-flat.vmdk, rawguid=0x6xxxxxxxxxxxxxxxxxxxxxx
RPVS_ClusterLuns_addLunInfo: Lun 1, kluster 4xxxxxxxxxxxxxxxx har lagts till parse_vmdk_file: anropad med filen /vmfs/volumes/vsan:5xxxxxxxxxxxxxxx-dxxxxxxxxxxxxxxxx/RPvStorage_23d5fb88838940xxx_010/RPVS_Lun00012.vmdk parse_vmdk_file: capacity=524288000, thinLun=0, flat_filename=RPVS_Lun00012-flat.vmdk, rawguid=0x6xxxxxxxxxxxx RPVS_ClusterLuns_addLunInfo: Lun 12, kluster 2xxxxxxxxxxxxxxx
har lagts till * Logg som indikerar att RPVS-identifieringsprocessen har tagit lång tid
CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), körtid 32585607 mikrosekunder, num kommandon i kö: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), körtid 33277695 mikrosekunder, antal kommandon i kö: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), körtid 35834242 mikrosekunder, antal kommandon i kö: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), körtid 36488014 mikrosekunder, antal kommandon i kö: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), speltid 37767728 mikrosekunder, antal kommandon i kö: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), körtid 49355575 mikrosekunder, antal kommandon i kö: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), körtid 109257427 mikrosekunder, antal kommandon i kö: 19
Alla RP4VM-versioner som påverkas
Cause
ESX splitter söker efter RPVS-volym (journal och repository) varje t_rpvsDiscoveryPeriodicTimerInterval (standard: 30) sekunder.
Genomsökningen görs genom att läsa /vmfs/volumes/ och bläddra i varje katalog i den och leta efter RPVS_LunXXXXX.vmdk
En RPVS-volym finns i /vmfs/volumes/<datastore>/<cluster=id>/. I VSAN-miljön skulle den finnas i /vmfs/volumes/vsan:vsan-id<>/<cluster=id>/
Om läsning av någon katalog i /vmfs/volumes/ misslyckas (timeout, tillfälligt fel osv.) tas alla RPVS-volymer bort från den misslyckade katalogen.
Om rpvs-identifieringsprocessen lyckas läsa och hitta RPVS_LunXXXXX.vmdk läggs motsvarande RPVS-volymer till i efterföljande körningar.
Detta är anledningen till att CG:erna loopar mellan Error och Init.
Problemet förstärks när ett stort antal värdar i VSAN läser kataloger under /vmfs/volumes/ samtidigt.
Resolution
I varje ESX-värd i klustret, uppdatera delningsjusteringsvärdet för t_rpvsDiscoveryPeriodicTimerInterval
till ett slumpmässigt värde mellan 180 och 600 sekunder, och starta om kdrivern.
ESX Splitter Tweak kan hittas på
/etc/kdriver/tweak/tweak.params.splitter eller /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter.
Resolution:
Dell EMC:s tekniker undersöker för närvarande det här problemet. En permanent lösning håller på att tas fram. Kontakta Dell EMC:s kundsupportcenter eller din kundtjänstrepresentant för att få hjälp. Hänvisa till det här lösnings-id:t.