PowerFlex: SDC "mistede adgang til diskenhed"

Summary: PowerFlex SDC kan logge "mistet adgang til diskenhed", når SVM's lokale datalager ikke kan reagere inden for et givet tidsrum.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

 

  • På ESXi-værten for problematisk SVM rapporterer raid-controllerdriveren lsi_mr3 afbrydelser på den underliggende disk i det lokale datalager, og ESXi rapporterer mistet adgang til diskenheden.

I VMkernel-loggen:

2017-12-03T17:47:01.634Z cpu54:33648)ScsiDeviceIO: 2636: Cmd(0x43be59ec8a00) 0x1a, CmdSN 0x1f6f4 from world 0 to dev "naa.6800733259adcc4f214574350619b91a" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x24 0x0.
2017-12-03T17:47:44.125Z cpu1:171607)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt abort for device: vmhba2:C2:T0:L0
2017-12-03T17:47:44.125Z cpu1:171607)lsi_mr3: mfi_TaskMgmt:262: ABORT
2017-12-03T17:47:45.125Z cpu34:32905)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba2:C2:T0:L0
2017-12-03T17:47:45.125Z cpu34:32905)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 273733296
2017-12-03T17:47:45.125Z cpu34:32905)lsi_mr3: mfi_TaskMgmt:262: ABORT
2017-12-03T17:47:45.126Z cpu1:171607)lsi_mr3: fusionWaitForOutstanding:2531: megasas: [ 0]waiting for 1 commands to complete
2017-12-03T17:47:46.877Z cpu29:35817)HBX: 2851: 'datastore3': HB at offset 3691008 - Waiting for timed out HB:

I hostet logfil:
2017-12-03T17:47:45.126Z info hostd[41B40B70] [Originator@6876 sub=Vimsvc.ha-eventmgr] Event 219 : Lost access to volume 59b2c23a-98396dd8-aa53-84a9c4b71ca1 (datastore3) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.

  • SDS-enheden kan rapportere opgaveafbrydelse (som kan findes i både var/log/meddelelser og VMware-log), og SDS-processen på denne SVM vil således opleve lang inflight IO, hvilket yderligere påvirker stabiliteten af scaleio-systemet

 

  • SDC'er logger derefter IO-fejl i VMkernel-loggen, da det problematiske SDS oplevede et problem med netstikket på grund af den langsomme reaktion fra det lokale datalager, og applikationsdatalagrene på ScaleIO-enheden kan rapportere tab af adgang:
I VMkernel-loggen:
2017-12-03T17:47:52.060Z cpu39:33682)scini: netSock_RcvIntrn:1903: ScaleIO R2_0:Error: Failed Success to receive 128 data PTR 0x4306d2923de4 socket 0x4306d2924200
2017-12-03T17:47:54.061Z cpu1:33476)scini: mapVolIO_ReportIOErrorIfNeeded:361: ScaleIO R2_0:[201590843] IO-ERROR comb: 32ba80000015. offsetInComb 11387944. SizeInLB 1. SDS_ID de31ad4800000001. Comb Gen 39. Head Gen 10199.
2017-12-03T17:47:54.061Z cpu1:33476)scini: mapVolIO_ReportIOErrorIfNeeded:374: ScaleIO R2_0:Vol ID 0x756be73300000017. Last fault Status IO_HARD_ERROR(20).Last error Status NOT_CONN(4) Reason (ABORTED) Retry count (2) chan (4)

I hostet logfil:
2017-12-03T17:47:54.125Z info hostd[3FAAFB70] [Originator@6876 sub=Vimsvc.ha-eventmgr] Event 220 : Lost access to volume 59cb2f80-40ad26ac-cf4f-84a9c4b71ce1 (OS_windows_01) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.
2017-12-03T17:47:54.125Z info hostd[3FAAFB70] [Originator@6876 sub=Vimsvc.ha-eventmgr] Event 221 : Lost access to volume 59cb2f9e-984e3ff8-63e1-84a9c4b71ce1 (OS_Linux_01) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.
Impact

 

Påvirkning

SDC kan miste adgangen til datalagre, der findes på PowerFlex-diskenheden, og applikationen eller VM'en på disse datalagre kan blive påvirket, f.eks. hvis filsystemet er skrivebeskyttet.
 

Cause

  • VMFS-datalagrene overvåges gennem de hjerteslag, der udstedes i form af skriveoperationer ca. en gang hver 3. sek. til VMFS-diskenhederne fra værterne. Når SVM's lokale datalager reagerer langsomt, fuldføres den samlede tid for hjerterytme-I/O ikke inden for et tidsrum på 16 sekunder, datalageret markeres som offline, og værten genererer en meddelelse om mistet adgang til enhedsloggen, der afspejler denne adfærd. Du kan finde flere oplysninger i VMware KB Om mistet adgang til enhedsmeddelelser i ESXi 
  • I dette tilfælde kan SDS'ens nøjagtige opførsel ikke forudsiges, som i hvilken keepalive-meddelelser ville blive savnet, mod hvilke andre PowerFlex-komponenter. Nogle af de SDC IO'er, der skal betjenes af dette sikkerhedsdatablad, kan overskride timeout for operativsystemet eller applikationerne, hvilket kan forårsage en påvirkning.

Resolution

Få VMware og hardwareleverandøren til at løse problemet på RAID-controlleren eller dens firmware og driver.

Additional Information

En midlertidig løsning ville være at fjerne det problematiske SDS eller migrere det til et andet godt lokalt datalager.

Affected Products

PowerFlex appliance Intelligent Catalog Software, VxFlex Product Family

Products

PowerFlex rack, VxFlex Ready Nodes, PowerFlex Appliance, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760 , PowerFlex appliance R7625, PowerFlex custom node, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R660, PowerFlex custom node R6625, PowerFlex custom node R750, PowerFlex custom node R760, PowerFlex custom node R7625, PowerFlex rack connectivity, PowerFlex rack HW, PowerFlex rack RCM Software, VxFlex Product Family, VxFlex Ready Node, VxFlex Ready Node R640, VxFlex Ready Node R740xd, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840, VxFlex Ready Node R840 ...
Article Properties
Article Number: 000027267
Article Type: Solution
Last Modified: 22 Sep 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.