PowerFlex: "Acesso perdido ao volume" do SDC

Summary: O PowerFlex SDC pode registrar a "perda de acesso ao volume" quando o datastore local do SVM não puder responder em um determinado momento.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

 

  • No host do ESXi do SVM com problema, o driver do controlador RAID relata lsi_mr3 anulações no disco subjacente do datastore local, e o ESXi relata perda de acesso ao volume.

No log VMkernel:

2017-12-03T17:47:01.634Z cpu54:33648)ScsiDeviceIO: 2636: Cmd(0x43be59ec8a00) 0x1a, CmdSN 0x1f6f4 from world 0 to dev "naa.6800733259adcc4f214574350619b91a" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0x5 0x24 0x0.
2017-12-03T17:47:44.125Z cpu1:171607)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt abort for device: vmhba2:C2:T0:L0
2017-12-03T17:47:44.125Z cpu1:171607)lsi_mr3: mfi_TaskMgmt:262: ABORT
2017-12-03T17:47:45.125Z cpu34:32905)lsi_mr3: mfi_TaskMgmt:254: Processing taskMgmt virt reset for device: vmhba2:C2:T0:L0
2017-12-03T17:47:45.125Z cpu34:32905)lsi_mr3: mfi_TaskMgmt:258: VIRT_RESET cmd # 273733296
2017-12-03T17:47:45.125Z cpu34:32905)lsi_mr3: mfi_TaskMgmt:262: ABORT
2017-12-03T17:47:45.126Z cpu1:171607)lsi_mr3: fusionWaitForOutstanding:2531: megasas: [ 0]waiting for 1 commands to complete
2017-12-03T17:47:46.877Z cpu29:35817)HBX: 2851: 'datastore3': HB at offset 3691008 - Waiting for timed out HB:

No log hostd:
2017-12-03T17:47:45.126Z info hostd[41B40B70] [Originator@6876 sub=Vimsvc.ha-eventmgr] Event 219 : Lost access to volume 59b2c23a-98396dd8-aa53-84a9c4b71ca1 (datastore3) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.

  • O dispositivo SDS pode relatar a anulação da tarefa (que pode ser encontrada em var/log/messages e no log do VMware), portanto, o processo do SDS nessa SVM sofreria longa E/S em trânsito, o que afeta ainda mais a estabilidade do sistema scaleio

 

  • Em seguida, os SDCs registram o erro de E/S no log do VMkernel, já que o SDS problemático estava enfrentando algum problema de soquete de rede devido à resposta lenta do datastore local, e os datastores de aplicativos que residem no volume do ScaleIO podem relatar perda de acesso:
No log VMkernel:
2017-12-03T17:47:52.060Z cpu39:33682)scini: netSock_RcvIntrn:1903: ScaleIO R2_0:Error: Failed Success to receive 128 data PTR 0x4306d2923de4 socket 0x4306d2924200
2017-12-03T17:47:54.061Z cpu1:33476)scini: mapVolIO_ReportIOErrorIfNeeded:361: ScaleIO R2_0:[201590843] IO-ERROR comb: 32ba80000015. offsetInComb 11387944. SizeInLB 1. SDS_ID de31ad4800000001. Comb Gen 39. Head Gen 10199.
2017-12-03T17:47:54.061Z cpu1:33476)scini: mapVolIO_ReportIOErrorIfNeeded:374: ScaleIO R2_0:Vol ID 0x756be73300000017. Last fault Status IO_HARD_ERROR(20).Last error Status NOT_CONN(4) Reason (ABORTED) Retry count (2) chan (4)

No log hostd:
2017-12-03T17:47:54.125Z info hostd[3FAAFB70] [Originator@6876 sub=Vimsvc.ha-eventmgr] Event 220 : Lost access to volume 59cb2f80-40ad26ac-cf4f-84a9c4b71ce1 (OS_windows_01) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.
2017-12-03T17:47:54.125Z info hostd[3FAAFB70] [Originator@6876 sub=Vimsvc.ha-eventmgr] Event 221 : Lost access to volume 59cb2f9e-984e3ff8-63e1-84a9c4b71ce1 (OS_Linux_01) due to connectivity issues. Recovery attempt is in progress and outcome will be reported shortly.
Impact

 

Impacto

O SDC pode perder o acesso aos datastores residentes no volume do PowerFlex, e o aplicativo ou a VM nesses datastores pode ser afetado, por exemplo, o file system ficou somente leitura.
 

Cause

  • Os datastores VMFS são monitorados por meio de heartbeats emitidos na forma de operações de gravação aproximadamente uma vez a cada 3 segundos para os volumes VMFS dos hosts. Quando o datastore local da SVM está respondendo lentamente, o tempo total da E/S de heartbeat não é concluída em uma janela de 16 segundos, o datastore é marcado off-line e uma mensagem de Lost access to volume log é gerada pelo hostd para refletir esse comportamento. Mais detalhes podem ser encontrados na KB da VMware Noções básicas sobre acesso perdido a mensagens de volume no ESXi 
  • Nesse caso, o comportamento exato do SDS não pode ser previsto, como em quais mensagens keepalive seriam perdidas, em relação a quais outros componentes do PowerFlex. Algumas das E/S do SDC que devem ser atendidas por esse SDS podem exceder o tempo de espera excedido do sistema operacional ou dos aplicativos, causando um impacto.

Resolution

Entre em contato com a VMware e o fornecedor de hardware para corrigir o problema no controlador RAID ou em seu firmware e driver.

Additional Information

Uma solução temporária seria remover o SDS com problema ou migrá-lo para outro datastore local bom.

Affected Products

PowerFlex appliance Intelligent Catalog Software, VxFlex Product Family

Products

PowerFlex rack, VxFlex Ready Nodes, PowerFlex Appliance, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760 , PowerFlex appliance R7625, PowerFlex custom node, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R660, PowerFlex custom node R6625, PowerFlex custom node R750, PowerFlex custom node R760, PowerFlex custom node R7625, PowerFlex rack connectivity, PowerFlex rack HW, PowerFlex rack RCM Software, VxFlex Product Family, VxFlex Ready Node, VxFlex Ready Node R640, VxFlex Ready Node R740xd, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840, VxFlex Ready Node R840 ...
Article Properties
Article Number: 000027267
Article Type: Solution
Last Modified: 22 Sep 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.