O PowerPath/VE for VMware não pode reivindicar (todas) as LUNs do VPLEX no momento da inicialização
Summary: Quando o host é reinicializado, o NMP gerencia algumas ou todas as LUNs do VPLEX (em vez do PowerPath/VE).
Symptoms
Ambiente:
SO: VMware ESXi 6.0.0 Atualização 2 (build-3620759, build-4192238)
EMC SW: Software da EMC PowerPath/VE for VMware vSphere 6.0
: Software da EMC do PowerPath/VE for VMware vSphere 6.0 SP1
: PowerPath/VE for VMware vSphere 6.1
Server: Adaptador de barramento host HP ProLiant BL460c Gen9
: Emulex Corporation Emulex OneConnect OCe14000, FCoE Iniciador: 650FLB CNA
HBA Driver: LPFC 11.1.145.18-1OEM.600.0.0.2768847 EMU VMwareCertified 2016-12-04
Produto: VPLEX (5410 e 5520)
De vmkernel.log
2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1165: The current claimrules indicate that path vmhba0:C0:T0:L1 should be claimed by plugin PowerPath. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1169: Path vmhba0:C0:T6:L1 which appears to refer to the same physical media as path vmhba0:C0:T0:L1 is already claimed by plugin NMP. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1171: If neither of these paths is being masked by ESX, this condition indicates a problem with the claimrules. 2017-05-16T08:06:50.035Z cpu21:33912)WARNING: ScsiPath: 608: Path vmhba0:C0:T0:L1 claims to be a VVol PE but has a version of 4 (expected 5 or higher). Not treating it as a PE. 2017-05-16T08:06:50.036Z cpu21:33912)ScsiPath: 5549: Plugin 'NMP' claimed path 'vmhba0:C0:T0:L1'
Cause
Os comandos de consulta para os dispositivos com problema falharam durante o processo de inicialização.
Resolution
Nesse caso, o fornecedor de host substituiu duas placas HBA da FLB 650 para a FLB 630 em dois servidores.
Após a reinicialização dos servidores, nenhum problema foi encontrado. O PowerPath/VE está gerenciando corretamente os dispositivos.
Additional Information
O modelo de HBA pode ser encontrado na saída localcli_storage-core-adapter-list.txt.
A marca e o modelo do servidor podem ser encontrados em esxcfg-info_-a.txt.FRAG-00000.txt.
A versão do VMware pode ser encontrada em vmware_-vl.txt.
O modelo do array e do firmware pode ser encontrado no localcli_storage-core-device-list.txt.
Para solucionar corretamente o problema, foi usada uma compilação especial de engenharia.
O PowerPath depende do comando SCSI inquiry para reivindicar um caminho. A partir dos registros do pacote de teste de engenharia, podemos observar que os comandos de consulta estavam inicialmente falhando com erros de HOST_RETRY (0x12) ou HOST_NO_CONNECT (0x1). Mas, mais tarde, quando o ESXi ofereceu novamente o dispositivo, ele conseguiu que o PowerPath reivindicasse o dispositivo (sem uma compilação de engenharia, essa segunda sequência não é vista)
Em resposta a HOST_RETRY erros, o PowerPath até tentou novamente o comando de consulta várias vezes em um interno de 0,1 segundo. Ainda assim, o adaptador de host falhou no comando, como pode ser visto nos logs.
Falha na consulta no início
2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.663Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.765Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.867Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.969Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:56.772Z cpu46:33491)ALERT: PowerPath:MpxRecognize failed. Path vmhba0:C0:T1:L0 not claimed
A consulta foi bem-sucedida no final e o PowerPath reivindica o dispositivo — essa sequência não acontece com uma compilação GA regular.
2016-12-14T11:54:08.542Z cpu12:34080)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:54:08.545Z cpu12:34080)PowerPath:Path Claim: Successfully claimed path vmhba0:C0:T1:L0
Ao mesmo tempo, podemos ver o driver lpfc relatando link inativo e ativo, atraso nas mensagens de detecção de porta e assim por diante.
2016-12-14T11:53:46.586Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 0:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:46.704Z cpu4:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 1:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:49.334Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 0:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.337Z cpu25:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 1:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.452Z cpu25:33493)WARNING: lpfc: lpfc_sli4_async_fip_evt:5702: 1:2546 New FCF event, evt_tag:x7, index:x0 2016-12-14T11:53:52.479Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:52.505Z cpu25:33493)WARNING: lpfc: lpfc_do_scr_ns_plogi:8098: 1:3334 Delay fc port discovery for 10 seconds
Para reivindicar um caminho, um inquérito tem que ser bem-sucedido. Mas, devido a erros do adaptador de host durante o processo de inicialização, a consulta está falhando e, como resultado, o PowerPath não está reivindicando o dispositivo.
Não se trata de um problema do PowerPath.
Nossa recomendação é envolver o VMware/fornecedor do adaptador para ver o motivo dessas falhas transitórias Host Retry (0xc), No CONNECT (0x1) erros durante a inicialização do host.
Se esses erros transitórios relacionados ao adaptador forem corrigidos, o PowerPath não deverá ter nenhum problema em recuperar o dispositivo.