Software PowerPath/VE for VMware nemůže při spuštění nárokovat (všechny) jednotky VPLEX LUN
Summary: Po restartování hostitele spravuje NMP některé nebo všechny jednotky VPLEX LUN (namísto PowerPath/VE).
Symptoms
Životní prostředí:
Operační systém: VMware ESXi 6.0.0 Update 2 (sestavení-3620759, sestavení-4192238)
Softwarový software EMC: PowerPath/VE pro software VMware vSphere 6.0
EMC: PowerPath/VE pro VMware vSphere 6.0 SP1
EMC SW: PowerPath/VE pro server VMware vSphere 6.1
: Adaptér hostitelské sběrnice HP ProLiant BL460c 9. generace
: Emulex Corporation Emulex OneConnect OCe14000, FCoE Iniciátor: Ovladač 650FLB CNA
HBA: LPFC 11.1.145.18-1OEM.600.0.0.2768847 EMU VMwareCertified 2016-12-04
Produkt: VPLEX (5410, 5520)
Od vmkernel.log
2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1165: The current claimrules indicate that path vmhba0:C0:T0:L1 should be claimed by plugin PowerPath. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1169: Path vmhba0:C0:T6:L1 which appears to refer to the same physical media as path vmhba0:C0:T0:L1 is already claimed by plugin NMP. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1171: If neither of these paths is being masked by ESX, this condition indicates a problem with the claimrules. 2017-05-16T08:06:50.035Z cpu21:33912)WARNING: ScsiPath: 608: Path vmhba0:C0:T0:L1 claims to be a VVol PE but has a version of 4 (expected 5 or higher). Not treating it as a PE. 2017-05-16T08:06:50.036Z cpu21:33912)ScsiPath: 5549: Plugin 'NMP' claimed path 'vmhba0:C0:T0:L1'
Cause
Během procesu spouštění selhaly příkazy dotazu na problémová zařízení.
Resolution
V tomto případě dodavatel hostitele vyměnil dvě karty HBA z FLB 650 na FLB 630 na dvou serverech.
Po restartování serverů nebyl nalezen žádný problém. Software PowerPath/VE správně spravuje zařízení.
Additional Information
Model adaptéru HBA naleznete ve výstupu localcli_storage-core-adapter-list.txt.
Značku a model serveru najdete v esxcfg-info_-a.txt.FRAG-00000.txt.
Verzi VMware naleznete v vmware_-vl.txt.
Model pole a firmware naleznete v localcli_storage-core-device-list.txt.
Ke správnému vyřešení tohoto problému bylo použito speciální technické sestavení.
Software PowerPath spoléhá při deklaraci cesty na příkaz dotazu SCSI. Z protokolů technického testovacího balíčku můžeme pozorovat, že příkazy dotazu zpočátku selhávaly s chybami HOST_RETRY (0x12) nebo HOST_NO_CONNECT (0x1). Ale později, když ESXi znovu nabídl zařízení, uspěli, což vedlo k tomu, že PowerPath si zařízení nárokoval (bez technického sestavení se tato druhá sekvence nezobrazí)
V reakci na HOST_RETRY chyby software PowerPath dokonce několikrát zopakoval příkaz dotazu s interní přesností 0,1 sekundy. Jak je patrné z protokolů, hostitelský adaptér přesto příkaz nezdařil.
Selhání dotazu na začátku
2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.663Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.765Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.867Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.969Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:56.772Z cpu46:33491)ALERT: PowerPath:MpxRecognize failed. Path vmhba0:C0:T1:L0 not claimed
Dotaz byl nakonec úspěšný a PowerPath si zařízení nárokuje – k této sekvenci nedochází u běžného sestavení GA.
2016-12-14T11:54:08.542Z cpu12:34080)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:54:08.545Z cpu12:34080)PowerPath:Path Claim: Successfully claimed path vmhba0:C0:T1:L0
Současně jsme mohli vidět, že ovladač lpfc hlásí Link Down a up, zpoždění ve zprávách o zjišťování portů atd.
2016-12-14T11:53:46.586Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 0:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:46.704Z cpu4:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 1:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:49.334Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 0:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.337Z cpu25:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 1:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.452Z cpu25:33493)WARNING: lpfc: lpfc_sli4_async_fip_evt:5702: 1:2546 New FCF event, evt_tag:x7, index:x0 2016-12-14T11:53:52.479Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:52.505Z cpu25:33493)WARNING: lpfc: lpfc_do_scr_ns_plogi:8098: 1:3334 Delay fc port discovery for 10 seconds
Aby bylo možné si nárokovat cestu, musí být vyšetřování úspěšné. Kvůli chybám hostitelského adaptéru během procesu spouštění však dotaz selhává a PowerPath si proto zařízení nenárokuje.
Nejedná se o problém se softwarem PowerPath.
Doporučujeme obrátit se na dodavatele VMware / adaptéru a zjistit důvod těchto přechodných selhání – opakování hostitele (0xc) nebo chyby No CONNECT (0x1) během spouštění hostitele.
Pokud jsou tyto přechodné chyby související s adaptérem opraveny, software PowerPath by neměl mít žádný problém s nárokováním zařízení.