PowerPath/VE for VMware kann beim Booten nicht (alle) VPLEX-LUNs beanspruchen
Summary: Wenn der Host neu gestartet wird, managt NMP einige oder alle VPLEX-LUNs (anstelle von PowerPath/VE).
Symptoms
Umwelt:
OS: VMware ESXi 6.0.0 Update 2 (Build-3620759, Build-4192238)EMC
SW: PowerPath/VE for VMware vSphere 6.0
EMC SW: PowerPath/VE for VMware vSphere 6.0 SP1
EMC SW: PowerPath/VE for VMware vSphere 6.1
Server: HP ProLiant BL460c Gen9
Host-Bus-Adapter: Emulex Corporation Emulex OneConnect OCe14000, FCoE-Initiator: 650FLB CNA
HBA-Treiber: lpfc 11.1.145.18-1OEM.600.0.0.2768847 EMU VMware-zertifiziert 2016-12-04
Produkt: VPLEX (5410, 5520)
Von vmkernel.log
2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1165: The current claimrules indicate that path vmhba0:C0:T0:L1 should be claimed by plugin PowerPath. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1169: Path vmhba0:C0:T6:L1 which appears to refer to the same physical media as path vmhba0:C0:T0:L1 is already claimed by plugin NMP. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1171: If neither of these paths is being masked by ESX, this condition indicates a problem with the claimrules. 2017-05-16T08:06:50.035Z cpu21:33912)WARNING: ScsiPath: 608: Path vmhba0:C0:T0:L1 claims to be a VVol PE but has a version of 4 (expected 5 or higher). Not treating it as a PE. 2017-05-16T08:06:50.036Z cpu21:33912)ScsiPath: 5549: Plugin 'NMP' claimed path 'vmhba0:C0:T0:L1'
Cause
Abfragebefehle an die Problemgeräte schlugen während des Startvorgangs fehl.
Resolution
In diesem Fall hat der Hostanbieter zwei HBA-Karten von FLB 650 auf FLB 630 in zwei Servern ersetzt.
Nach dem Neustart der Server wurde kein Problem gefunden. PowerPath/VE managt die Geräte ordnungsgemäß.
Additional Information
Das HBA-Modell finden Sie in der Ausgabe localcli_storage-core-adapter-list.txt.
Die Servermarke und das Modell finden Sie in esxcfg-info_-a.txt.FRAG-00000.txt.
Die Version von VMware finden Sie in vmware_-vl.txt.
Das Array- und Firmwaremodell finden Sie in localcli_storage-core-device-list.txt.
Um das Problem ordnungsgemäß zu beheben, wurde ein spezieller Build für die Entwicklung verwendet.
PowerPath benötigt zum Anfordern eines Pfads den SCSI-Abfragebefehl. Aus den Protokollen der Engineering-Testpakete können wir beobachten, dass Abfragebefehle anfänglich mit HOST_RETRY (0x12) oder HOST_NO_CONNECT (0x1) Fehlern fehlschlugen. Aber als ESXi das Gerät später erneut anbot, hatten sie Erfolg, was dazu führte, dass PowerPath das Gerät beanspruchte (ohne Engineering-Build wird diese zweite Sequenz nicht angezeigt).
Als Reaktion auf HOST_RETRY Fehler hat PowerPath den Abfragebefehl sogar mehrmals intern in 0,1 Sekunden wiederholt. Aber der Hostadapter hat den Befehl immer noch fehlgeschlagen, wie aus den Protokollen hervorgeht.
Anfragefehler am Anfang
2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.663Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.765Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.867Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.969Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:56.772Z cpu46:33491)ALERT: PowerPath:MpxRecognize failed. Path vmhba0:C0:T1:L0 not claimed
Anfrage war am Ende erfolgreich und PowerPath beansprucht das Gerät – Diese Sequenz tritt bei einem regulären GA-Build nicht auf.
2016-12-14T11:54:08.542Z cpu12:34080)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:54:08.545Z cpu12:34080)PowerPath:Path Claim: Successfully claimed path vmhba0:C0:T1:L0
Gleichzeitig meldete der LPFC-Treiber "Link Down" und "Up", Verzögerungen bei Port-Erkennungsmeldungen usw.
2016-12-14T11:53:46.586Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 0:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:46.704Z cpu4:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 1:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:49.334Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 0:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.337Z cpu25:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 1:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.452Z cpu25:33493)WARNING: lpfc: lpfc_sli4_async_fip_evt:5702: 1:2546 New FCF event, evt_tag:x7, index:x0 2016-12-14T11:53:52.479Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:52.505Z cpu25:33493)WARNING: lpfc: lpfc_do_scr_ns_plogi:8098: 1:3334 Delay fc port discovery for 10 seconds
Um einen Pfad zu beanspruchen, muss eine Anfrage erfolgreich sein. Aufgrund von Hostadapterfehlern während des Startvorgangs schlägt die Abfrage jedoch fehl und PowerPath fordert das Gerät daher nicht an.
Dies ist kein Problem von PowerPath.
Wir empfehlen Ihnen, sich an den VMware-/Adapteranbieter zu wenden, um den Grund für diese vorübergehenden Fehler zu finden: Fehler "Host Retry (0xc", "No CONNECT" (0x1) während des Hoststarts.
Wenn diese adapterbezogenen vorübergehenden Fehler behoben sind, sollte PowerPath das Gerät problemlos beanspruchen können.