PowerPath/VE dla VMware nie może przejąć (wszystkich) jednostek LUN VPLEX w czasie rozruchu
Summary: Po ponownym uruchomieniu hosta NMP zarządza niektórymi lub wszystkimi jednostkami LUN VPLEX (zamiast PowerPath/VE).
Symptoms
Środowisko:
System operacyjny: VMware ESXi 6.0.0 Update 2 (kompilacja-3620759, kompilacja-4192238),
EMC SW: PowerPath/VE dla oprogramowania VMware vSphere 6.0
EMC: PowerPath/VE dla oprogramowania VMware vSphere 6.0 SP1
EMC: PowerPath/VE dla serwera VMware vSphere 6.1
: Karta magistrali hosta HP ProLiant BL460c dziewiątej generacji
: Emulex Corporation Emulex OneConnect OCe14000, Inicjator FCoE: Sterownik karty HBA 650FLB CNA
: lpfc 11.1.145.18-1OEM.600.0.0.2768847 Produkt EMU VMwareCertified 2016-12-04
: VPLEX (5410, 5520)
Od vmkernel.log
2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1165: The current claimrules indicate that path vmhba0:C0:T0:L1 should be claimed by plugin PowerPath. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1169: Path vmhba0:C0:T6:L1 which appears to refer to the same physical media as path vmhba0:C0:T0:L1 is already claimed by plugin NMP. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1171: If neither of these paths is being masked by ESX, this condition indicates a problem with the claimrules. 2017-05-16T08:06:50.035Z cpu21:33912)WARNING: ScsiPath: 608: Path vmhba0:C0:T0:L1 claims to be a VVol PE but has a version of 4 (expected 5 or higher). Not treating it as a PE. 2017-05-16T08:06:50.036Z cpu21:33912)ScsiPath: 5549: Plugin 'NMP' claimed path 'vmhba0:C0:T0:L1'
Cause
Polecenia zapytań do problematycznych urządzeń nie powiodły się podczas procesu rozruchu.
Resolution
W takim przypadku dostawca hosta wymienił dwie karty HBA z FLB 650 na FLB 630 w dwóch serwerach.
Po ponownym uruchomieniu serwerów nie znaleziono problemu. PowerPath/VE prawidłowo zarządza urządzeniami.
Additional Information
Model HBA można znaleźć na wyjściu localcli_storage-core-adapter-list.txt.
Markę i model serwera można znaleźć w esxcfg-info_-a.txt.FRAG-00000.txt.
Wersję oprogramowania VMware można znaleźć w vmware_-vl.txt.
Model macierzy i oprogramowanie wewnętrzne można znaleźć w localcli_storage-core-device-list.txt.
Aby prawidłowo rozwiązać ten problem, użyto specjalnej kompilacji inżynieryjnej.
PowerPath korzysta z polecenia zapytania SCSI w celu przypisania ścieżki. Na podstawie dzienników pakietów testów inżynieryjnych możemy zaobserwować, że polecenia zapytań początkowo kończyły się niepowodzeniem z powodu błędów HOST_RETRY (0x12) lub HOST_NO_CONNECT (0x1). Jednak później, gdy ESXi ponownie zaoferowało urządzenie, udało im się to w wyniku przejęcia urządzenia przez PowerPath (bez kompilacji inżynieryjnej ta druga sekwencja nie jest widoczna)
W odpowiedzi na HOST_RETRY błędy PowerPath wielokrotnie ponawiał nawet polecenie zapytania w czasie wewnętrznym wynoszącym 0,1 sekundy. Mimo to karta hosta nie wykonała polecenia, co widać w dziennikach.
Niepowodzenie zapytania na początku
2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.663Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.765Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.867Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.969Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:56.772Z cpu46:33491)ALERT: PowerPath:MpxRecognize failed. Path vmhba0:C0:T1:L0 not claimed
Zapytanie powiodło się na końcu i PowerPath przejmuje urządzenie — ta sekwencja nie występuje w przypadku zwykłej kompilacji GA.
2016-12-14T11:54:08.542Z cpu12:34080)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:54:08.545Z cpu12:34080)PowerPath:Path Claim: Successfully claimed path vmhba0:C0:T1:L0
Jednocześnie mogliśmy zobaczyć sterownik lpfc zgłaszający Link w dół i w górę, opóźnienie w komunikatach o wykryciu portu i tak dalej.
2016-12-14T11:53:46.586Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 0:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:46.704Z cpu4:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 1:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:49.334Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 0:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.337Z cpu25:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 1:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.452Z cpu25:33493)WARNING: lpfc: lpfc_sli4_async_fip_evt:5702: 1:2546 New FCF event, evt_tag:x7, index:x0 2016-12-14T11:53:52.479Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:52.505Z cpu25:33493)WARNING: lpfc: lpfc_do_scr_ns_plogi:8098: 1:3334 Delay fc port discovery for 10 seconds
Aby znaleźć ścieżkę, dochodzenie musi zakończyć się sukcesem. Jednak ze względu na błędy karty hosta podczas procesu rozruchu zapytanie kończy się niepowodzeniem, w wyniku czego PowerPath nie zgłasza praw do urządzenia.
Nie jest to problem PowerPath.
Zalecamy skontaktowanie się z dostawcą VMware/karty adaptera w celu uzyskania przyczyny tych przejściowych błędów, takich jak ponowna próba hosta (0xc), brak połączenia (0x1) podczas rozruchu hosta.
Jeśli te przejściowe błędy związane z adapterem zostaną naprawione, PowerPath nie powinno mieć żadnego problemu z odebraniem urządzenia.