PowerPath/VE для VMware не может заявлять (все) LUN VPLEX во время загрузки
Summary: После перезагрузки хоста NMP управляет некоторыми или всеми LUN VPLEX (вместо PowerPath/VE).
Symptoms
Окружающая среда:
ОС: VMware ESXi 6.0.0 Update 2 (build-3620759, build-4192238)
EMC SW: PowerPath/VE для VMware vSphere 6.0
EMC SW: PowerPath/VE для VMware vSphere 6.0 SP1
EMC SW: PowerPath/VE для VMware vSphere 6.1
Server. Адаптер главной шины HP ProLiant BL460c Gen9
: Корпорация Emulex, Emulex OneConnect OCe14000, инициатор FCoE: Драйвер HBA-адаптера CNA
650FLB: LPFC 11.1.145.18-1OEM.600.0.0.2768847 Продукт EMU VMwareCertified 2016-12-04
: VPLEX (5410, 5520)
Из vmkernel.log
2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1165: The current claimrules indicate that path vmhba0:C0:T0:L1 should be claimed by plugin PowerPath. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1169: Path vmhba0:C0:T6:L1 which appears to refer to the same physical media as path vmhba0:C0:T0:L1 is already claimed by plugin NMP. 2017-05-16T08:06:50.035Z cpu21:33912)ScsiClaimrule: 1171: If neither of these paths is being masked by ESX, this condition indicates a problem with the claimrules. 2017-05-16T08:06:50.035Z cpu21:33912)WARNING: ScsiPath: 608: Path vmhba0:C0:T0:L1 claims to be a VVol PE but has a version of 4 (expected 5 or higher). Not treating it as a PE. 2017-05-16T08:06:50.036Z cpu21:33912)ScsiPath: 5549: Plugin 'NMP' claimed path 'vmhba0:C0:T0:L1'
Cause
Команды запроса проблемных устройств завершаются сбоем в процессе загрузки.
Resolution
В этом случае поставщик хоста заменил две платы HBA с FLB 650 на FLB 630 на двух серверах.
После перезагрузки серверов никаких проблем не обнаружено. PowerPath/VE правильно управляет устройствами.
Additional Information
Модель HBA можно найти в выводе localcli_storage-core-adapter-list.txt.
Марку и модель сервера можно найти в esxcfg-info_-a.txt.FRAG-00000.txt.
Версию VMware можно найти в vmware_-vl.txt.
Модель дискового массива и микропрограмму можно найти в localcli_storage-core-device-list.txt.
Для правильного поиска и устранения неисправности использовалась специальная инженерная сборка.
PowerPath запрашивает путь на основе команды запроса SCSI. Из журналов пакетов инженерного тестирования можно увидеть, что команды запроса изначально завершались сбоем с ошибками HOST_RETRY (0x12) или HOST_NO_CONNECT (0x1). Но позже, когда ESXi снова предложила устройство, им это удалось, в результате чего PowerPath забрал устройство (без инженерной сборки эта вторая последовательность не отображается)
В ответ на HOST_RETRY ошибки PowerPath даже несколько раз повторила команду запроса с внутренним интервалом в 0,1 секунды. Но, тем не менее, хост-адаптер не выполнил команду, как видно из журналов.
Сбой запроса в начале
2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:53:51.561Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.663Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.765Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.867Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:51.969Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:56.772Z cpu46:33491)ALERT: PowerPath:MpxRecognize failed. Path vmhba0:C0:T1:L0 not claimed
Запрос успешно выполнен в конце, и PowerPath запрашивает устройство — эта последовательность не выполняется в обычной общедоступной сборке.
2016-12-14T11:54:08.542Z cpu12:34080)PowerPath:Claiming path vmhba0:C0:T1:L0 2016-12-14T11:54:08.545Z cpu12:34080)PowerPath:Path Claim: Successfully claimed path vmhba0:C0:T1:L0
В то же время мы можем видеть, что драйвер lpfc сообщает о включении и отключении канала, задержке в сообщениях об обнаружении портов и т. д.
2016-12-14T11:53:46.586Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 0:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:46.704Z cpu4:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3271: 1:1305 Link Down Event x5 received Data: x5 x20 x800220 x0 2016-12-14T11:53:49.334Z cpu30:33490)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 0:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.337Z cpu25:33493)WARNING: lpfc: lpfc_mbx_cmpl_read_topology:3247: 1:1303 Link Up Event x6 received Data: x6 x0 x5 x0 x0 2016-12-14T11:53:52.452Z cpu25:33493)WARNING: lpfc: lpfc_sli4_async_fip_evt:5702: 1:2546 New FCF event, evt_tag:x7, index:x0 2016-12-14T11:53:52.479Z cpu24:33396)PowerPath:PowerPlatformScsiIoErrorIsRetryable: cmd=0x12 Failed H: 0xc S: 0x0 P: 0x0 Path=vmhba0:C0:T1:L0 2016-12-14T11:53:52.505Z cpu25:33493)WARNING: lpfc: lpfc_do_scr_ns_plogi:8098: 1:3334 Delay fc port discovery for 10 seconds
Чтобы претендовать на путь, расследование должно быть успешным. Но из-за ошибок хост-адаптера во время процесса загрузки запрос завершается сбоем, в результате чего PowerPath не запрашивает устройство.
Эта проблема не связана с PowerPath.
Мы рекомендуем обратиться к поставщику VMware/адаптера за информацией о причинах этих временных сбоев: повторная попытка хоста (0xc), ошибка «Нет CONNECT» (0x1) во время загрузки хоста.
Если эти временные ошибки, связанные с адаптером, устранены, у PowerPath не должно возникнуть проблем с запросом на устройство.