Хосты теряют пути.
[ПРИМЕЧАНИЕ — Скотт, посмотри также примечание в сводке]
Хост ESX зависает и требует перезагрузки для восстановления. [Скотт — Зависают только хосты ESX? В сводке указано «все HBA-адаптеры, зонированные с VPLEX»]
Из журнала ESXi «vmkernel»:
2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0
Из журналов микропрограммы VPLEX:
event fc/4: "This port has discovered the departure of the indicated port from the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)] [Скотт — Вернемся к проблеме «все HBA-адаптеры, зонированные с VPLEX», если эта проблема Cisco затрагивает все HBA-адаптеры для VPLEX, нужно ли показывать отчеты об отключении других хостов в журналах микропрограммы? Наблюдается ли отключение других хостов так же, как хоста esx, показанного выше?]
event fc/3: "This port has discovered the arrival of the indicated port on the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)]
[Скотт: Есть ли у нас данные для других HBA-адаптеров? ]
Изменение.
Активация зоны.
Порты HBA-адаптеров и внешние порты VPLEX не участвуют в изменениях зонирования.
[Скотт — Это последнее предложение не имеет смысла, насколько я понимаю, проблема заключается в том, что при активации набора зон на коммутаторах Cisco участвуют все HBA-адаптеры и внешние порты VPLEX. Также, на какие уровни кода коммутаторов Cisco это влияет?]
VPLEX выполняет обнаружение фабрики на всех портах Fibre Channel (внешних, внутренних и FC-WANCOM) каждые 90 секунд с помощью команды сервера имен «Get all next» (GA_NXT). Это будет выполняться независимо от приема RSCN от коммутатора или PLOGI от зонального HBA-адаптера.
Из-за ошибки Cisco CSCvw75655, если система VPLEX выполняет обнаружение фабрики, на внешнем порте (FE), в то время как выполняется активация/фиксация набора зон, существует небольшая вероятность, что VPLEX получит только собственный адрес Fibre Channel (FCID), затем предположит, что ни один из HBA-адаптеров, вошедших в систему, больше не подключен к фабрике, и отправит команду выхода из системы (PLOGO) на каждый зонированный HBA-адаптер. [Скотт — Являются ли журналы VPLEX и/или коммутаторов, на которых происходит это действие, отправление PLOGO, если это можно увидеть на обоих продуктах, можно ли включить примеры этого и в каких журналах это наблюдается?]
VPLEX будет регистрировать события fc/4 для каждого выходящего HBA-адаптера и события fc/3, при следующем 90-секундном обнаружении фабрики, когда получает правильную информацию от сервера имен коммутаторов.
Способ обработки этого выхода HBA-адаптером зависит от драйвера/микропрограммы. В данном примере хост ESX завис и требовал перезагрузки. [Скотт - есть ли у нас данные из журналов других хостов, затронутых этим событием? Если да, то можно ли перечислить некоторые из них, чтобы не выглядело так, будто затронуты только хосты ESX?]
ПРИМЕЧАНИЕ.
Периодическое обнаружение фабрики выполняется, чтобы убедиться, что в системе VPLEX обновлены данные фабрики, поскольку существует вероятность, что не все сети RSCN установят соединение с VPLEX из фабрики.
Временное решение
На коммутаторе Cisco отключите функцию общей базы данных (db) сервера имен/сервера зон следующим образом:
Продукты (1)
ПО Cisco MDS 9000 NX-OS и SAN-OS
Известные затронутые выпуски
8.3(2)
. Обнаружение фабрики VPLEX
Пример.
Хост 1, хост 2 и хост 3 зонированы с одним внешним портом VPLEX.
Порт FE VPLEX: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020
Host 3: FCID 0x340040
Working... [Scott - Что это? Это взято/скопировано из раздела информации? Если да, то можно удалить информацию «working...»]
Ошибка Cisco CSCvw75655 ...