Host verliest paden.
[OPMERING - Scott zie ook de opmerking in de samenvatting]
ESX-host loopt vast en moet opnieuw worden opgestart om te herstellen. [Scott zijn het alleen ESX-hosts die kunnen blijven hangen? In de samenvatting staat "Alle HBA's die in een zone met een VPLEX front-end-poort zijn geplaatst"]
Uit het ESXi "vmkernel"-logboek:
2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0
Uit de VPLEX-firmwarelogboeken:
event fc/4: "This port has discovered the departure of the indicated port from the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)] [Scott - terug naar het probleem van "Alle HBA's die in een zone met een VPLEX front-end-poort zijn geplaatst": als dit Cisco-probleem gevolgen heeft voor alle HBA's die met VPLEX worden gezoneerd, moeten we dan meldingen weergeven van andere hosts die vertrekken in de fw-logboeken? Zien we andere hosts die op dezelfde manier vertrekken als de ESX-host die hierboven wordt weergegeven?]
event fc/3: "This port has discovered the arrival of the indicated port on the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)]
[Scott: hebben we deze data nodig voor andere HBA's waarvan ook wordt waargenomen dat ze zijn gearriveerd? ]
Wijziging:
Zoneactivering.
HBA-poorten en VPLEX-front-end-poorten zijn niet betrokken bij de zoneringswijzigingen.
[Scott - deze laatste zin lijkt niet te kloppen, het probleem, zoals ik het begrijp, is dat wanneer er sprake is van een zonesetactivering op een Cisco-switch, alle HBA's en VPLEX FE-poorten daarbij betrokken 'zijn'. En ook: op welke Cisco-switchcodeniveaus heeft dit effect?]
VPLEX voert elke 90 seconden een infrastructuurdetectie uit op alle Fibre Channel-poorten (front-end, back-end en FC-WANCOM) en doet dit met behulp van de naamserveropdracht "Get all Next" (GA_NXT). Hiermee wordt dit uitgevoerd buiten het ontvangen van een RSCN van de switch of PLOGI van een in een zone ingedeelde HBA.
Vanwege Cisco-fout CSCvw75655 is het volgende aan de hand: indien VPLEX zijn structuurdetectie uitvoert op een front-end-poort (FE) terwijl het activeren/doorvoeren van een zoneset wordt uitgevoerd, is er een kleine kans dat VPLEX alleen zijn eigen Fibre Channel-adres (FCID) zal krijgen geretourneerd en vervolgens aanneemt dat alle HBA's die erbij zijn aangemeld, niet meer op de infrastructuur zijn aangesloten en een afmelding (PLOGO) naar elke HBA versturen die ermee in een zone is geplaatst. [Scott - is de VPLEX en/of switch-logboeken die deze actie laten zien, de PLOGO die wordt verzonden, indien dit kan worden waargenomen op beide producten kunnen we voorbeelden van dit type opnemen en van in welke logboeken dit wordt waargenomen?]
VPLEX zal de fc/4-gebeurtenissen registreren voor elke HBA die het afmeldt en fc/3-gebeurtenissen, op de volgende 90 seconden infrastructuurdetectie, wanneer het de juiste informatie ontvangt van de naamserver van de switch.
Hoe de HBA deze afmelding afhandelt, hangt af van zijn driver/firmware. De ESX-host in dit voorbeeld was vastgelopen en vereiste een herstart. [Scott - hebben we data van de logboeken van andere hosts die door deze gebeurtenis worden getroffen? Zo ja, kunnen we daarvan ook een paar weergeven, zodat het niet lijkt alsof alleen ESX-hosts hierdoor worden getroffen?]
OPMERKING:
Periodieke structuurdetectie wordt uitgevoerd om ervoor te zorgen dat VPLEX actuele structuurdata heeft, aangezien er een mogelijkheid is dat niet alle RSCN's VPLEX vanuit de structuur zullen bereiken.
Tijdelijke oplossing:
Schakel op de Cisco-switch de functie voor gedeelde databases (db) van naamserver/zoneserver als volgt uit:
Producten (1)
Cisco MDS 9000 NX-OS- en SAN-OS-software
Bekende getroffen releases
8.3(2)
VPLEX-structuurdetectie
Voorbeeld:
Host 1, Host 2 en Host 3 zijn in een zone geplaatst met één VPLEX FE-poort.
VPLEX FE-poort: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020
Host 3: FCID 0x340040
Working... [Scott - wat is dit? gekopieerd van info? Zo ja, dan kunnen we de "working..." info verwijderen]
Cisco-fout CSCvw75655 ...