PowerVault ME5: Antalet PHY-fel för värdlänken är större än feltröskeln
Summary: PowerVault ME5-operatörer kan ibland observera meddelanden om antal PHY-fel på händelse 663-värdlänken i händelsehistorikloggen när de använder antingen Fibre Channel- eller SAS-styrenhetens klientdelsportar som är anslutna till värdar eller switchar. Den här händelsen har introducerats i den fasta programvaran ME5 version ME5.1.2.1.0 och senare. ...
Instructions
Beroende på konfigurationen av styrenhetsmodulen i PowerVault ME5-serien går du till lämpligt avsnitt i den här artikeln.
- Styrenhetsmoduler som använder Fibre Channel (FC) frontend-portar
- Styrenhetsmoduler som använder serieanslutna SCSI-portar (SAS) på klientdelen
Styrenheter som använder Fibre Channel (FC) frontend-portar
Disksystemoperatörer i PowerVault ME5-serien med styrenhetsmoduler anslutna via Fibre Channel (FC) SFP-sändtagare kan behöva vidta korrigerande åtgärder för att åtgärda problemet. Ofta påverkar detta inte I/O-bearbetningen, men meddelandet är en tidig indikation på ett konfigurationsproblem, potentiell hårdvara eller anslutningsproblem med antingen SFP-sändtagaren eller den fiberoptiska kabeln.
I de flesta fall är detta lätt att lösa genom att korrekt rengöra ändytan på LC-kontakten på den fiberoptiska kabeln för att ta bort damm eller andra föroreningar som hindrar ljusbrytning. För instruktioner om hur du både inspekterar och rengör fiberoptiska kablarnas kontaktände, följ vägledningen i denna kunskapsbasartikel: Föroreningar som damm på den fiberoptiska kontaktens ände orsakar dålig IO-prestanda
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
Den fasta programvaran för PowerVault ME5-disksystem ME5.1.2.1.0 och senare övervakar FC-portarna Ogiltigt mått för antal överföringsord . Det här räknarvärdet innebär att ett ord inte överfördes korrekt, vilket resulterade i kodningsfel. Det här räknarvärdet visas inte i PowerVault Manager eller CLI, men det registreras i varje felsökningslogg för lagringsstyrenheter (SC). SC-felsökningsloggarna för styrenheten finns i PowerVault ME-supportpaketet. Se PowerVault ME5: Samla in supportloggar för PowerVault
Om detta FEL-meddelande observeras ofta kan operatörer vidta följande åtgärder:
-
Inspektera installationen av den fiberoptiska kabeln och rengör den fiberoptiska kabelkontaktens ände ordentligt och övervaka händelsehistorikloggarna för upprepade förekomster av händelse 663. Se Föroreningar som damm på den fiberoptiska kontaktens ände orsakar dålig IO-prestanda
-
Om rengöring av den fiberoptiska kabelns kontakter inte löser problemet, byt ut den mot en fungerande transceiver och fiberoptisk kabel. Se till att delarna inte är skadade och att de hanteras på rätt sätt.
-
Om byte av transceivers inte löser problemet bör operatörer använda validerade transceivers enligt listan i Dell PowerVault ME5-seriens stödmatris för lagringssystem, annars kontakta leverantören för support.
-
I sällsynta fall kan operatörer som använder äldre generationens 8 Gb FC-switchar behöva justera inställningen för switchportCfgFillword . Se avsnittet Ytterligare information nedan.
Styrenheter som använder serieanslutna SCSI-frontendportar (SAS)
Varje SAS-kabelanslutning mellan värd och styrenhet bildar en SAS-omfattande port som består av mer än en fysisk länk (PHY). Varje PHY är en uppsättning av fyra ledningar som används som två differentiella signalpar, vilket gör att data kan överföras i båda riktningarna samtidigt.
Vanligtvis påverkar detta inte I/O-bearbetningen, händelsen förväntas när SAS-kablar sätts in när SAS-länken bildas. Vid redundanta styrenhetskonfigurationer registreras händelsen 663 samtidigt på båda styrenheterna när den anslutna värdservern startar och läser in SAS-drivrutinen för värdoperativsystemet. Inga ytterligare åtgärder krävs av operatören.
Fler saker att tänka på:
PowerVault ME-styrenheter är anslutna till en Dell SAS HBA355e. Värdserverportsanslutningarna kan distribueras per PowerVault ME5-serien, rapporterar att värdporten försämrades när den var ansluten till Dell HBA355e SAS-styrenheten efter byte av server-SAS HBA-eller SAS HBA-portar som används. Använd PowerVault Manager för att kontrollera att portinitierarens WWN-ID är mappat till rätt värdar och volymer.
Se till att SAS-kablarna sitter fast ordentligt genom att försiktigt dra i båda ändarna av SAS-kabeln. Om SAS-kabeln försvinner från porten ska du återställa den på rätt sätt. Du kan höra ett klick när kontaktspärren är säkrad. Om SAS-kabelkontakten inte kan fästas ordentligt kontrollerar du vilken PCI-e-kortplats som används i värdservern. SAS-värdbussadaptens kortplats i chassit kan göra det svårt att sätta i kontakten. Mer information finns i PowerEdge 16G-modeller: Val av HBA355e PCI-e-kortplats
Exempel på händelsehistoriklogg för PowerVault ME5 när en SAS-ansluten värd startas om. Båda styrenheterna registrerar händelsen och den sista händelsen i sekvensen anger att problemet är löst.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Operatörer som använder äldre generationens Connectrix- eller Brocade FC-switchar med stöd för 8 Gb kan konfigurera fyllningsordsinställningen genom att portCfgFillword befallning. När 8 Gb-switchar introducerades antogs ARBff istället för IDLE, främst för att det kunde bidra till lägre bitfel. IDLE som användes för initiering ändrades också till ARBff, tillsammans med fyllningsordsändringen.
Operatörer av äldre generationens FC-switchar som fortsätter att använda dem i produktion kan se en ökning av räknare för ogiltiga överföringsord och måste ange portcfgfillword-värdet för att alltid använda ARBff. På en Brocade-omkopplare är detta utgången från "portcfgfillword --help.”
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.