PowerVault ME5: Antallet af PHY-fejl i værtslinket er større end fejlgrænsen
Summary: PowerVault ME5-operatører kan opleve lejlighedsvise hændelse 663 host link PHY-fejltællingsmeddelelser i hændelseshistorikloggen, når du bruger enten fiber channel- eller SAS-controllerfrontend-porte, der er forbundet til værter eller switche. Denne hændelse er blevet introduceret i ME5-firmwareversion ME5.1.2.1.0 og nyere. ...
Instructions
Afhængigt af konfigurationen af controllermodulet i PowerVault ME5-serien skal du læse det relevante afsnit i denne artikel.
- Controllermoduler, der bruger Fibre Channel (FC)-frontend-porte
- Controllermoduler med SAS (Serial Attached SCSI) frontend-porte
Controllere, der bruger Fibre Channel (FC) frontend-porte
Operatører af PowerVault ME5-seriens systemer med controllermoduler tilsluttet via Fibre Channel (FC) SFP-transceivere skal muligvis foretage korrigerende handlinger for at afhjælpe dette symptom. Ofte påvirker dette ikke I/O-behandlingen, men meddelelsen er en tidlig indikation af et konfigurationsproblem, potentiel hardware eller forbindelsesproblem med enten SFP-transceiveren eller det fiberoptiske kabel.
I de fleste tilfælde løses dette let ved korrekt rengøring af LC-stikkets endeflade på det fiberoptiske kabel for at fjerne støv eller andre forurenende stoffer, der forhindrer lysbrydning. Du kan få instruktioner i, hvordan du både inspicerer og rengør fiberoptiske kablers endeflade, ved at følge vejledningen i denne vidensbaseartikel: Forurenende stoffer såsom støv på fiberoptisk stik og overflade forårsager dårlig IO-ydeevne
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
PowerVault ME5-systemets firmwareversioner ME5.1.2.1.0 og nyere overvåger FC-portene Ugyldig måling for antal overførselsord . Denne tællerværdi betyder, at et ord ikke blev transmitteret, hvilket resulterede i kodningsfejl. Denne tællerværdi vises ikke i PowerVault Manager eller CLI, men den registreres i hver lagercontrollers (SC) fejlfindingslogfil. Controllerens SC-fejlfindingslogfiler indsamles i PowerVault ME-supportpakken. Se PowerVault ME5: Sådan indsamler du PowerVault-supportlogfiler
Hvis denne FEJLMEDDELELSE observeres ofte, kan operatørerne udføre følgende handlinger:
-
Undersøg installationen af det fiberoptiske kabel, og rengør fiberoptisk kabelstikkets endeflade korrekt, og overvåg logfilerne over hændelser for gentagne forekomster af hændelseshændelse 663. Se Forurenende stoffer såsom støv på fiberoptisk stik og overflade forårsager dårlig IO-ydeevne
-
Hvis rengøring af fiberoptiske kabelstik ikke løser problemet, skal du udskifte en transceiver og et fiberoptisk kabel, som du ved fungerer. Sørg for, at delene ikke er beskadigede og håndteres korrekt.
-
Hvis udskiftning af transceivere ikke løser problemet, skal operatørerne bruge validerede transceivere som angivet i Dell PowerVault ME5-seriens storagesystemsupportmatrix, ellers skal de kontakte deres leverandør for at få support.
-
I sjældne tilfælde kan operatører, der bruger den ældre generation af 8 Gb FC-switche, være nødt til at justere deres indstilling for switchportCfgFillword . Se afsnittet Yderligere oplysninger nedenfor.
Controllere, der bruger SAS-frontendporte (Serial Attached SCSI)
Hver SAS-kabelforbindelse fra vært til controller udgør en SAS-port, der består af mere end ét fysisk link (PHY). Hver PHY er et sæt af fire ledninger, der bruges som to differentielle signalpar, så data kan transmitteres i begge retninger samtidigt.
Normalt påvirker dette ikke I/O-behandlingen. Hændelsen forventes, når SAS-kabler indsættes, når SAS-forbindelsen dannes. På redundante controllerkonfigurationer registreres hændelsen 663 samtidigt på begge controllere, når den tilsluttede værtsserver starter op og indlæser sin SAS-driver til værtsoperativsystemet. Operatøren behøver ikke foretage sig yderligere.
Flere overvejelser:
Hvor PowerVault ME-controllere er tilsluttet en Dell SAS HBA355e. Værtsserverportforbindelserne kan distribueres pr. rapport om PowerVault ME5-serien Værtsporten blev forringet, når den blev tilsluttet Dell HBA355e SAS-controller Efter skift server anvendte SAS HBA- eller SAS HBA-porte. Brug PowerVault Manager til at kontrollere, at portinitiatorens WWN-id er knyttet til de korrekte værter og diskenheder.
Sørg for, at SAS-kabler indsættes sikkert ved forsigtigt at trække i hver ende af SAS-kablet. Hvis SAS-kablet mistes fra porten, skal du sætte det korrekt i igen. Du kan høre et klik, når stiklåsen er fastgjort. Hvis SAS-kabelstikket ikke kan fastgøres korrekt, skal du kontrollere, hvilken PCI-e-slot der bruges på værtsserveren. SAS HBA'ens slotplacering i kabinettet kan forhindre indsættelse af stikket. Du kan finde flere oplysninger på PowerEdge 16G-modellerne: Valg af HBA355e PCI-e-slot
Eksempel på PowerVault ME5-hændelseshistoriklog, når en SAS-tilsluttet vært genstartes. Begge controllere registrerer hændelsen, og den sidste hændelse i sekvensen angiver, at problemet er løst.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Operatører, der bruger ældre generationer af Connectrix- eller Brocade FC-switche, som understøtter 8 Gb, kan konfigurere fillword-indstillingen ved at portCfgFillword kommando. Da 8 Gb-switche blev introduceret, blev ARBff vedtaget i stedet for IDLE, hovedsagelig fordi det kunne bidrage til lavere bitfejl. IDLE, der blev brugt til initialisering, blev også ændret til ARBff sammen med fillword-ændringen.
Operatører af ældre generation af FC-switche, der fortsætter med at bruge dem i produktionen, kan opleve en stigning i tællere for ugyldige transmissionsordtællinger og skal indstille portcfgfillword-værdien til altid at bruge ARBff. På en Brocade-switch er dette udgangen fra "portcfgfillword --help."
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.