PowerVault ME5: Het aantal fouten in de PHY-fout van de hostlink is groter dan de drempelwaarde voor fouten
Summary: PowerVault ME5 operators kunnen incidentele gebeurtenis 663 hostlink PHY-foutmeldingen waarnemen in het gebeurtenisgeschiedenislogboek bij het gebruik van Fibre Channel- of SAS-controller frontend-poorten die zijn aangesloten op hosts of switches. Deze gebeurtenis is geïntroduceerd in ME5 firmwareversie ME5.1.2.1.0 en hoger. ...
Instructions
Afhankelijk van de configuratie van de PowerVault ME5 serie controllermodule, gaat u naar het juiste gedeelte in dit artikel.
- Controllermodules met behulp van Fibre Channel (FC) front-end poorten
- Controllermodules met Serial Attached SCSI (SAS) frontend-poorten
Controllers die Fibre Channel (FC) frontend-poorten gebruiken
PowerVault ME5 serie arrayoperators met controllermodules die zijn aangesloten via Fibre Channel (FC) SFP-transceivers moeten mogelijk corrigerende maatregelen nemen om dit symptoom op te lossen. Vaak heeft dit geen invloed op de I/O-verwerking, maar het bericht is een vroege indicatie van een configuratieprobleem, mogelijke hardware of verbindingsproblemen met de SFP-transceiver of de glasvezelkabel.
In de meeste gevallen is dit eenvoudig op te lossen door het eindvlak van de LC-connector op de glasvezelkabel correct te reinigen om stof of andere verontreinigingen te verwijderen die de lichtbreking belemmeren. Volg de richtlijnen in dit Knowledge Base-artikel voor instructies voor het inspecteren en reinigen van het uiteinde van de connector van glasvezelkabels: Verontreinigingen zoals stof op het uiteinde van de glasvezelconnector veroorzaken slechte IO-prestaties
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
PowerVault ME5 array firmwareversies ME5.1.2.1.0 en hoger bewaken de FC-poorten Ongeldige transmissie aantal woorden . Deze tegenwaarde betekent dat een woord niet succesvol is verzonden, wat resulteert in coderingsfouten. Deze tegenwaarde wordt niet weergegeven in PowerVault Manager of CLI, maar wordt wel vastgelegd in het foutopsporingslogboek van elke storagecontrollers (SC). De SC-foutopsporingslogboeken van de controller worden verzameld in de PowerVault ME-supportbundel. Zie PowerVault ME5: PowerVault supportlogboeken verzamelen
Als deze FOUTMELDING vaak wordt waargenomen, kunnen operators de volgende acties ondernemen:
-
Inspecteer de installatie van de glasvezelkabel en reinig het uiteinde van de glasvezelkabelconnector op de juiste manier en controleer de logboeken met gebeurtenisgeschiedenis op herhaalde incidenten van gebeurtenis 663. Zie Verontreinigingen zoals stof op het eindvlak van de glasvezelconnector veroorzaken slechte IO-prestaties
-
Als het reinigen van de connectoren van de glasvezelkabel het probleem niet oplost, vervang dan een bekende goede transceiver en glasvezelkabel. Zorg ervoor dat de onderdelen niet beschadigd zijn en op de juiste manier worden behandeld.
-
Als het vervangen van transceivers het symptoom niet oplost, moeten operators gevalideerde transceivers gebruiken zoals vermeld in de supportmatrix voor het Dell PowerVault ME5 serie storagesysteem. Neem anders contact op met hun leverancier voor support.
-
In zeldzame gevallen moeten operators die oudere generatie 8 Gb FC-switches gebruiken, mogelijk hun switchpoortCfgFillword-instelling aanpassen. Zie het gedeelte Aanvullende informatie hieronder.
Controllers die Serial Attached SCSI (SAS) frontend-poorten gebruiken
Elke host-naar-controller SAS-kabelverbinding vormt een SAS-brede poort die uit meer dan één fysieke link (PHY) bestaat. Elke PHY is een set van vier draden die worden gebruikt als twee differentiële signaalparen, waardoor gegevens tegelijkertijd in beide richtingen kunnen worden verzonden.
Normaal gesproken heeft dit geen invloed op de I/O-verwerking. De gebeurtenis wordt verwacht wanneer SAS-kabels worden geplaatst terwijl de SAS-koppeling wordt gevormd. Bij redundante controllerconfiguraties wordt gebeurtenis 663 gelijktijdig op beide controllers geregistreerd terwijl de aangesloten hostserver opstart en de SAS-driver van het hostbesturingssysteem laadt. Er is geen verdere actie nodig van de operator.
Meer overwegingen:
Waar PowerVault ME controllers zijn aangesloten op een Dell SAS HBA355e. De hostserverpoortverbindingen kunnen worden gedistribueerd per PowerVault ME5 serie om te melden dat de hostpoort verslechtert wanneer deze wordt aangesloten op de Dell HBA355e SAS-controller Na wijziging van gebruikte server-SAS HBA's of SAS HBA-poorten. Gebruik PowerVault Manager om te controleren of de WWN-ID van de poortinitiator is toegewezen aan de juiste hosts en volumes.
Zorg ervoor dat de SAS-kabels goed zijn geplaatst door voorzichtig aan elk uiteinde van de SAS-kabel te trekken. Als de SAS-kabel uit de poort losraakt, plaatst u deze correct opnieuw. Mogelijk hoort u een klik wanneer de connectorvergrendeling is bevestigd. Als de connector van de SAS-kabel niet goed kan worden bevestigd, controleert u welk PCI-e-slot wordt gebruikt op de hostserver. De slotpositie van de SAS HBA in het chassis kan het plaatsen van de connector belemmeren. Zie PowerEdge 16G modellen voor meer informatie: HBA355e PCI-e slotselectie
Voorbeeld van een PowerVault ME5 gebeurtenisgeschiedenislogboek wanneer een met SAS verbonden host opnieuw wordt opgestart. Beide controllers registreren de gebeurtenis, en de laatste gebeurtenis in de reeks geeft aan dat het probleem is opgelost.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Operators die oudere generatie Connectrix- of Brocade FC-switches gebruiken die 8 Gb ondersteunen, kunnen de fillword-instelling configureren door portCfgFillword bevelen. Toen 8 Gb-switches werden geïntroduceerd, werd ARBff gebruikt in plaats van IDLE, vooral omdat het kon bijdragen aan een lagere bitfout. De IDLE die werd gebruikt voor initialisatie werd ook gewijzigd in ARBff, samen met de wijziging van het vulwoord.
Operators van FC-switches van de oudere generatie die ze in productie blijven gebruiken, kunnen een toename van het aantal ongeldige transmissiewoorden waarnemen en moeten de quotcfgfillword-waarde instellen om altijd ARBff te gebruiken. Op een Brocade switch is dit de output van "portcfgfillword --help."
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.