PowerVault ME5: Die Host-Link-PHY-Fehleranzahl ist höher als der Fehlerschwellenwert
Summary: PowerVault ME5-BedienerInnen sehen im Ereignisverlaufsprotokoll möglicherweise gelegentliche Fehlerzählermeldungen für Ereignis 663 des Host-Link-PHY, wenn sie entweder Fibre-Channel- oder SAS-Controller-Front-end-Anschlüsse verwenden, die mit Hosts oder Switches verbunden sind. Dieses Ereignis wurde in der ME5-Firmwareversion ME5.1.2.1.0 und höher eingeführt. ...
Instructions
Lesen Sie je nach Konfiguration des Controller-Moduls der PowerVault ME5-Serie den entsprechenden Abschnitt in diesem Artikel.
- Controller-Module, die FC-Front-end-Anschlüsse (Fibre Channel) verwenden
- Controller-Module, die SAS-Front-end-Anschlüsse (Serial Attached SCSI) verwenden
Controller, die FC-Front-end-Anschlüsse (Fibre Channel) verwenden
BedienerInnen von Arrays der PowerVault ME5-Serie mit Controller-Modulen, die über FC-SFP-Transceiver (Fibre Channel) verbunden sind, müssen möglicherweise Korrekturmaßnahmen ergreifen, um dieses Symptom zu beheben. In den meisten Fällen wirkt sich dies nicht auf die I/O-Verarbeitung aus. Die Meldung ist jedoch ein frühzeitiger Hinweis auf ein Konfigurationsproblem oder potenzielles Hardware- bzw. Verbindungsproblem beim SFP-Transceiver oder Glasfaserkabel.
In den meisten Fällen lässt sich dies leicht beheben, indem die Endfläche des LC-Steckers am Glasfaserkabel ordnungsgemäß gereinigt wird, um Staub oder andere Verunreinigungen zu entfernen, die die Lichtbrechung behindern. Anweisungen zum Überprüfen und Reinigen der Endfläche des Glasfaserkabelsteckers finden Sie in diesem Wissensdatenbank-Artikel: Verunreinigungen wie Staub auf der Endfläche des Glasfaserkabelsteckers führen zu schlechter I/O-Performance
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
Die PowerVault ME5-Array-Firmwareversionen ME5.1.2.1.0 und höher überwachen die Metrik für die Anzahl ungültiger Übertragungswörter der FC-Anschlüsse. Dieser Zählerwert bedeutet, dass ein Wort nicht erfolgreich übertragen wurde, was zu Codierungsfehlern führte. Dieser Zählerwert wird nicht im PowerVault Manager oder in der CLI angezeigt, er wird jedoch im Debug-Protokoll jedes Storage-Controllers (SC) aufgezeichnet. Die SC-Debug-Protokolle des Controllers werden im PowerVault ME-Support-Bundle erfasst. Siehe PowerVault ME5: So erfassen Sie PowerVault-Supportprotokolle
Wenn diese Fehlermeldung häufiger auftritt, können BedienerInnen die folgenden Aktionen ausführen:
-
Überprüfen Sie die Glasfaserkabelinstallation, reinigen Sie die Endfläche des Glasfaserkabelsteckers ordnungsgemäß und überwachen Sie die Ereignisverlaufsprotokolle auf wiederholte Vorkommnisse des Ereignisses 663. Siehe Verunreinigungen wie Staub auf der Endfläche des Glasfaserkabelsteckers führen zu schlechter I/O-Performance.
-
Wenn das Problem durch Reinigen der Glasfaserkabelstecker nicht behoben wird, tauschen Sie die Komponenten gegen einen zweifelsfrei funktionierenden Transceiver und ein zweifelsfrei funktionierendes Glasfaserkabel aus. Stellen Sie sicher, dass die Teile nicht beschädigt sind und korrekt gehandhabt werden.
-
Wenn das Symptom durch den Austausch des Transceivers nicht behoben wird, sollten BedienerInnen validierte Transceiver verwenden, die in der Supportmatrix für Storage-Systeme der Dell PowerVault ME5-Serie aufgeführt sind. Andernfalls sollten sie sich an ihren Anbieter wenden, um Unterstützung zu erhalten.
-
In seltenen Fällen müssen BedienerInnen, die 8-Gbit-FC-Switches einer älteren Generation verwenden, möglicherweise die portCfgFillword-Einstellung des Switches anpassen. Weitere Informationen finden Sie im Abschnitt „Zusätzliche Informationen“ unten.
Controller, die SAS-Front-end-Anschlüsse (Serial Attached SCSI) verwenden
Jede SAS-Kabelverbindung zwischen Host und Controller bildet einen SAS-weiten Anschluss, der aus mehr als nur einem physischen Link (PHY) besteht. Jeder PHY ist ein Satz von vier Drähten, die als zwei differentielle Signalpaare verwendet werden, sodass Daten gleichzeitig in beide Richtungen übertragen werden können.
In der Regel wirkt sich dies nicht auf die I/O-Verarbeitung aus. Das Ereignis wird erwartet, wenn die SAS-Kabel während der Bildung des SAS-Links eingesteckt werden. Bei redundanten Controller-Konfigurationen wird das Ereignis 663 auf beiden Controllern gleichzeitig aufgezeichnet, wenn der verbundene Host-Server startet und seinen Host-Betriebssystem-SAS-Treiber lädt. Es sind keine weiteren Maßnahmen seitens der BedienerInnen erforderlich.
Weitere Überlegungen:
Wenn PowerVault ME-Controller an einen Dell SAS-HBA355e angeschlossen sind. Die Host-Server-Anschlussverbindungen können anhand von PowerVault ME5-Serie meldet „host port degraded“ bei Verbindung mit einem Dell HBA355e-SAS-Controller verteilt werden. Nach der Änderung werden die Server-SAS-HBAs oder SAS-HBA-Anschlüsse verwendet. Überprüfen Sie in PowerVault Manager, ob die Anschlussinitiator-WWN-ID den richtigen Hosts und Volumes zugeordnet ist.
Stellen Sie sicher, dass die SAS-Kabel sicher eingesteckt sind, indem Sie vorsichtig an beiden Enden des SAS-Kabels ziehen. Wenn sich das SAS-Kabel vom Anschluss löst, schließen Sie es ordnungsgemäß wieder an. Möglicherweise hören Sie ein Klicken, wenn der Stecker einrastet. Wenn der SAS-Kabelstecker nicht ordnungsgemäß eingesteckt werden kann, überprüfen Sie, welcher PCIe-Steckplatz auf dem Host-Server verwendet wird. Die Steckplatzposition des SAS-HBA im Gehäuse kann das Einsetzen des Steckers behindern. Weitere Informationen finden Sie unter PowerEdge-16G-Modelle: HBA355e – PCIe-Steckplatzauswahl
Beispiel für ein PowerVault ME5-Ereignisverlaufsprotokoll, wenn ein mit SAS verbundener Host neu gestartet wird. Beide Controller zeichnen das Ereignis auf und das letzte Ereignis in der Sequenz zeigt an, dass das Problem behoben wurde.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
BedienerInnen, die Connectrix- oder Brocade-FC-Switches älterer Generationen verwenden, die 8 Gbit unterstützen, können die Füllworteinstellung mit dem Befehl portCfgFillword konfigurieren. Mit der Einführung von 8-Gbit-Switches wird ARBff anstelle von IDLE verwendet, hauptsächlich weil dies zu weniger Bitfehlern beiträgt. Das für die Initialisierung verwendete IDLE wurde neben der Füllwortänderung ebenfalls in ARBff geändert.
BedienerInnen von FC-Switches älterer Generationen, die diese weiterhin in der Produktion verwenden, sehen möglicherweise einen Anstieg bei der Anzahl der ungültigen Übertragungswörter und müssen den Wert für „portcfgfillword“ so einstellen, dass immer ARBff verwendet wird. Auf einem Brocade-Switch ist dies die Ausgabe von „portcfgfillword --help“.
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.