PowerVault ME5: Die Host-Link-PHY-Fehleranzahl ist höher als der Fehlerschwellenwert

Summary: PowerVault ME5-BedienerInnen sehen im Ereignisverlaufsprotokoll möglicherweise gelegentliche Fehlerzählermeldungen für Ereignis 663 des Host-Link-PHY, wenn sie entweder Fibre-Channel- oder SAS-Controller-Front-end-Anschlüsse verwenden, die mit Hosts oder Switches verbunden sind. Dieses Ereignis wurde in der ME5-Firmwareversion ME5.1.2.1.0 und höher eingeführt. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Lesen Sie je nach Konfiguration des Controller-Moduls der PowerVault ME5-Serie den entsprechenden Abschnitt in diesem Artikel.

Controller, die FC-Front-end-Anschlüsse (Fibre Channel) verwenden

BedienerInnen von Arrays der PowerVault ME5-Serie mit Controller-Modulen, die über FC-SFP-Transceiver (Fibre Channel) verbunden sind, müssen möglicherweise Korrekturmaßnahmen ergreifen, um dieses Symptom zu beheben. In den meisten Fällen wirkt sich dies nicht auf die I/O-Verarbeitung aus. Die Meldung ist jedoch ein frühzeitiger Hinweis auf ein Konfigurationsproblem oder potenzielles Hardware- bzw. Verbindungsproblem beim SFP-Transceiver oder Glasfaserkabel.

In den meisten Fällen lässt sich dies leicht beheben, indem die Endfläche des LC-Steckers am Glasfaserkabel ordnungsgemäß gereinigt wird, um Staub oder andere Verunreinigungen zu entfernen, die die Lichtbrechung behindern. Anweisungen zum Überprüfen und Reinigen der Endfläche des Glasfaserkabelsteckers finden Sie in diesem Wissensdatenbank-Artikel: Verunreinigungen wie Staub auf der Endfläche des Glasfaserkabelsteckers führen zu schlechter I/O-Performance

A41844     2024-08-12 10:45:54  112   INFORMATIONAL  Host link down. (port: 1)
A41853     2024-08-12 10:46:30  111   INFORMATIONAL  Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric)

A42131     2024-10-13 18:44:37  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 1, type: )
A42132     2024-10-13 18:46:44  663   RESOLVED       The host link PHY error count has been resolved. (port: 1, type: resolved)

Die PowerVault ME5-Array-Firmwareversionen ME5.1.2.1.0 und höher überwachen die Metrik für die Anzahl ungültiger Übertragungswörter der FC-Anschlüsse. Dieser Zählerwert bedeutet, dass ein Wort nicht erfolgreich übertragen wurde, was zu Codierungsfehlern führte. Dieser Zählerwert wird nicht im PowerVault Manager oder in der CLI angezeigt, er wird jedoch im Debug-Protokoll jedes Storage-Controllers (SC) aufgezeichnet. Die SC-Debug-Protokolle des Controllers werden im PowerVault ME-Support-Bundle erfasst. Siehe PowerVault ME5: So erfassen Sie PowerVault-Supportprotokolle

Wenn diese Fehlermeldung häufiger auftritt, können BedienerInnen die folgenden Aktionen ausführen:

  1. Überprüfen Sie die Glasfaserkabelinstallation, reinigen Sie die Endfläche des Glasfaserkabelsteckers ordnungsgemäß und überwachen Sie die Ereignisverlaufsprotokolle auf wiederholte Vorkommnisse des Ereignisses 663. Siehe Verunreinigungen wie Staub auf der Endfläche des Glasfaserkabelsteckers führen zu schlechter I/O-Performance.

  2. Wenn das Problem durch Reinigen der Glasfaserkabelstecker nicht behoben wird, tauschen Sie die Komponenten gegen einen zweifelsfrei funktionierenden Transceiver und ein zweifelsfrei funktionierendes Glasfaserkabel aus. Stellen Sie sicher, dass die Teile nicht beschädigt sind und korrekt gehandhabt werden.

  3. Wenn das Symptom durch den Austausch des Transceivers nicht behoben wird, sollten BedienerInnen validierte Transceiver verwenden, die in der Supportmatrix für Storage-Systeme der Dell PowerVault ME5-Serie aufgeführt sind. Andernfalls sollten sie sich an ihren Anbieter wenden, um Unterstützung zu erhalten.

  4. In seltenen Fällen müssen BedienerInnen, die 8-Gbit-FC-Switches einer älteren Generation verwenden, möglicherweise die portCfgFillword-Einstellung des Switches anpassen. Weitere Informationen finden Sie im Abschnitt „Zusätzliche Informationen“ unten.

Controller, die SAS-Front-end-Anschlüsse (Serial Attached SCSI) verwenden

Jede SAS-Kabelverbindung zwischen Host und Controller bildet einen SAS-weiten Anschluss, der aus mehr als nur einem physischen Link (PHY) besteht. Jeder PHY ist ein Satz von vier Drähten, die als zwei differentielle Signalpaare verwendet werden, sodass Daten gleichzeitig in beide Richtungen übertragen werden können.

In der Regel wirkt sich dies nicht auf die I/O-Verarbeitung aus. Das Ereignis wird erwartet, wenn die SAS-Kabel während der Bildung des SAS-Links eingesteckt werden. Bei redundanten Controller-Konfigurationen wird das Ereignis 663 auf beiden Controllern gleichzeitig aufgezeichnet, wenn der verbundene Host-Server startet und seinen Host-Betriebssystem-SAS-Treiber lädt. Es sind keine weiteren Maßnahmen seitens der BedienerInnen erforderlich.

Weitere Überlegungen:
Wenn PowerVault ME-Controller an einen Dell SAS-HBA355e angeschlossen sind. Die Host-Server-Anschlussverbindungen können anhand von PowerVault ME5-Serie meldet „host port degraded“ bei Verbindung mit einem Dell HBA355e-SAS-Controller verteilt werden. Nach der Änderung werden die Server-SAS-HBAs oder SAS-HBA-Anschlüsse verwendet. Überprüfen Sie in PowerVault Manager, ob die Anschlussinitiator-WWN-ID den richtigen Hosts und Volumes zugeordnet ist.

Stellen Sie sicher, dass die SAS-Kabel sicher eingesteckt sind, indem Sie vorsichtig an beiden Enden des SAS-Kabels ziehen. Wenn sich das SAS-Kabel vom Anschluss löst, schließen Sie es ordnungsgemäß wieder an. Möglicherweise hören Sie ein Klicken, wenn der Stecker einrastet. Wenn der SAS-Kabelstecker nicht ordnungsgemäß eingesteckt werden kann, überprüfen Sie, welcher PCIe-Steckplatz auf dem Host-Server verwendet wird. Die Steckplatzposition des SAS-HBA im Gehäuse kann das Einsetzen des Steckers behindern. Weitere Informationen finden Sie unter PowerEdge-16G-Modelle: HBA355e – PCIe-Steckplatzauswahl

Beispiel für ein PowerVault ME5-Ereignisverlaufsprotokoll, wenn ein mit SAS verbundener Host neu gestartet wird. Beide Controller zeichnen das Ereignis auf und das letzte Ereignis in der Sequenz zeigt an, dass das Problem behoben wurde.

B1473      2024-08-15 09:55:22  112   INFORMATIONAL  Host link down. (port: 2)
A3538      2024-08-15 09:55:26  112   INFORMATIONAL  Host link down. (port: 2)

B1483      2024-08-15 09:55:29  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)
A3547      2024-08-15 09:55:32  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)


A3911      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
B1640      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
A3912      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
B1641      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
A3913      2024-10-22 10:12:58  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
B1642      2024-10-22 10:13:33  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
A3914      2024-10-22 10:15:00  663   RESOLVED       The host link PHY error count has been resolved. (port: 2, type: resolved)

 

Additional Information

BedienerInnen, die Connectrix- oder Brocade-FC-Switches älterer Generationen verwenden, die 8 Gbit unterstützen, können die Füllworteinstellung mit dem Befehl portCfgFillword konfigurieren. Mit der Einführung von 8-Gbit-Switches wird ARBff anstelle von IDLE verwendet, hauptsächlich weil dies zu weniger Bitfehlern beiträgt. Das für die Initialisierung verwendete IDLE wurde neben der Füllwortänderung ebenfalls in ARBff geändert.

BedienerInnen von FC-Switches älterer Generationen, die diese weiterhin in der Produktion verwenden, sehen möglicherweise einen Anstieg bei der Anzahl der ungültigen Übertragungswörter und müssen den Wert für „portcfgfillword“ so einstellen, dass immer ARBff verwendet wird. Auf einem Brocade-Switch ist dies die Ausgabe von „portcfgfillword --help“.

admin> portcfgfillword --help

Usage: portCfgFillWord [SlotNumber/]PortNumber Mode  [Passive]

Mode: 0/-idle-idle      - IDLE in Link Init, IDLE as fill word (default)

          1/-arbff-arbff   - ARBFF in Link Init, ARBFF as fill word

          2/-idle-arbff    - IDLE  inLink Init, ARBFF as fill word (SW)

          3/-aa-then-ia  - If ARBFF/ARBFF failed, then do IDLE/ARBFF

Passive: 0/1

admin>

0: Use IDLE for initialization as 4Gb switches do.

1: Always use ARBff.

2: Use IDLE for initialization and use ARBff for between data frames.

3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000240288
Article Type: How To
Last Modified: 19 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.