PowerVault ME5: The host link PHY error count is greater than the error threshold

Summary: Gli operatori PowerVault ME5 possono osservare occasionalmente messaggi dell'evento 663 "host link PHY error count" nel registro della cronologia degli eventi quando utilizzano porte front-end del controller SAS o Fibre Channel collegate a host o switch. Questo evento è stato introdotto nella versione ME5.1.2.1.0 e successive del firmware ME5. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

A seconda della configurazione del modulo controller PowerVault serie ME5, passare alla sezione appropriata di questo articolo.

Controller che utilizzano porte front-end fibre channel (FC)

Gli operatori di array PowerVault serie ME5 con moduli controller collegati tramite ricetrasmettitori SFP FC potrebbero dover adottare un'azione correttiva per risolvere questo sintomo. Spesso questo problema non influisce sull'elaborazione I/O, tuttavia il messaggio è un primo segnale di un problema di configurazione, di un potenziale problema hardware o di connessione con il ricetrasmettitore SFP o il cavo in fibra ottica.

Nella maggior parte dei casi, è facilmente risolvibile pulendo la superficie terminale del connettore LC sul cavo in fibra ottica per rimuovere polvere o altri contaminanti che impediscono la rifrazione della luce. Per istruzioni su come ispezionare e pulire la superficie terminale del connettore dei cavi in fibra ottica, seguire le indicazioni contenute in questo articolo della Knowledge Base: La presenza di contaminanti, come la polvere sulla superficie terminale del connettore in fibra ottica, causa scarse prestazioni di I/O

A41844     2024-08-12 10:45:54  112   INFORMATIONAL  Host link down. (port: 1)
A41853     2024-08-12 10:46:30  111   INFORMATIONAL  Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric)

A42131     2024-10-13 18:44:37  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 1, type: )
A42132     2024-10-13 18:46:44  663   RESOLVED       The host link PHY error count has been resolved. (port: 1, type: resolved)

Le versioni del firmware dell'array PowerVault ME5.1.2.1.0 e successive monitorano la metrica Invalid Transmission Word Count delle porte FC. Questo valore del contatore indica che una parola non è stata trasmessa correttamente, causando errori di codifica. Questo valore del contatore non viene visualizzato in PowerVault Manager o CLI, tuttavia viene inserito nel registro di debug di ogni storage controller (SC). I registri di debug degli SC vengono raccolti nel pacchetto di supporto di PowerVault ME. Vedere PowerVault ME5: come raccogliere i registri del supporto PowerVault (in inglese).

Se questo messaggio di ERRORE viene visualizzato frequentemente, gli operatori possono adottare le seguenti misure:

  1. Ispezionare l'installazione del cavo in fibra ottica, pulire la superficie terminale del connettore del cavo e monitorare i registri della cronologia degli eventi per verificare l'eventuale presenza di eventi 663 ripetuti. Vedere La presenza di contaminanti, come la polvere sulla superficie terminale del connettore in fibra ottica, causa scarse prestazioni di I/O.

  2. Se la pulizia dei connettori del cavo in fibra ottica non risolve il problema, sostituire il ricetrasmettitore e il cavo in fibra ottica con elementi funzionanti. Assicurarsi che le parti non siano danneggiate e vengano maneggiate correttamente.

  3. Se la sostituzione dei ricetrasmettitori non risolve il problema, gli operatori devono utilizzare i ricetrasmettitori convalidati elencati nel documento Dell PowerVault ME5 Series Storage System Support Matrix oppure contattare il fornitore per ricevere supporto.

  4. In rari casi, gli operatori che utilizzano switch FC da 8 GB di generazioni precedenti potrebbero dover regolare l'impostazione portCfgFillword degli switch. Vedere la sezione Ulteriori informazioni di seguito.

Controller che utilizzano porte front-end Serial Attached SCSI (SAS)

Ogni collegamento di un cavo SAS da host a controller forma una porta SAS costituita da più di un collegamento fisico (PHY). Ogni PHY è un set di quattro fili utilizzato come due coppie di segnali differenziali, che consente la trasmissione simultanea dei dati in entrambe le direzioni.

In genere questa condizione non influisce sull'elaborazione I/O; l'evento è previsto quando si inseriscono cavi SAS poiché si forma il collegamento SAS. Nelle configurazioni con controller ridondanti, l'evento 663 viene registrato contemporaneamente su entrambi i controller quando il server host connesso si avvia e carica il driver SAS del sistema operativo host. Non sono necessarie ulteriori azioni da parte dell'operatore.

Ulteriori considerazioni:
Dove i controller PowerVault ME sono collegati a un controller Dell SAS HBA355e. Le connessioni delle porte del server host possono essere distribuite in base all'articolo PowerVault serie ME5 segnala una riduzione delle prestazioni della porta host in caso di collegamento al controller SAS Dell HBA355e dopo aver cambiato le porte SAS HBA o SAS HBA del server utilizzate. Utilizzare PowerVault Manager per verificare che l'ID WWN dell'initiator delle porte sia associato agli host e ai volumi corretti.

Assicurarsi che i cavi SAS siano inseriti saldamente tirando delicatamente ogni estremità. Se il cavo SAS risulta allentato, reinserirlo correttamente. Quando il dispositivo di blocco del connettore viene fissato, si potrebbe percepire un clic. Se il connettore del cavo SAS non può essere fissato correttamente, verificare quale slot PCI-e viene utilizzato nel server host; la posizione dello slot dell'HBA SAS all'interno dello chassis potrebbe ostacolare l'inserimento del connettore. Per i dettagli, vedere Modelli PowerEdge 16G: selezione dello slot PCI-e HBA355e

Esempio di registro della cronologia eventi di PowerVault ME5 quando viene riavviato un host connesso tramite SAS. Entrambi i controller registrano l'evento e l'ultimo evento nella sequenza indica che il problema è stato risolto.

B1473      2024-08-15 09:55:22  112   INFORMATIONAL  Host link down. (port: 2)
A3538      2024-08-15 09:55:26  112   INFORMATIONAL  Host link down. (port: 2)

B1483      2024-08-15 09:55:29  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)
A3547      2024-08-15 09:55:32  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)


A3911      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
B1640      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
A3912      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
B1641      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
A3913      2024-10-22 10:12:58  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
B1642      2024-10-22 10:13:33  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
A3914      2024-10-22 10:15:00  663   RESOLVED       The host link PHY error count has been resolved. (port: 2, type: resolved)

 

Additional Information

Gli operatori che utilizzano switch Connectrix o Brocade FC di generazioni precedenti che supportano 8 GB possono configurare l'impostazione della fillword tramite il comando portCfgFillword . Quando sono stati introdotti gli switch da 8 GB, il valore ARBff ha preso il posto di IDLE, soprattutto perché poteva contribuire a ridurre gli errori di bit. Anche il valore IDLE utilizzato per l'inizializzazione è stato modificato in ARBff, insieme alla modifica della fillword.

Gli operatori di switch FC di generazioni precedenti che continuano a utilizzarli in produzione possono osservare un aumento dei contatori di Invalid Transmission Word Count e devono impostare il valore portcfgfillword in modo che utilizzi sempre ARBff. Su uno switch Brocade questo è l'output di "portcfgfillword --help".

admin> portcfgfillword --help

Usage: portCfgFillWord [SlotNumber/]PortNumber Mode  [Passive]

Mode: 0/-idle-idle      - IDLE in Link Init, IDLE as fill word (default)

          1/-arbff-arbff   - ARBFF in Link Init, ARBFF as fill word

          2/-idle-arbff    - IDLE  inLink Init, ARBFF as fill word (SW)

          3/-aa-then-ia  - If ARBFF/ARBFF failed, then do IDLE/ARBFF

Passive: 0/1

admin>

0: Use IDLE for initialization as 4Gb switches do.

1: Always use ARBff.

2: Use IDLE for initialization and use ARBff for between data frames.

3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000240288
Article Type: How To
Last Modified: 19 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.