PowerVault ME5:主機連結 PHY 錯誤計數大於錯誤閾值

Summary: 使用光纖通道或 SAS 控制器前端連接埠連接至主機或交換器時,PowerVault ME5 操作員可能會在事件歷程記錄中發現偶發事件 663 主機連結 PHY 錯誤計數訊息。 此事件已引入 ME5 韌體版本 ME5.1.2.1.0 及更新版本中。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

根據 PowerVault ME5 系列控制器模組組態而定,請前往本文中適當的章節。

使用光纖通道 (FC) 前端連接埠的控制器

具有使用光纖通道 (FC) SFP 傳發器連接控制器模組的 PowerVault ME5 系列陣列操作員,可能需要採取修正措施以解決此問題。這通常不會影響 I/O 處理,但是,該訊息是配置問題、潛在硬體或 SFP 傳發器或光纖纜線連接問題的早期指標。

在大多數情況下,透過正確清潔光纖纜線上 LC 連接器的端面,去除妨礙光折射的灰塵或其他汙染物,可以輕鬆解決此問題。如需有關如何檢查和清潔光纖纜線連接器端面的指示,請遵循本知識文章中的指示操作:光纖連接器端面上的灰塵等污染物會導致 IO 效能不佳

A41844     2024-08-12 10:45:54  112   INFORMATIONAL  Host link down. (port: 1)
A41853     2024-08-12 10:46:30  111   INFORMATIONAL  Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric)

A42131     2024-10-13 18:44:37  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 1, type: )
A42132     2024-10-13 18:46:44  663   RESOLVED       The host link PHY error count has been resolved. (port: 1, type: resolved)

PowerVault ME5 陣列韌體版本 ME5.1.2.1.0 及更新版本監控 FC 連接埠無效的傳輸字數統計指標。此計數器值表示文字未成功傳輸,從而導致編碼錯誤。此計數器值不會顯示在 PowerVault Manager 或 CLI 中,但會記錄在每個儲存控制器 (SC) 偵錯記錄中。會收集在 PowerVault ME 支援套裝中的控制器 SC 偵錯記錄。請參閱 PowerVault ME5:如何收集 PowerVault 支援記錄

如果經常發現此錯誤訊息,操作員可以執行下列動作:

  1. 檢查光纖纜線的安裝方式,並正確清潔光纖纜線連接器端面,監控事件歷程記錄,以瞭解事件 663 重複發生的狀況。請參閱光纖連接器端面上的灰塵等汙染物會導致 IO 效能不佳

  2. 如果清潔光纖纜線連接器無法解決問題,請更換已知良好的傳發器和光纖纜線。請確定零件未損壞且正在正確處理。

  3. 如果更換傳發器無法解決症狀,操作員應使用 Dell PowerVault ME5 系列儲存系統支援矩陣中所列經驗證的傳發器,否則請聯絡其廠商以取得支援。

  4. 在極少數情況下,使用老一代 8 Gb FC 交換器的操作員可能需要調整其交換器 portCfgFillword 設定。請參閱下方「額外資訊」一節。

使用序列連接 SCSI (SAS) 前端連接埠的控制器

每個主機到控制器的 SAS 纜線連接形成一個 SAS 連接埠,其中包含多個實體連結 (PHY)。每個 PHY 是一組四條傳輸線,作為兩個差動訊號對使用,允許資料同時雙向傳輸。

通常這不會影響 I/O 處理,當在 SAS 連結形成時插入 SAS 纜線,便可預期會發生此事件。在備援控制器組態上,當連接的主機伺服器啟動並載入其主機作業系統 SAS 驅動程式時,事件 663 會同時記錄在兩個控制器上。操作員無需執行進一步動作。

更多考量:
PowerVault ME 控制器連接至 Dell SAS HBA355e 的位置。主機伺服器連接埠連線可依每個 PowerVault ME5 系列報告主機連接埠在連線至 Dell HBA355e SAS 控制器時降級進行分配。變更伺服器 SAS HBA 或使用 SAS HBA 連接埠後。使用 PowerVault Manager 檢查連接埠啟動器 WWN ID 已對應至正確的主機和磁碟區。

輕拉 SAS 纜線的兩端,確定 SAS 纜線已牢固插入。如果 SAS 纜線從連接埠中斷,請正確地重新接上。固定連接器閂鎖時,您可能會聽到咔噠聲。如果 SAS 纜線連接器無法妥善固定,請檢查主機伺服器使用的 PCI-e 插槽,機箱內 SAS HBA 的插槽位置可能會阻礙連接器插入。如需詳細資訊,請參閱 PowerEdge 16G 型號:HBA355e PCI-e 插槽選擇

SAS 連線主機重新開機時的範例 PowerVault ME5 事件歷程記錄。兩個控制器都會記錄事件,而序列中的最後一個事件表示問題已解決。

B1473      2024-08-15 09:55:22  112   INFORMATIONAL  Host link down. (port: 2)
A3538      2024-08-15 09:55:26  112   INFORMATIONAL  Host link down. (port: 2)

B1483      2024-08-15 09:55:29  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)
A3547      2024-08-15 09:55:32  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)


A3911      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
B1640      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
A3912      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
B1641      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
A3913      2024-10-22 10:12:58  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
B1642      2024-10-22 10:13:33  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
A3914      2024-10-22 10:15:00  663   RESOLVED       The host link PHY error count has been resolved. (port: 2, type: resolved)

 

Additional Information

使用支援 8 Gb 的老一代 Connectrix 或 Brocade FC 交換器的操作員,可透過以下方式配置 fillword 設定 portCfgFillword 命令。引入 8 Gb 交換器時,採用 ARBff 而非 IDLE,主要是因為其有助於降低位元誤差。用於初始化的 IDLE 也隨著 fillword 變更而改為 ARBff。

老一代 FC 交換器的操作員若在生產中持續使用,可能會發現無效的傳輸字數統計計數器增加,需要將 portcfgfillword 值設定為一律使用 ARBff。在 Brocade 交換器上,這是「portcfgfillword --help.」

admin> portcfgfillword --help

Usage: portCfgFillWord [SlotNumber/]PortNumber Mode  [Passive]

Mode: 0/-idle-idle      - IDLE in Link Init, IDLE as fill word (default)

          1/-arbff-arbff   - ARBFF in Link Init, ARBFF as fill word

          2/-idle-arbff    - IDLE  inLink Init, ARBFF as fill word (SW)

          3/-aa-then-ia  - If ARBFF/ARBFF failed, then do IDLE/ARBFF

Passive: 0/1

admin>

0: Use IDLE for initialization as 4Gb switches do.

1: Always use ARBff.

2: Use IDLE for initialization and use ARBff for between data frames.

3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000240288
Article Type: How To
Last Modified: 19 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.