PowerVault ME5:管理介面無法存取或無回應

Summary: 系統管理員可能會報告無法存取 PowerVault Manager、無法開啟 SSH 工作階段或登入序列工作階段。儲存控制器會繼續將資料提供給連線的前端主機。將控制器韌體升級至 ME5.1.2.1.0 版或更新版本。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

管理控制器 (MC) 和儲存控制器 (SC) 是 ME 系列陣列上不同的子系統。陣列會繼續提供 I/O,但是所有管理介面 (UI、SSH、序列、SNMP 或 REST API) 都沒有回應。

注意:原始文章建議升級到 ME5.1.2.0.1 或更新版本。本文已更新,以建議升級至控制器韌體 ME5.1.2.1.0 或更新版本,這包含額外的修正,可防止管理控制器在使用 SNMP 或 REST API 呼叫的外部管理應用程式探測下重新開機。

典型的症狀:

  • 無法存取 PowerVault Manager UI。
  • 無法開啟 SSH 工作階段以前往一或兩個管理介面。
  • 無法登入序列工作階段 CLI 連接埠
  • 陣列無法回應外部管理應用程式 (SNMP 或 REST API) 或已從中消失。

事後檢閱事件記錄時,請參閱以下解決方案步驟。即使沒有正在進行韌體升級,系統管理員仍可在事件歷程記錄中看到下列項目。

...
B849       2023-08-08 01:08:16  152   WARNING        The Storage Controller is not receiving data from the Management Controller. (This is normal during firmware update.)
...

 

Cause

記憶體不足的狀況會導致管理應用程式程序終止。在外部管理應用程式使用 SNMP 或 REST API 輪詢管理介面的環境中,可能會更頻繁發生這類事件。

ME5 版本資訊:
FMW-65056 解決可能導致 CLI 和使用者介面無回應的情況。

哪些系統可能會受到影響?

產品 (與版本) 下列 Dell PowerVault ME5 系列儲存系統
  • PowerVault ME5012
  • PowerVault ME5024
  • PowerVault ME5084
執行此核心軟體
(作業系統或作業環境)
PowerVault ME5 控制器韌體低於 ME5.1.2.0.1 版本

 

Resolution

  1. 如有可能,請嘗試開啟 SSH 工作階段或 USB 序列連線,連接至每個控制器管理介面,然後再次啟動管理控制器服務。如果成功,請將控制器韌體升級。
  2. 在無法使用 SSH 或 USB 序列登入的情況下,必須實體重新裝回其中一個受影響的控制器模組,並在此控制器上重新取得管理控制後,將其對等控制器重新開機。在具有單一控制器模組的陣列或主機沒有路徑備援的組態上,必須安排維護時段、將主機關機,然後關閉陣列電源。
  3. 重新建立兩個控制器模組的管理存取權限後,請將控制器模組韌體升級至 ME5.1.2.1.0 版或更新版本。

程序:

步驟 1:嘗試在兩個控制器上重新啟動管理服務。

  • 此步驟並非適用於所有情況。重新啟動管理控制器不會影響生產。
  • 此步驟會終止管理工作階段,並在服務重新啟動大約兩到三分鐘後恢復管理存取。
  • 如果兩個控制器模組上的管理服務都能成功重新啟動,請前往步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
  1. 開啟 SSH 工作階段前往每個控制器的管理介面,以管理或系統管理員層級使用者身分登入。或者,系統管理員可嘗試使用每個控制器的 USB 序列連線。如果無法使用 SSH 或序列連線登入,請前往步驟 2:實體重新裝回一個控制器模組或關閉陣列電源。

  2. 如果登入成功,請使用下列命令重新啟動每一個管理控制器:

    restart mc full
    
    # restart mc full
    During the restart process you will briefly lose communication with the specified Management Controller(s).
    Do you want to continue? (y/n) y
    
    Info: Restarting the local MC (A)...
    Success: Command completed successfully. (2023-08-24 05:34:01)
    # Killed

步驟 2:實體重新裝回一個控制器模組或關閉陣列電源。

警示:移除控制器可能會中斷主機對資料的存取,在某些情況下,主機 I/O 必須事先停止,以防止發生意外中斷或潛在的資料遺失。

案例 1:具有備援路徑主機組態的雙控制器
這些步驟無需維護時段即可實施。

必須滿足以下條件:

  • 主機必須具有控制器 A 和 B 的連線路徑
  • 主機必須已設定並啟用多路徑支援。
  • 所有主機啟動器都必須對應至磁碟區。

如需相關指南,請參閱 Dell PowerVault ME5 系列儲存系統擁有者手冊中的模組卸下和更換 > 客戶可更換組件一節。

  1. 實體將控制器模組 B 在其插槽中向前拉動約 5 公分或 2 吋,然後在 30 秒後重新裝回控制器模組。

  2. 控制器 B 大約需要兩到三分鐘的時間才能完成開機和韌體載入。

  3. 開啟 SSH 工作階段前往控制器 B 管理 IP 位址,以管理或系統管理員層級使用者身分登入。

  4. 重新啟動對等儲存控制器 A。輸入命令:

    restart sc a
    
    # restart sc a  While a Storage Controller is restarting, communication will temporarily be lost with the corresponding Management Controller, and also may cause a temporary loss of data availability. Do you want to continue? (y/n) y Success: Command completed successfully. - The command to restart SC A completed successfully. The controller will restart in approximately 30 seconds. (2023-08-24 07:08:39)
  5. 當對等控制器上線時,請登入 PowerVault Manager,然後前往步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。

案例 2:單一控制器模組或非備援主機路徑組態
維護時段為必填。意外移除單一資料路徑代表主機失去資料存取權限並停止回應!

如需相關指南,請參閱 Dell PowerVault ME5 系列儲存系統擁有者手冊中的模組卸下和更換 > 客戶可更換組件一節。

  1. 通知使用者服務中斷,並依照主機作業系統使用者指南,讓連線的主機進入維護模式或關閉主機。

  2. 在陣列背面,將兩個電源供應器關閉約 60 秒,然後再重新開啟。

  3. 控制器完成開機並載入韌體需要大約三分鐘的時間。

  4. 登入 PowerVault Manager,然後前往步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。

步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。

請參閱 Dell PowerVault ME5 系列系統管理員指南中的更新系統韌體一節。

  • 下載控制器韌體更新。在網頁瀏覽器中,開啟 Dell 支援
  • 輸入 PowerVault ME 產品服務編號或選取 PowerVault ME 型號。
  • 說明文件下,選取 Dell PowerVault ME5 儲存系統版本資訊。
  • 磁碟機與下載標籤下,下載 Dell PowerVault ME5 系列儲存控制器韌體
  • 從.zip 檔案解壓縮韌體二進位。
  • 使用 Dell PowerVault Manager。前往維護 > 韌體 > 系統,並上傳韌體二進位檔案。
  • 前往維護 > 韌體 > 系統,然後按一下啟用此版本連結,以顯示對話方塊。
  • 按照畫面上的指示開始啟用。

升級後行為:

使用 ME5 控制器韌體版本 ME5.1.2.0.1 或更新版本時,系統管理員可能偶爾會收到下列資訊警示。
資訊警示
圖 1:資訊警示

The Management Controller entered a memory exhaustion state and will reboot to recover. Data access will not be interrupted.

管理控制器 (MC) 提供管理 UI 和 CLI 介面,以監控和設定系統。重新啟動管理服務不會將控制器重新開機或中斷 I/O。重新啟動的影響是兩分鐘內無法存取管理介面。如果您經常收到此資訊警示,則可能需要進一步調查以確定原因。

注意:系統管理員應留心造成拒絕服務的乙太網路交換器故障狀況,例如廣播風暴或網路交換器上的生成樹迴圈、安全性漏洞測試套件或使用 REST API 的外部指令檔,這些情況會持續以迴圈執行,建立多個工作階段並每秒輪詢陣列,這可能會導致無法存取管理介面的相同症狀。

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000215402
Article Type: Solution
Last Modified: 24 Oct 2024
Version:  16
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.