PowerVault ME5:管理介面無法存取或無回應
Summary: 系統管理員可能會報告無法存取 PowerVault Manager、無法開啟 SSH 工作階段或登入序列工作階段。儲存控制器會繼續將資料提供給連線的前端主機。將控制器韌體升級至 ME5.1.2.1.0 版或更新版本。
Symptoms
管理控制器 (MC) 和儲存控制器 (SC) 是 ME 系列陣列上不同的子系統。陣列會繼續提供 I/O,但是所有管理介面 (UI、SSH、序列、SNMP 或 REST API) 都沒有回應。
典型的症狀:
- 無法存取 PowerVault Manager UI。
- 無法開啟 SSH 工作階段以前往一或兩個管理介面。
- 無法登入序列工作階段 CLI 連接埠
- 陣列無法回應外部管理應用程式 (SNMP 或 REST API) 或已從中消失。
事後檢閱事件記錄時,請參閱以下解決方案步驟。即使沒有正在進行韌體升級,系統管理員仍可在事件歷程記錄中看到下列項目。
... B849 2023-08-08 01:08:16 152 WARNING The Storage Controller is not receiving data from the Management Controller. (This is normal during firmware update.) ...
Cause
記憶體不足的狀況會導致管理應用程式程序終止。在外部管理應用程式使用 SNMP 或 REST API 輪詢管理介面的環境中,可能會更頻繁發生這類事件。
ME5 版本資訊:
FMW-65056 解決可能導致 CLI 和使用者介面無回應的情況。
哪些系統可能會受到影響?
| 產品 (與版本) | 下列 Dell PowerVault ME5 系列儲存系統
|
| 執行此核心軟體 (作業系統或作業環境) |
PowerVault ME5 控制器韌體低於 ME5.1.2.0.1 版本 |
Resolution
- 如有可能,請嘗試開啟 SSH 工作階段或 USB 序列連線,連接至每個控制器管理介面,然後再次啟動管理控制器服務。如果成功,請將控制器韌體升級。
- 在無法使用 SSH 或 USB 序列登入的情況下,必須實體重新裝回其中一個受影響的控制器模組,並在此控制器上重新取得管理控制後,將其對等控制器重新開機。在具有單一控制器模組的陣列或主機沒有路徑備援的組態上,必須安排維護時段、將主機關機,然後關閉陣列電源。
- 重新建立兩個控制器模組的管理存取權限後,請將控制器模組韌體升級至 ME5.1.2.1.0 版或更新版本。
程序:
步驟 1:嘗試在兩個控制器上重新啟動管理服務。
- 此步驟並非適用於所有情況。重新啟動管理控制器不會影響生產。
- 此步驟會終止管理工作階段,並在服務重新啟動大約兩到三分鐘後恢復管理存取。
- 如果兩個控制器模組上的管理服務都能成功重新啟動,請前往步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
-
開啟 SSH 工作階段前往每個控制器的管理介面,以管理或系統管理員層級使用者身分登入。或者,系統管理員可嘗試使用每個控制器的 USB 序列連線。如果無法使用 SSH 或序列連線登入,請前往步驟 2:實體重新裝回一個控制器模組或關閉陣列電源。
-
如果登入成功,請使用下列命令重新啟動每一個管理控制器:
restart mc full # restart mc full During the restart process you will briefly lose communication with the specified Management Controller(s). Do you want to continue? (y/n) y Info: Restarting the local MC (A)... Success: Command completed successfully. (2023-08-24 05:34:01) # Killed
步驟 2:實體重新裝回一個控制器模組或關閉陣列電源。
案例 1:具有備援路徑主機組態的雙控制器
這些步驟無需維護時段即可實施。
必須滿足以下條件:
- 主機必須具有控制器 A 和 B 的連線路徑
- 主機必須已設定並啟用多路徑支援。
- 所有主機啟動器都必須對應至磁碟區。
如需相關指南,請參閱 Dell PowerVault ME5 系列儲存系統擁有者手冊中的模組卸下和更換 > 客戶可更換組件一節。
-
實體將控制器模組 B 在其插槽中向前拉動約 5 公分或 2 吋,然後在 30 秒後重新裝回控制器模組。
-
控制器 B 大約需要兩到三分鐘的時間才能完成開機和韌體載入。
-
開啟 SSH 工作階段前往控制器 B 管理 IP 位址,以管理或系統管理員層級使用者身分登入。
-
重新啟動對等儲存控制器 A。輸入命令:
restart sc a # restart sc a While a Storage Controller is restarting, communication will temporarily be lost with the corresponding Management Controller, and also may cause a temporary loss of data availability. Do you want to continue? (y/n) y Success: Command completed successfully. - The command to restart SC A completed successfully. The controller will restart in approximately 30 seconds. (2023-08-24 07:08:39)
-
當對等控制器上線時,請登入 PowerVault Manager,然後前往步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
案例 2:單一控制器模組或非備援主機路徑組態
維護時段為必填。意外移除單一資料路徑代表主機失去資料存取權限並停止回應!
如需相關指南,請參閱 Dell PowerVault ME5 系列儲存系統擁有者手冊中的模組卸下和更換 > 客戶可更換組件一節。
-
通知使用者服務中斷,並依照主機作業系統使用者指南,讓連線的主機進入維護模式或關閉主機。
-
在陣列背面,將兩個電源供應器關閉約 60 秒,然後再重新開啟。
-
控制器完成開機並載入韌體需要大約三分鐘的時間。
-
登入 PowerVault Manager,然後前往步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
請參閱 Dell PowerVault ME5 系列系統管理員指南中的更新系統韌體一節。
- 下載控制器韌體更新。在網頁瀏覽器中,開啟 Dell 支援
- 輸入 PowerVault ME 產品服務編號或選取 PowerVault ME 型號。
- 在說明文件下,選取 Dell PowerVault ME5 儲存系統版本資訊。
- 在磁碟機與下載標籤下,下載 Dell PowerVault ME5 系列儲存控制器韌體
- 從.zip 檔案解壓縮韌體二進位。
- 使用 Dell PowerVault Manager。前往維護 > 韌體 > 系統,並上傳韌體二進位檔案。
- 前往維護 > 韌體 > 系統,然後按一下啟用此版本連結,以顯示對話方塊。
- 按照畫面上的指示開始啟用。
升級後行為:
使用 ME5 控制器韌體版本 ME5.1.2.0.1 或更新版本時,系統管理員可能偶爾會收到下列資訊警示。
圖 1:資訊警示
The Management Controller entered a memory exhaustion state and will reboot to recover. Data access will not be interrupted.
管理控制器 (MC) 提供管理 UI 和 CLI 介面,以監控和設定系統。重新啟動管理服務不會將控制器重新開機或中斷 I/O。重新啟動的影響是兩分鐘內無法存取管理介面。如果您經常收到此資訊警示,則可能需要進一步調查以確定原因。