VxRail:無法將「未掛接在此主機上」和「不符合 VSAN 使用資格」的 VSAN 磁碟機新增至 VSAN 磁碟群組
Summary: 本文說明如何修正無法建立 VSAN 磁碟群組的問題。本文還提供當主機上顯示異常狀況時,將磁碟新增到現有磁碟的方法。 本文中討論的特定條件包括應該可用的「不符合資格」磁碟機。您也可能會看到主機上不正確的磁碟機總數,和/或不應該存在的其他磁碟群組。
Symptoms
使用命令「vdq -qH」或「vdq -Hi」檢查磁碟後,您會發現一或多個磁碟機顯示「原因:未掛接在此主機上。」這些磁碟機和其他一些磁碟機顯示「狀態:不符合 VSAN 使用資格。」在不符合資格的項目中,可能有 Boss 介面卡、Satadom、RecoverPoint 磁碟,以及其他應顯示該狀態的類型。在 vCenter 中,您可能會看到比預期更多的磁碟機,不過額外的磁碟機無法新增至磁碟群組。
在磁碟機故障之後新增或更換後,可能無法顯示新磁碟機。「名稱:」之後沒有任何內容的磁碟機應為「naa.<numbers&letters>」。這些磁碟機通常稱為「幽靈磁碟」或「鬼魂磁碟機」。它們所在的位置是現已遺失裝置曾經所在的位置。如果存在幽靈磁碟,可能會導致發生各種問題,例如開機時間過長、驗證失敗、無法「確保存取功能」,以及主機在某些情況下當機。
通常可透過 vCenter 或命令行移除幽靈磁碟機。但是,有時它們也無法刪除,在這些情況下,您通常必須先修復「未掛接...」磁碟機。
Cause
如果 VSAN 偵測到無法寫入磁碟機,即使尚未發現硬體感應器會導致其將磁碟標記為故障的狀況,也可能會將其踢出 VSAN。如果該磁碟是快取磁碟機,或使用重複資料刪除和壓縮功能,VSAN 必須使整個磁碟群組離線。雖然這可能導致上述情況,但這並不屬於根本原因。原因是損毀的中繼資料或磁碟仍有分割區 (來自其先前的組態中)。它們尚未復原,且已準備好新增回 VSAN。當磁碟中繼資料意外不當寫入某些內容時,也可能因其他原因而發生此情況。資料完整但無法再存取,且 VSAN 必須透過重新同步來復原儲存原則的合規性。
具有這類分割區的磁碟機可能會認為自己是磁碟群組的一部分,並在不應該有快取磁碟機的地方顯示快取磁碟機。此快取磁碟機沒有容量或名稱等一般資訊 (naa 資訊遺失)。但是,您無法將其移除,因為主機認為那裡有一個未掛接的磁碟機。您也無法透過重新掃描儲存控制器 (這可能會導致主機當機) 或重新啟動主機來修正此問題。
Resolution
請聯絡 Dell 技術支援部門或您的 Authorized 服務代表,並引用此知識文章 ID。
修正:任何「未掛接...」的磁碟機都必須移除或隱藏其分割區,而且必須從環境中移除任何幽靈磁碟。如果分割區遭到遮罩,這仍應可讓它們再次顯示為「符合 VSAN 使用資格」。將其新增至磁碟群組時,應該會在此過程中抹除位於分科區上的任何項目。修正此問題並移除任何幽靈磁碟後,您可能需要將主機重新開機。這是在主機上正確顯示所有內容後完成的。在 vCenter 的「叢集」>「設定」>「磁碟管理」區域中,您可以正常建立磁碟群組。
步驟:
讓主機進入維護模式 (確保存取功能)。這可以防止主機上的資料發生任何錯誤或意外問題。確保 VSAN 其餘部分的狀況良好。如果正在進行 VSAN 重新同步,則必須先完成這個步驟,才能從 VSAN 中刪除任何包含資料的磁碟或磁碟群組。
Broadcom 在 7.X 版及更新版本中推出了簡單的功能「清除 ESXi 儲存裝置」。
清除 ESXi 儲存裝置 (vmware.com)
- 在 vSphere Client 中,瀏覽至 ESXi 主機。
- 按一下「設定」標籤。
- 在「儲存」下,按一下「儲存裝置」。
- 選取一或多個裝置,然後按一下「清除分割區」圖示。
- 確認您要清除的分割區資訊並不重要。
- 按一下「確定」以確認變更。
如果上述方法無效,請使用以下手動步驟:
-
在主機 (在 Putty 中) 執行下列命令,並將輸出複製到文件。Putty 並非必要,但能夠複製和貼上是有幫助的。
vdq -qH
-
識別「不符合 VSAN 使用資格」的磁碟機,並顯示「原因:未掛接在此主機上」或「名稱」欄位中沒有任何內容 (無 naa)。
-
先修正顯示「未掛接...」的磁碟機:
- 從主機上的「vdq -qH」輸出中取得不合格磁碟的 NAA - 執行此命令以遮罩磁碟上的分割區:
partedUtil mklabel /dev/disks/<naa.#'s> gpt
- 再次執行以下命令,並確定磁碟機現在顯示「符合 VSAN 使用資格」。
vdq -qH
*否則,需要重新開機,然後重複上一個步驟。您應在重新開機前嘗試移除幽靈磁碟,以避免主機初始化磁碟和 vSAN 服務嘗試啟動時,開機過程冗長。
- 從主機上的「vdq -qH」輸出中取得不合格磁碟的 NAA - 執行此命令以遮罩磁碟上的分割區:
-
移除幽靈磁碟。您通常會在同一個「磁碟管理」區域中執行此操作。如果沒有,請在主機上使用命令行。
$ esxcli vsan storage remove -u <UUID>
請注意步驟 1 的輸出中沒有 naa 名稱之磁碟的 UUID。
-
檢查一切是否按照預期進行。重新整理 vCenter 並再次檢查「磁碟管理」,並在主機上執行命令「vdq -qH」,以確保所有預期的磁碟機立即顯示「符合 VSAN 使用資格」。如果沒有顯示,請將主機重新開機,因為某些磁碟機可能尚未初始化,然後再次檢查。
-
正常建立磁碟群組或將磁碟新增至現有的磁碟群組 (如果使用重複資料刪除和/或壓縮,則需要重新建立完整的磁碟群組)。