CloudLink:解決從備份還原後叢集節點之間的同步關閉問題

Summary: 客戶仍然可以登入兩個 CloudLink 叢集節點的 Web 入口網站,但每個節點都回報另一個節點為同步關閉。環境在 CentOS 7.3 (作業系統) 的加密磁碟上執行 CloudLink 6.5 P01,內建 ScaleIO 2.0.1.2。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

觀察到的問題

  • Web 入口網站登入在兩個 CloudLink 叢集節點上均成功,但每個節點都會將另一個節點報告為「sync off」。
  • 兩個節點上的磁碟空間檢查均未顯示使用率問題。
  • 儘管 CloudLink 叢集缺少憑證,但 GUI 檢查並未顯示明顯錯誤。
  • 將一個叢集節點重新開機並不會清除另一個節點的「同步關閉」狀態。
  • 重新開機第二個節點也會使「同步關閉」狀態保持不變。

Cause

個別還原後的叢集狀態不一致

Cloudlink 叢集變得不同步,因為兩個 Cloudlink 虛擬機器是在不同時間從備份還原。這種異步恢復在節點之間引入了不同的配置數據和元數據。

  • 每個節點載入了群集資料庫的不同快照,從而導致節點標識碼不匹配。
  • 叢集憑證未重新產生或共用,因此叢集沒有有效的共用憑證。
  • 不一致會使節點無法建立同步狀態,導致每個節點報告另一個節點為「同步關閉」。

Resolution

還原 CloudLink 叢集同步

行動計劃

  • 從已知的良好備份還原一個 CloudLink 節點。
  • 從還原的節點的配置中刪除任何剩餘的集群成員。
  • 從 OVA 套件部署全新的 CloudLink 例項。
  • 將新部署的 CloudLink 加入現有叢集。

逐步程序

  1. 修復 CloudLink 節點

    使用發生損毀前所進行的備份。 

  2. 從已恢復的節點中刪除其他集群成員

    存取還原節點的 Web 門戶並導航到 集群→成員 。刪除每個列出的成員。 

  3. 從 OVA 部署新的 CloudLink

    下載與版本 6.5 P01 和 ScaleIO 2.0.1.2 相符的最新 CloudLink OVA。 

  4. 將新的 CloudLink 加入叢集

    從新節點的 Web 入口網站中,選取叢 集→加入現有叢集 ,並提供還原節點的 IP 位址和登入資料。 

驗證

  • 登入每個叢集節點的 Web 入口網站。
  • 確認 「群集→狀態 」頁將兩個節點都顯示為 「同步打開 」。
  • 檢查 「安全性→證書 」下是否存在有效的群集證書。
  • 執行快速執行狀況檢查,以確保未報告任何錯誤。
警示: 在其他節點保持活動狀態時從備份還原節點可能會造成數據不一致。僅在單個節點上執行還原,然後按所述重建其餘成員。
注意: 在部署新的 OVA 之前,請確認主機上有足夠的可用磁碟空間。空間不足可能會導致部署失敗。
警告: 如果您不熟悉 OVA 部署或 CLI 命令,請先聯絡 Dell 支援部門再繼續進行,以避免服務意外中斷。

Affected Products

CloudLink

Products

CloudLink
Article Properties
Article Number: 000034993
Article Type: Solution
Last Modified: 13 رجب 1447
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.