CloudLink: Auflösen der Synchronisierung zwischen Cluster-Nodes nach der Wiederherstellung aus dem Backup
Summary: Der Kunde konnte sich weiterhin beim Webportal beider CloudLink-Cluster-Nodes anmelden, aber jeder Node meldete den anderen als "sync-off". Die Umgebung führt CloudLink 6.5 P01 mit integriertem ScaleIO 2.0.1.2 auf verschlüsselten Festplatten in CentOS 7.3 (Betriebssystem) aus. ...
Symptoms
Beobachtete Probleme
- Die Webportal-Anmeldung ist auf beiden CloudLink-Cluster-Nodes erfolgreich, aber jeder Node meldet den anderen Node als "sync off".
- Speicherplatzprüfungen auf beiden Nodes zeigen keine Nutzungsprobleme an.
- GUI-Inspektionen zeigen keine offensichtlichen Fehler, obwohl das CloudLink-Cluster kein Zertifikat hat.
- Durch den Neustart eines Cluster-Node wird der Status "Sync off" für den anderen Node nicht gelöscht.
- Beim Neustart des zweiten Node bleibt auch die Bedingung "Sync off" unverändert.
Cause
Inkonsistenter Clusterstatus nach separaten Wiederherstellungen
Der Cloudlink-Cluster wurde nicht synchronisiert, da die beiden virtuellen Cloudlink-Maschinen zu unterschiedlichen Zeiten aus dem Backup wiederhergestellt wurden. Durch diese asynchrone Wiederherstellung wurden unterschiedliche Konfigurationsdaten und Metadaten zwischen den Nodes eingeführt.
- Jeder Node hat einen anderen Snapshot der Clusterdatenbank geladen, was zu nicht übereinstimmenden Node-IDs führt.
- Clusterzertifikate wurden nicht neu erzeugt oder freigegeben, sodass das Cluster ohne gültiges freigegebenes Zertifikat verbleibt.
- Die Inkonsistenz verhinderte, dass die Nodes einen synchronisierten Status herstellten, was dazu führte, dass jeder Node den anderen als "sync off" meldete.
Resolution
Wiederherstellen der CloudLink-Clustersynchronisierung
Aktionsplan
- Stellen Sie einen CloudLink-Node aus einem zweifelsfrei funktionierenden Backup wieder her.
- Entfernen Sie alle verbleibenden Clustermitglieder aus der Konfiguration des wiederhergestellten Node.
- Stellen Sie eine neue CloudLink-Instanz aus dem OVA-Paket bereit.
- Verbinden Sie den neu bereitgestellten CloudLink mit dem vorhandenen Cluster.
Schritt-für-Schritt-Anleitung
- Wiederherstellen eines CloudLink-Node
Verwenden Sie das Backup, das vor der Beschädigung erstellt wurde.
- Löschen anderer Clustermitglieder aus dem wiederhergestellten Node
Greifen Sie auf das Webportal des wiederhergestellten Node zu und navigieren Sie zu Cluster → Members . Entfernen Sie alle aufgelisteten Mitglieder.
- Bereitstellen eines neuen CloudLink aus der OVA
Laden Sie die neueste CloudLink-OVA-Datei herunter, die Version 6.5 P01 mit ScaleIO 2.0.1.2 entspricht.
- Verbinden des neuen CloudLink mit dem Cluster
Wählen Sie im Webportal des neuen Nodes Cluster → Join Existing Cluster aus und geben Sie die IP-Adresse und die Zugangsdaten des wiederhergestellten Nodes an.
Überprüfung:
- Melden Sie sich beim Webportal jedes Cluster-Nodes an.
- Vergewissern Sie sich, dass auf der Seite Cluster → Status beide Nodes als Sync On angezeigt wird.
- Überprüfen Sie, ob ein gültiges Clusterzertifikat unter Sicherheit → Zertifikate vorhanden ist.
- Führen Sie eine schnelle Integritätsprüfung durch, um sicherzustellen, dass keine Fehler gemeldet werden.