VNX: Austausch bzw. proaktiver Austausch eines ausgefallenen oder ausfallenden Vault-Laufwerks auf einem VNX2-Array (Durch Dell EMC korrigierbar)
Summary: Austausch bzw. proaktiver Austausch eines ausgefallenen oder ausfallenden Vault-Laufwerks auf einem VNX2-Array
Symptoms
Ein Vault-Laufwerk auf einem VNX-MCx-Array ist ausgefallen und wurde an einen anderen Standort verlagert. Wenn der Kunde Nutzer-LUNs auf Vault-Laufwerken erstellt hat und diese Daten zurück auf das Vault-Laufwerk verschieben möchte, wie werden diese Daten zurückverschoben?
Bei einer dauerhaften Reserve gibt es keinen automatischen Neuerstellungsvorgang. Wenn ein reguläres Laufwerk ausfällt und ausgetauscht wird, gibt es keinen automatischen Übernahmevorgang von der dauerhaften Reserve zurück auf das ausgetauschte Laufwerk. Das Laufwerk, das das zuvor ausgefallene Laufwerk ersetzt, ist jetzt Teil der RAID-Gruppe.
Wenn ein ausgefallenes Vault-Laufwerk ersetzt wird, wird das neue Laufwerk formatiert und der private Speicherplatz wird von anderen Vault-Laufwerken erneut erstellt. Wenn ein Kunde jedoch eine RAID-Gruppe/LUNs auf einem Vault-Laufwerk erstellt hat, werden die LUN-Daten nicht zurückkopiert. Sie verbleiben auf dem Laufwerk, auf dem sie erneut erstellt wurden. Zum manuellen Rückkopieren der Daten an ihren ursprünglichen Speicherort müssen Sie den Befehl naviseccli copytodisk verwenden.
Info:
Vault-Laufwerke auf VNX2 der nächsten Generation sind die ersten 4 Laufwerke im Array. 0_0, 0_1, 0_2 und 0_3.
Jedes Vault-Laufwerk benötigt ungefähr 300 GB an privatem Systemspeicherplatz für die Speicherung des MCX-Code und anderer Array-bezogener Daten.
Obwohl es nicht empfohlen wird, Kunden-LUNs auf die Vault-Laufwerke zu setzen, tun einige Kunden dies dennoch.
Cause
VNX der nächsten Generation kann Kundendaten, die auf Vault-Laufwerken erstellt wurden, nicht übernehmen oder erneut erstellen. Wenn ein Vault-Laufwerk ausgetauscht wird, wird das neue Laufwerk formatiert und der private Speicherplatz wird von anderen Vault-Laufwerken erneut erstellt, allerdings werden die LUN-Daten des Kunden nicht zurückkopiert. Zum manuellen Rückkopieren der Daten an ihren ursprünglichen Speicherort müssen Sie den Befehl naviseccli copytodisk verwenden.
Resolution
Szenario 1: Das Vault-Laufwerk ist ausgefallen und es wird bereits dauerhaft ein anderes Laufwerk auf dem Array als Reserve verwendet. Gehen Sie wie folgt vor, um Kundendaten wieder an den ursprünglichen Vault-Speicherort zu übernehmen:
Der Befehl „naviseccli copytodisk“ initiiert das Kopieren von Daten von einem konfigurierten Laufwerk (Teil einer RAID-Gruppe) auf ein ungebundenes Laufwerk. Der Nutzer kann mit diesem Befehl Daten von beliebigen gebundenen Festplatten auf ungebundene Festplatten kopieren, nicht nur von einer dauerhaften Reserve auf ein Ersatzlaufwerk.
In diesem Beispiel werden Daten von Laufwerk 0_1_5 auf 0_0_2 kopiert.
naviseccli -h <ipaddress> copytodisk 0_1_5 0_0_2
WARNUNG: Die Daten von der Quellfestplatte 0_1_5 werden auf die Zielfestplatte 0_0_2 kopiert. Dieser Vorgang kann nicht abgebrochen werden und kann viel Zeit in Anspruch nehmen.
Möchten Sie den Kopiervorgang fortsetzen? (y/n) y
Der Rückkopiervorgang wird initiiert.
Szenario 2: Meldungen deuten darauf hin, dass das Laufwerk ausfällt. Vorgehensweise beim proaktiven Austausch des ausfallenden Vault-Laufwerks in den Steckplätzen 0, 1, 2, 3 auf Bus 0
- Stellen Sie sicher, dass alle ungebundenen Laufwerke vom Array entfernt werden (Dies wird durchgeführt, da ein ungebundenes Laufwerk als dauerhaftes Reserve/Hotspare-Laufwerk auf einem VNX2-Array genutzt werden kann).
- Überprüfen Sie die Laufwerke in der Steckplatzposition 0, 1, 2, 3 in Unisphere oder Naviseccli und stellen Sie sicher, dass dieser Laufwerkssatz keine doppelten Fehler enthält, bevor Sie fortfahren.
- Sobald der 5-Minuten-Timer verstrichen ist, setzen Sie das neue Laufwerk in den Steckplatz ein. Das Laufwerk muss mindestens 5 Minuten lang entfernt werden, damit die Kunden-LUNs auf Vault-Laufwerken vollständig erneut erstellt werden können.Warten Sie mindestens 5 Minuten**3 Entfernen Sie das fehlerhafte oder potenziell zu ersetzende Laufwerk aus dem Steckplatz.
- Das neue Laufwerk wird online geschaltet und die Nutzer-LUNs (wenn die Nutzer-LUNs auf Vault-Laufwerken konfiguriert wurden) werden von den anderen Vault-Laufwerken erneut erstellt.
Hinweis ** Es ist sehr wichtig, das entfernte Laufwerk mindestens 5 Minuten
lang entfernt zu lassen.Mit Flare kann ein Laufwerk in einer redundanten RAID-Gruppe für einen bestimmten Zeitraum von bis zu 5 Minuten offline sein, während Schreib-I/O-Vorgänge auf dieses Laufwerk protokolliert werden. Die tatsächlichen I/O-Vorgänge werden nicht protokolliert. Eine Bitmap wird verwendet, um nachzuverfolgen, welche Adressbereiche auf dem Laufwerk unsauber sind. Wenn das gleiche Laufwerk innerhalb einer Frist von 5 Minuten wieder zugänglich ist, wird das Wiederherstellungsprotokoll verwendet, um eine schnelle Neuerstellung des Laufwerks wie in diesem Fall durchzuführen. Dies wird als differenzielle Neuerstellung bezeichnet. Nachdem das Laufwerk für mehr als 5 Minuten entfernt wurde, erfolgt eine vollständige Neuerstellung der LUNs von den anderen Vault-Laufwerken. Wenn keine Nutzer-LUNs auf den Vault-Laufwerken konfiguriert sind, müssen die Nutzer-LUNs auch nicht erneut erstellt werden.