PowerFlex 3.x-Neuerstellung wird nicht abgeschlossen, während ein Storage-Pool heruntergestuft ist
Zusammenfassung: Der Neuerstellungsvorgang wird nicht fortgesetzt, während ein Storage-Pool heruntergestuft ist.
Symptome
Szenario
Der Wiederherstellungsvorgang wird nicht fortgesetzt, während ein Storage-Pool heruntergestuft ist, da der MDM widersprüchliche Informationen über den aktuellen Status der betroffenen Combs in diesem Storage-Pool erhalten hat.
Symptome
In diesem Beispiel gibt es einen einzelnen Kamm, der sich in einem NORMAL_NEEDS_REBUILD befindet, aber die Neuerstellungsaktivität wird nicht abgeschlossen. (In anderen Fällen können sich viele Kämme in diesem Zustand befinden)
MDM-Ereignisse, die zeigen, dass sich der Cluster aufgrund eines Gerätefehlers in einem heruntergestuften Zustand befindet:
2021-07-20 12:02:19.674 SDS_DEV_ERROR_REPORT ERROR Device error reported on SDS: sds01, Device: /dev/sdu. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS 2021-07-20 12:02:20.785 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
Der Mehrkopf, der den Kamm zeigt, befindet sich in einem "NR"-Zustand (NEEDS_REBUILD). Das Gerät, auf dem sich der SEC-Datenblock befindet, ist DEGRADED_FAILED.
912: State: NORMAL Task: NONE Step: NONE PTask: ROLLBACK_MIGRATE Trig: HARDEN_COMPLETE
packedState: [__,__,__,NR,__,__,__,__,__,PR,__,1,NON] NOT-BUSY priTgtGen: 132901 migrateGenNum: 32 grep -e 291680238390 -e "MultiHead: 522d0047 Row: 912 "
PendTasks: [__,__,__,__,__,__,__,__,__,__,__,__,__] PriDevId: e5ffe96500170012
C0: [PRI,_,_,_,_,_,2] [_,_,_] DevId: e5ffe96500170012 mdmTgtGen: 3189, tgtCombGenNum: 1, capFlags:DEGRADED_HEALTHY | PRIMARY (0x48)
C1: [SEC,_,_,_,_,E,0] [_,_,_] DevId: e5fde9be0016000f mdmTgtGen: 3195, tgtCombGenNum: 2, capFlags:DEGRADED_FAILED (0x10)
MIG: [FRE,_,_,_,_,_,0] [_,_,_] DevId: 0000000000000000 mdmTgtGen: 0, tgtCombGenNum: 0, capFlags: (0x0)
Primärer Kamm, der SDS-Trace-Protokolle enthält, die zeigen, dass der Kamm in einen NORMAL_NEED_REBUILD Zustand wechselt, weil das sekundäre Kammhaltegerät ein PDE-Ereignis (Partial Device Error) aufweist:
20/07 12:02:19.690499 0x7fe648596db0:raidComb_SetCombState:00129: Set comb raid state 291680238390, raid state 0x1 => 0x40 (NORMAL => NORMAL_NEED_REBUILD) stateReason: PDE_CORRUPTION_ORIGIN_SECONDARY
Auswirkungen
Der Cluster befindet sich in einem heruntergestuften Zustand und die Daten sind nicht geschützt.
Ursache
Auf dem sekundären Kamm, der SDS enthält, ist ein Gerät in einen Fehlerstatus übergegangen und außerdem ein PDE-Ereignis auf demselben Gerät aufgetreten. Diese beiden Zustände gehen nicht einher, was dazu führt, dass der Wiederherstellungsvorgang nicht fortgesetzt wird.
Lösung
Ermitteln Sie die fehlerhafte SDS-Geräte-ID, indem Sie den folgenden Befehl ausführen:
scli --query_properties --object_type DEVICE --all_object --properties INACCESSIBLE_CAPACITY_IN_KB,EXPOSED_CAPACITY_IN_KB
Löschen Sie die PDE-Flags, indem Sie den folgenden Befehl mithilfe der Geräte-ID ausführen:
scli --test_inaccessible_data --device_id <id>
Dadurch sollte die PDE gelöscht werden und der erneute Aufbau sollte fortgesetzt werden.
Im Falle INACCESSIBLE_CAPACITY_IN_KB ist 0.
- Versetzen Sie den SDS mit dem fehlerhaften SDS-Gerät in den Modus Sofortige Wartung oder Geschützte Wartung. Dies sollte dazu beitragen, den erneuten Aufbau für den oben gezeigten Kamm abzuschließen.
- Wenn Sie den SDS-Wartungsmodus beenden, verwenden Sie das Flag --force_failed_device_id <device_id> für das ausgefallene Gerät.
Betroffene Versionen
PowerFlex 3.5.x
PowerFlex 3.6.x
Behoben in Version
PowerFlex 3.6.2