PowerFlex 3.X-Daten von einem einzigen SDS nicht verfügbar Entkopplungsereignis
Zusammenfassung: Das PowerFlex-System wechselt von einem einzigen SDS-Entkopplungsereignis in den Status DATA FAILURE.
Symptome
- Das PowerFlex-System befand sich vor jedem Ereignis in einem normalen, fehlerfreien Zustand.
- Die MDM-Ereignisprotokolle zeigen eine einzelne SDS-Entkopplung und das System wechselt fast sofort in den Status DATA FAILURE. Das System verbleibt in diesem Status, obwohl der SDS erneut eine Verbindung zum System herstellt.
2023-12-18 14:39:48.489000:1047016:SDS_DECOUPLED ERROR SDS: sds93 (id: f1f8bfde00000023) decoupled. 2023-12-18 14:39:49.403000:1047017:MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 2023-12-18 14:39:50.406000:1047018:MDM_DATA_FAILED CRITICAL The system is now in DATA FAILURE state. Some data is unavailable. 2023-12-18 14:40:06.143000:1047036:SDS_RECONNECTED INFO SDS: sds93 (ID f1f8bfde00000023) reconnected.
- Nachdem das System in den Status DATA FAILURE wechselt, gibt es jetzt eine Festplatte (oder mehrere Festplatten) auf einem anderen SDS in einem Fehlerzustand, der in der Benutzeroberfläche des Präsentationsservers und in der SCLI-Ausgabe angezeigt wird.
- Der Status DATENFEHLER kann durch Löschen der Gerätefehler beendet werden.
- Das/die Gerät(e), das/die in einen Fehlerzustand versetzt wurde/wurden, zuvor in den Status WARNING versetzt, wie in den MDM-Ereignisprotokollen vermerkt.
2023-12-14 11:58:07.680000:0955611:SDS_DEV_WARNING WARNING A device warning threshold has been reached on SDS: sds93, Device: /dev/sdj. State: NORMAL upDownState: UP processState: DEV_ERR_INPROGRESS
- Wenn es zu einer MDM-Umschaltung kommt, geht das Gerät in einen FEHLER-Zustand über.
Auswirkungen
Ein Teil der Daten ist erst verfügbar, wenn die Gerätefehler behoben sind.
I/O-Fehler können von Clients erkannt werden.
Ein MDM-Switchover führt dazu, dass das Gerät in einen Fehlerstatus wechselt, was zu einer Nichtverfügbarkeit von Daten (DU) führen kann, wenn dies auf mehreren Hosts gleichzeitig auftritt.
Ursache
Der WARNING-Status des Geräts wurde vom MDM nicht korrekt behandelt, und dies war technisch gesehen der erste Fehler, obwohl die Festplatte noch in Gebrauch und physisch in Ordnung war. Als der zweite SDS ausfiel, war dies der zweite Fehler und der Grund für den Status DATA FAILURE.
Lösung
Falls bereits von dieser Ereignisserie betroffen:
- Löschen Sie die Geräte, die jetzt in einem Fehlerzustand angezeigt werden.
Falls noch nicht vom Status DATA FAILURE betroffen:
- Suchen Sie in den MDM-Ereignisprotokollen nach dem SDS und dem Gerät, das in den Status WARNING versetzt wurde.
- Löschen Sie präventiv den Gerätefehler aus scli.
- Das Löschen eines Gerätefehlers, wenn keine Fehler angezeigt werden, ist nicht schädlich und löscht nur Flags, die nicht benötigt werden.
scli --clear_sds_device_error --sds_name <SDS_NAME> --device_path <PATH>
Betroffene Versionen
PowerFlex 3.6.x
Behoben in Version
PowerFlex 3.6.4