Data Domain: Problem mit dem Update der Laufwerksfirmware auf DDOS-Versionen 7.13, 8.1 und 8.2
Summary: Auf den DDOS-Versionen 7.13, 8.1 und 8.2 können bei Data Domain Restorern (DDRs) mit aktivierten Laufwerksfirmwareupdates unerwartete, falsche Festplattenausfälle auftreten. Insbesondere können zwei Geräte pro Festplattengruppe (DG) aufgrund eines Problems mit der Referenzanzahl des RAID-Moduls im Kernel in einen fehlerhaften Zustand übergehen. Dies kann zu Systeminstabilität und potenziellen Risiken bei der Datenverfügbarkeit führen. Eine Korrektur wurde in die DDOS-Versionen 7.13.1.40, 8.3.1.10 und höher integriert. ...
Symptoms
- Zwei Geräte pro Gerätegruppe (DG) wechseln unerwartet in einen fehlerhaften Status
- Der Versuch, ein drittes Gerät auf der Haupteinheit ausfallen zu lassen, führt zu einem Systemfehler (Status "Total Fail").
- Übermäßig
kern.infoWARN-Protokolleinträge - Status einer heruntergestuften Laufwerksgruppe
- Spürbare Leistungsverschlechterung auf dem DDR
Betroffene Systeme:
- DD-Systeme mit externem Storage, auf denen frühe Versionen von DDOS 7.13.x.x ausgeführt werden | 8.1.x.x | 8.2x.x
- Eine Korrektur wurde auf =7.13.1.40 zurückportiert>
- Kunden, die 8.1 oder 8.2 ausführen, sollten auf >=8.3.1.10 aktualisieren.
Cause
Während des Updatevorgangs der Laufwerksfirmware wird der RAID-Befehl check scan Kann basierend auf der Anzahl der Geräte im System mehrmals ausgeführt werden. Jede Ausführung erhöht die Referenzanzahl des RAID-Moduls im Linux-Kernel. Auf der Kernel-Version 5.5 (verwendet in DDOS 7.13, 8.1 und 8.2) wird diese Referenzanzahl nicht verringert. Wenn der Zähler auf Null gesetzt wird, blockiert der Kernel den Zugriff von RAID auf interne gendisk Strukturen, die dazu führen, dass Geräte als unlesbar markiert und in einen fehlerhaften Zustand versetzt werden. Jede DG toleriert nur zwei ausgefallene Geräte. Ein dritter Ausfall der Haupteinheit löst einen Systemfehler aus.
Resolution
Ein dauerhafter Fix wurde in die folgenden DDOS-Versionen integriert:
- DDOS >= 7.13.1.40
- DDOS >= 8.3.1.10
Problemumgehung:
- Stellen Sie einen Service-Request an den technischen Support von Dell und verweisen Sie auf diesen KB-Artikel (#000331892), um die Lösung zu beschleunigen.
- Technischer Support von Dell:
- Ändern Sie das Skript für das Upgrade der Laufwerksfirmware so, dass es sofort nach der Ausführung zurückgegeben wird, wodurch die Erhöhung der RAID-Modul-Referenzanzahl minimiert wird.
- Technischer Support von Dell: