Avamar: Gen4T-Hardware: Symptom Code: 52764 – Ungültiger Block erkannt
Zusammenfassung: In diesem Wissensdatenbank-Artikel wird auf die Medienfehler auf den physischen Laufwerken in den Avamar Data Store Gen4T-Nodes verwiesen und erläutert, wie diese behoben werden können. ...
Symptome
Die folgenden Fehler werden in der MC-Benutzeroberfläche, AUI und angezeigt /var/log/messages Datei auf dem Node:
Symptom Code: 52764, Desc: Adaptec Event Monitor: [13016] :WRN: Bad Block discovered: controller: Ursache
Auf einem physischen Laufwerk wurde ein fehlerhafter Block erkannt.
Dies ist ein mittelschwerer Fehler. Je nach Anzahl der Fehler muss das physische Laufwerk möglicherweise ausgetauscht werden.
Auch wenn der ungültige Block behoben sein kann, ist dies eine Warnung, dass in Zukunft weitere ungültige Blöcke gefunden werden.
Lösung
1. Melden Sie sich über eine PuTTY-Sitzung beim Avamar-Server an und laden Sie die Admin-Schlüssel. Siehe Avamar: Anweisungen zum Laden von Schlüsseln finden Sie unter Anmelden bei einem Avamar-Server und Laden verschiedener Schlüssel.
ein. Verwenden Sie die Informationen aus der MC-Benutzeroberfläche, dem AUI-Ereignis oder dem DialHome Service-Request den Node, der die Fehlermeldung erzeugt hat.
b. Stellen Sie eine Verbindung zum Node her:
ssn 0.#
(Dabei ist 0.# die Nummer des physischen Nodes.)
2. Überprüfen Sie die /var/log/messages Datei auf dem Node, der die Fehler verursacht:
grep -i "Bad Block" /var/log/messages
Eine Beispielausgabe finden Sie in ANHANG A.
3. Bestätigen Sie den Status der Festplatten:
ein. Für die vollständige Ausgabe aller physischen Laufwerksattribute:
arcconf getconfig 1 pd
Eine Beispielausgabe finden Sie in Anhang B.
-- oder --
b. Für eine komprimierte Ansicht des Festplattenstatus und der Laufzeitfehler: Eine Beispielausgabe finden Sie in Anhang C.
arcconf getconfig 1 pd | grep -E 'Device|^[[:space:]]+State|Error' | grep -v 'Device Phy Information'
Eine Beispielausgabe finden Sie in Anhang C.
- Wenn der Festplattenstatus als "Failed", "Critical" oder "Missing" gemeldet wird: Ersetzen Sie das physische Laufwerk
- Wenn der Festplattenstatus als Online gemeldet wird und die mittlere Fehleranzahl unter 100 liegt: Keine Aktion erforderlich
- Wenn der Festplattenstatus als Online gemeldet wird und die mittlere Fehleranzahl zwischen 100 und 200 liegt: Es liegen mögliche Anzeichen einer Verschlechterung vor – genau überwachen
- Wenn der Festplattenstatus als Online gemeldet wird und die mittlere Fehleranzahl 200 oder mehr beträgt: Ersetzen Sie das physische Laufwerk
Wenn ein Festplattenaustausch erforderlich ist, wenden Sie sich an den Dell Avamar Support.
Weitere Informationen
ANHANG A:
Beispielausgabe von: grep -i "bad block" /var/log/messages:
Sep 17 07:11:10 Adaptec Event Monitor: [13016] :WRN: Bad Block discovered: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6,
Sep 17 07:11:12 Adaptec Event Monitor: [13020] :INF: Bad Block repaired: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6.
Sep 17 07:11:16 Adaptec Event Monitor: [13016] :WRN: Bad Block discovered: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6,
Sep 17 07:11:17 Adaptec Event Monitor: [13020] :INF: Bad Block repaired: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6.
ANHANG B:
Beispielausgabe von: arcconf getconfig 1 pd
Controllers found: 1
--------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
Device #0
Device is a Hard drive
State : Online
Block Size : Unknown.
Programmed Max Speed : SAS 12.0 Gb/s
Transfer Speed : SAS 12.0 Gb/s
Reported Channel,Device(T:L) : 0,8(8:0)
Reported Location : Enclosure 0, Slot 0(Connector 0, Connector 1)
Reported ESD(T:L) : 2,0(0:0)
Vendor : HITACHI
Model : HUS72602CLAR2000
Firmware : N9C0
Serial number : K5H66BRA
World-wide name : 5000CCA25E43A6B3
Reserved Size : 3163160 KB
Used Size : 1904640 MB
Unused Size : 64 KB
Total Size : 1907729 MB
Write Cache : Disabled (write-through)
FRU : None
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Power State : Full rpm
Supported Power States : Full rpm,Powered off
SSD : No
Temperature : 27 C/ 80 F
----------------------------------------------------------------
Device Phy Information
----------------------------------------------------------------
Phy #0
PHY Identifier : 0
SAS Address : 5000CCA25E43A6B1
Attached PHY Identifier : 17
Attached SAS Address : 50060481618A167F
Phy #1
PHY Identifier : 1
SAS Address : 5000CCA25E43A6B2
----------------------------------------------------------------
Runtime Error Counters
---------------------------------------------------------------
Hardware Error Count : 0
Medium Error Count : 102
Parity Error Count : 0
Link Failure Count : 0
Aborted Command Count : 0
SMART Warning Count : 0
ANHANG C:
Beispielausgabe von: arcconf getconfig 1 pd | grep -E 'Device|^[[:space:]]+State|Error' | grep -v 'Device Phy Information'
Device #5
Device is a Hard drive
State : Online
Reported Channel,Device(T:L) : 0,13(13:0)
Runtime Error Counters
Hardware Error Count : 0
Medium Error Count : 11
Parity Error Count : 0