Avamar: Hardware Gen4T: Symptom Code: 52764 - Blocco danneggiato rilevato
Riepilogo: Questo articolo della knowledgebase fa riferimento agli errori dei supporti sui dischi fisici nei nodi Avamar Data Store Gen4T e spiega come risolverli.
Sintomi
I seguenti errori vengono visualizzati nell'interfaccia utente di MC, AUI e /var/log/messages File sul nodo:
Symptom Code: 52764, Desc: Adaptec Event Monitor: [13016] :WRN: Bad Block discovered: controller: Causa
È stato rilevato un blocco danneggiato su un disco fisico.
Si tratta di un errore medio e, a seconda del numero di errori, il disco fisico potrebbe richiedere la sostituzione.
Anche se il blocco danneggiato potrebbe essere risolto, questo è un avvertimento che indica che verranno trovati altri blocchi danneggiati in futuro.
Risoluzione
1. Accedere all'Avamar Server utilizzando una sessione PuTTY e caricare le chiavi amministratore. Vedere Avamar: Come accedere a un Avamar Server e caricare varie chiavi per istruzioni sul caricamento delle chiavi.
un. Utilizzando le informazioni dell'interfaccia utente di MC, dell'evento AUI o di DialHome Service Request, determinare il nodo che ha generato il messaggio di errore.
b. Connettersi al nodo:
ssn 0.#
(dove 0.# è il numero del nodo fisico).
2. Esaminare /var/log/messages sul nodo che genera gli errori:
grep -i "Bad Block" /var/log/messages
Vedere l'APPENDICE A per l'output di esempio.
3. Verificare lo stato dei dischi:
un. Per visualizzare l'output completo di tutti gli attributi dei dischi fisici:
arcconf getconfig 1 pd
Vedere l'APPENDICE B per l'output di esempio.
-- Oppure --
b. Per un analisi sintetica dello stato del disco e degli errori di runtime: Vedere l'APPENDICE C per l'output di esempio.
arcconf getconfig 1 pd | grep -E 'Device|^[[:space:]]+State|Error' | grep -v 'Device Phy Information'
Vedere l'APPENDICE C per l'output di esempio.
- Se lo stato del disco è segnalato come Failed, Critical o Missing: Sostituire il disco fisico
- Se lo stato del disco è segnalato come Online e il numero medio di errori è inferiore a 100: Non è necessaria alcuna azione
- Se lo stato del disco è segnalato come Online e il numero medio di errori è compreso tra 100 e 200: Ci sono potenziali segni di deterioramento - monitorare attentamente
- Se lo stato del disco viene segnalato ad Online e il numero medio di errori è pari o superiore a 200: Sostituire il disco fisico
Se è necessario sostituire un disco, contattare il supporto Dell Avamar.
Informazioni aggiuntive
APPENDICE A:
Esempio di output di: grep -i "bad block" /var/log/messages:
Sep 17 07:11:10 Adaptec Event Monitor: [13016] :WRN: Bad Block discovered: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6,
Sep 17 07:11:12 Adaptec Event Monitor: [13020] :INF: Bad Block repaired: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6.
Sep 17 07:11:16 Adaptec Event Monitor: [13016] :WRN: Bad Block discovered: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6,
Sep 17 07:11:17 Adaptec Event Monitor: [13020] :INF: Bad Block repaired: controller: 1 ( PM8060-RAID #FFFFFF00 Physical Slot: 0 ), channel: 0, deviceID: 14, enclosure ID: 0, slot ID: 6.
APPENDICE B:
Esempio di output di: arcconf getconfig 1 pd
Controllers found: 1
--------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
Device #0
Device is a Hard drive
State : Online
Block Size : Unknown.
Programmed Max Speed : SAS 12.0 Gb/s
Transfer Speed : SAS 12.0 Gb/s
Reported Channel,Device(T:L) : 0,8(8:0)
Reported Location : Enclosure 0, Slot 0(Connector 0, Connector 1)
Reported ESD(T:L) : 2,0(0:0)
Vendor : HITACHI
Model : HUS72602CLAR2000
Firmware : N9C0
Serial number : K5H66BRA
World-wide name : 5000CCA25E43A6B3
Reserved Size : 3163160 KB
Used Size : 1904640 MB
Unused Size : 64 KB
Total Size : 1907729 MB
Write Cache : Disabled (write-through)
FRU : None
S.M.A.R.T. : No
S.M.A.R.T. warnings : 0
Power State : Full rpm
Supported Power States : Full rpm,Powered off
SSD : No
Temperature : 27 C/ 80 F
----------------------------------------------------------------
Device Phy Information
----------------------------------------------------------------
Phy #0
PHY Identifier : 0
SAS Address : 5000CCA25E43A6B1
Attached PHY Identifier : 17
Attached SAS Address : 50060481618A167F
Phy #1
PHY Identifier : 1
SAS Address : 5000CCA25E43A6B2
----------------------------------------------------------------
Runtime Error Counters
---------------------------------------------------------------
Hardware Error Count : 0
Medium Error Count : 102
Parity Error Count : 0
Link Failure Count : 0
Aborted Command Count : 0
SMART Warning Count : 0
APPENDICE C:
Esempio di output di: arcconf getconfig 1 pd | grep -E 'Device|^[[:space:]]+State|Error' | grep -v 'Device Phy Information'
Device #5
Device is a Hard drive
State : Online
Reported Channel,Device(T:L) : 0,13(13:0)
Runtime Error Counters
Hardware Error Count : 0
Medium Error Count : 11
Parity Error Count : 0