Avamar. Оборудование Gen4S: Как реагировать на различные события и ошибки диска
Summary: В этой статье рассматриваются многие распространенные ошибки, связанные с дисками, о которых сообщается на узле Gen4S, а также необходимые действия.
Symptoms
В пользовательском интерфейсе или файлах журнала наблюдаются события, аналогичные следующим:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0–3:2:11 или -:-:0 – -:-:11 – внутренние стандартные диски
- 3:2:12 или -:-:12 — внутренний SSD диск.
Cause
Причины и действия см. в разделе «Решение».
Resolution
1. Войдите в Avamar Utility Node в качестве администратора.
2. Повышение до привилегий root.
3. Загрузка корневых ключей для каждой статьи Avamar: Как выполнить вход в Avamar Server и загрузить разные ключи.
4. Используя информацию из события пользовательского интерфейса или сервисной заявки домашнего вызова, определите узел, который создал сообщение об ошибке.
5. Подключитесь к узлу в качестве пользователя root с помощью следующей команды:
ssn 0.# --user=root
(Где 0.# — номер физического узла)
6. На затронутом узле:
a. Проверьте текущее состояние дисков.
avsysreport pdisk
b. Просмотрите /var/log/messages Файл для событий, связанных с диском, сообщает о событии.
Необходимые действия на основе зарегистрированных событий:
- Для события "Восстановленные данные - рекомендуется перезапись":
- Если диск не сообщал о других событиях, это можно игнорировать
- При возникновении других событий, таких как «Ошибка невосстановленного чтения», обратитесь в Dell Technologies , чтобы определить, требуется ли упреждающая замена диска.
- Для события «Адрес логического блока вне допустимого диапазона»:
- Если диск не сообщал о других событиях, это можно игнорировать
- При возникновении других событий, таких как «Ошибка невосстановленного чтения», обратитесь в Dell Technologies , чтобы определить, требуется ли упреждающая замена диска.
- Для события "Unrecovered read error":
- Если событие повторяется на одном диске более трех раз , возможно, проблема целостности данного диска. Обратитесь в Dell Technologies , чтобы узнать, требуется ли упреждающая замена диска.
- Для события "Обнаружена ошибка в информационном блоке CRC":
- Если диск, сообщающий о событии, имеет значение 3:2:12, это указывает на сбой твердотельного накопителя. Обратитесь в Dell Technologies для замены узла с помощью процедуры трансплантации.
- Если диск сообщает о событии 3:2:0-3:2:11, это указывает на сбой жесткого диска. Обратитесь в Dell Technologies за упреждающей заменой диска.
- Для события "Надвигающийся аппаратный сбой общего жесткого диска":
-
- Если диск, сообщающий о событии, имеет значение 3:2:12, твердотельный накопитель неисправн (или неисправн). Обратитесь в Dell Technologies для замены узла с помощью процедуры трансплантации.
- Если диск сообщает о событии 3:2:0-3:2:11, жесткий диск неисправен (или уже отказал). Обратитесь в Dell Technologies за упреждающей заменой диска.
- Для мероприятия «Прогнозируемый сбой:
- Если диск, сообщающий о событии, имеет значение 3:2:12, твердотельный накопитель сообщает о прогнозируемом сбое с помощью функции SMART и указывает на то, что твердотельный накопитель отказывает. Обратитесь в Dell Technologies для замены узла с помощью процедуры трансплантации.
- Если диск сообщает о событии 3:2:0-3:2:11, жесткий диск сообщает о прогнозируемом сбое с помощью функции SMART и указывает на сбой жесткого диска. Обратитесь в Dell Technologies за упреждающей заменой диска.
- Для события «Включение, сброс или сброс устройства шины» выполните следующие действия.
- Изучите сведения в
/var/log/messages, чтобы проверить, сообщают ли об ошибке один или несколько дисков.- Если один диск сообщает об ошибке, они могут быть связаны с еженедельными проверками согласованности. Обратитесь в Dell Technologies , чтобы узнать, требуется ли упреждающая замена диска.
- Если об ошибке сообщают несколько дисков, микропрограмма расширителя устарела или корпус находится в состоянии сбоя или сбоя. Обратитесь в Dell Technologies , чтобы проверить уровни микропрограммы, или замените узел с помощью процедуры трансплантации узла.
- Изучите сведения в
- Для события «Сброс PD»:
- Изучите сведения в
/var/log/messages, чтобы проверить, сообщают ли об ошибке один или несколько дисков.- Если диск был заменен недавно, это сообщение является ожидаемым и его можно игнорировать.
- Если диск не был заменен и восстановлен самостоятельно, возможно, он неисправен или неисправен. Обратитесь в Dell Technologies за упреждающей заменой диска.
- Изучите сведения в
- В случае событий «Command Timeout on PD» или любой другой ошибки, которая еще не была упомянута , обратитесь в Dell Technologies , чтобы определить следующий порядок действий.