Авамар: Апаратне забезпечення Gen4S: Як усунути різні події та помилки на диску
Summary: У цій статті розглядаються багато поширених помилок, пов'язаних з диском, про які повідомляється на вузлі Gen4S, разом із необхідними діями.
Symptoms
Події, подібні до наведених нижче, спостерігаються в інтерфейсі користувача або файлах журналу:
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Information unit CRC error detected, CDB = 0x28 0x00 0xb6 0x77 0xc3 0x07 0x00 0x01 0xd0 0x00, Sense = 0x70 0x00 0x0b 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x47 0x03 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Unrecovered read error, CDB = 0x28 0x00 0xd2 0x91 0xe0 0xf7 0x00 0x00 0x40 0x00, Sense = 0xf0 0x00 0x03 0xd2 0x91 0xe0 0xf7 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Hardware impending failure general hard drive failure, CDB = 0x03 0x00 0x00 0x00 0x40 0x00, Sense = 0x70 0x00 0x00 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x5d 0x10 0x00 0x00 0x00 0x00
Controller ID: 0 PD Reset: PD = Port 0 - 3:2:n, Error = 3, Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = -:-:n Recovered data - recommended rewrite, CDB = 0x2f 0x00 0x01 0x09 0x80 0x00 0x00 0x10 0x00 0x00, Sense = 0xf0 0x00 0x01 0x01 0x09 0x8f 0xed 0x18 0x00 0x00 0x00 0x00 0x18 0x06 0x00 0x80 0x09 0x19
Controller ID: 0 Command timeout on PD: PD = Port 0 - 3:2:n No additional sense information, CDB = 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff 0xff, Sense = , Path = 0x5001234567890
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Logical block address out of range, CDB = 0x2a 0x00 0xac 0x64 0xcd 0xe6 0x00 0x00 0x08 0x00, Sense = 0xf0 0x00 0x05 0xac 0x64 0xcd 0xe6 0x0a 0x00 0x00 0x00 0x00 0x21 0x00 0x00 0x00 0x00 0x00
Controller ID: 0 Unexpected sense: PD = Port 0 - 3:2:n Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x41 0xab 0x7a 0x00 0x00 0x00 0x80 0x00, Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00
Controller ID: 0 PD Predictive failure: Port 0 - 3:2:n
-
- 3:2:0 - 3:2:11 або -:-:0 - -:-:11 - внутрішні стандартні диски
- 3:2:12 або -:-:12 - внутрішній SSD-диск.
Cause
Причини та дії дивіться в розділі «Вирішення проблем».
Resolution
1. Увійдіть у вузол Avamar Utility Node як адміністратор.
2. Піднесіть до кореневого привілею.
3. Завантаження кореневих ключів за статтю Avamar: Як увійти на сервер Avamar і завантажити різні ключі.
4. Використовуючи інформацію з події UI або запиту служби dial-home, визначте вузол, який видав повідомлення про помилку.
5. Підключіться до вузла від імені root за допомогою наведеної нижче команди:
ssn 0.# --user=root
(Де 0.# – фізичний номер вузла)
6. На ураженому вузлі:
a. Перевірте поточний стан дисків:
avsysreport pdisk
b. Перегляньте /var/log/messages файл для подій, пов'язаних з диском, що повідомляє про подію.
Обов'язкові дії на основі зареєстрованих подій:
- Для події "Відновлені дані - рекомендується перезапис":
- Якщо диск не повідомив про жодні інші події, це можна сміливо ігнорувати
- Якщо є інші події, такі як «Невідновлена помилка зчитування», зверніться до Dell Technologies , щоб визначити, чи потрібно завчасно замінити диск.
- Для події "Логічна адреса блоку поза діапазоном":
- Якщо диск не повідомив про жодні інші події, це можна сміливо ігнорувати
- Якщо є інші події, такі як «Невідновлена помилка зчитування», зверніться до Dell Technologies , щоб визначити, чи потрібно завчасно замінити диск.
- Для події "Невідновлена помилка зчитування":
- Якщо подія повторюється більше трьох разів на одному диску, можливо, на диску виникли проблеми з цілісністю. Зверніться до компанії Dell Technologies, щоб визначити, чи потрібно завчасно замінити диск.
- Для події "Виявлено помилку CRC інформаційного блоку":
- Якщо диск повідомляє про подію 3:2:12, це означає, що SSD виходить з ладу. Зверніться до Dell Technologies для заміни вузла за допомогою процедури пересадки вузла.
- Якщо диск, який повідомляє про подію, має значення 3:2:0–3:2:11, це означає, що жорсткий диск вийшов з ладу. Зверніться до Dell Technologies для проактивної заміни диска.
- Для події "Апаратний загроза збій, загальний вихід з ладу жорсткого диска":
-
- Якщо диск, що повідомляє про подію, становить 3:2:12, SSD вийшов з ладу (або вийшов з ладу). Зверніться до Dell Technologies для заміни вузла за допомогою процедури пересадки вузла.
- Якщо диск, який повідомляє про подію, має значення 3:2:0-3:2:11, жорсткий диск вийшов з ладу (або вийшов з ладу). Зверніться до Dell Technologies для проактивної заміни диска.
- Для заходу «Прогностичний збій:
- Якщо диск, який повідомляє про подію, має значення 3:2:12, SSD повідомляє про прогнозне попередження про збій через функцію SMART і вказує, що SSD виходить з ладу. Зверніться до Dell Technologies для заміни вузла за допомогою процедури пересадки вузла.
- Якщо диск, який повідомляє про подію: 3:2:0–3:2:11, жорсткий диск повідомляє про прогнозне попередження про збій за допомогою функції SMART і вказує, що жорсткий диск виходить з ладу. Зверніться до Dell Technologies для проактивної заміни диска.
- Для події "Сталося ввімкнення, скидання або скидання пристрою на автобусі":
- Перегляньте
/var/log/messagesfile, щоб перевірити, чи повідомляється про помилку на одному або кількох дисках.- Якщо про помилку повідомляється один диск, вони можуть бути пов'язані з щотижневими перевірками стабільності. Зверніться до компанії Dell Technologies, щоб визначити, чи потрібно завчасно замінити диск.
- Якщо про помилку повідомляють кілька дисків, це означає, що прошивка розширювача застаріла або шасі знаходиться в несправному або несправному стані. Зверніться до компанії Dell Technologies, щоб перевірити рівень прошивки або замінити вузол за допомогою процедури пересадки вузла.
- Перегляньте
- Для події "PD Reset":
- Перегляньте
/var/log/messagesfile, щоб перевірити, чи повідомляється про помилку на одному або кількох дисках.- Якщо диск був замінений недавно, це повідомлення очікується і може бути проігноровано.
- Якщо накопичувач не був замінений і не перезібраний самостійно, можливо, він вийшов з ладу або вийшов з ладу. Зверніться до Dell Technologies для проактивної заміни диска.
- Перегляньте
- Для подій «Тайм-аут команди на PD» або будь-якої іншої помилки, про яку ще не згадувалося, зверніться до Dell Technologies для визначення наступного курсу дій.