Шкала потужності: Політика заміни модулів DIMM для вузлів Isilon - Ідентифікатор події: 900010007, 900160004
Summary: Політика заміни подвійного вбудованого модуля пам'яті (DIMM) для вузлів Isilon для ідентифікатора події: 900010007, 900160004.
Symptoms
Коли OneFS виявляє подію перевірки та виправлення помилок DIMM (ECC), вона реєструється в isi_hwmon.log.
Після цього повідомлення про подію надсилається адміністратору кластера. Після реєстрації певної кількості помилок помилка виникає за допомогою політики Isilon щодо заміни модуля DIMM.
Деталі політики
- Багатобітові або невиправні (UNCOR) помилки ECC ВИМАГАЮТЬ НЕГАЙНОЇ ЗАМІНИ.
Помилки такого типу зазвичай викликають у вузла паніку і перезавантаження. - Однобітові помилки ECC: Початкові сплески однобітових помилок ECC на певному модулі DIMM є прийнятними. Надмірне повторення помилок на одному й тому самому модулі DIMM вимагає заміни. Нижче наведено дві категорії однобітових помилок ECC та їх подробиці:
- Категорія 1: ДОПУСТИМІ ПОМИЛКИ
- Максимум 500 помилок, які можна виправити, на вузлах DIMM дозволено протягом 24 годин на вузлах Gen5 (S/X210. NL/X410, HD400)
- Максимум 5000 виправлених помилок на модулі DIMM дозволено протягом 24 годин на вузлах Gen6 і новіших (F900/810/800/600/200, H700/7000/600/500/400, A200/2000/300/3000)
- Категорія 2: ВИМАГАЄ ЗАМІНИ
- Модулі DIMM повідомляють про кількість помилок, що перевищує вказану вище кількість, протягом 24 годин
- Невиправні (UNCOR) помилки
- Модулі dimm, які можуть бути показані як такі, що спричинили паніку або перезавантаження вузла, незалежно від кількості або типу помилок
- Модулі DIMM, які повідомляють про відсутність
- Категорія 1: ДОПУСТИМІ ПОМИЛКИ
Однобітові помилки ECC реєструються як виправлені помилки ECC або нефатальні помилки пам'яті.
Cause
Resolution
Якщо OneFS згенерувала сповіщення про заміну DIMM для певного модуля DIMM, замініть указаний модулі DIMM. Додаткова перевірка перед заміною не потрібна. Існують проблеми з виявленням і правильним повідомленням про несправні модулі DIMM у версіях OneFS 8.1.0.3 і старіших. Усі підтримувані версії OneFS правильно виявляють і повідомляють про порушення порогу заміни модуля DIMM.