Домен даних: Карта пам'яті або модуль DIMM з помилкою "Помилка" або "Несправність"
Summary: Цей документ допомагає визначити помилку або несправність і надає шлях її вирішення.
Symptoms
Застосовується для:
- Всі системи Data Domain
- Усі версії програмного забезпечення операційної системи Data Domain Operating System (DDOS)
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
Модулі DIMM, встановлені в системах домену даних, мають код перевірки помилок (ECC), який дозволяє виправляти помилки пам'яті на льоту. Якщо порушується поріг помилки, то DDOS виявляє несправність, і в системі буде згенеровано відповідне попередження.
Невиправні помилки пам'яті можуть спричинити перезавантаження системи та вважаються несправністю жорсткої пам'яті. Повний вихід з ладу будь-якого окремого модуля DIMM або Memory Riser може призвести до події System Fault (Лад системи) і перешкодити активації файлової системи. Це пов'язано з тим, що процес файлової системи домену даних (DDFS) заповнює більшу частину фізичної пам'яті.
Resolution
ПРИМІТКА. Якщо в системах на базі Dell PowerEdge повідомляється про помилку DIMM, першою дією для відновлення є перезавантаження модуля DataDomain. Це ініціює PPR (POST Package Repair) для відновлення модуля DIMM.
Необхідно докласти зусиль для визначення причини попередження та ідентифікації відповідних модулів DIMM, ЦП або материнської плати, а також замінити деталі за потреби.
Якщо можливо, зберіть пакет підтримки та створіть запит на обслуговування з постачальником послуг, з яким ви уклали контракт. У наступному відео показано, як зібрати пакет підтримки: Зберіть пакет
підтримкиКерівні принципи:
- Для систем на базі Dell PowerEdge ініціюйте перезавантаження системи, щоб полегшити автоматичний ремонт після пакетів (PPR); для відновлення модуля DIMM.
- Удосконалення мікропрограми BIOS дозволяють PPR відновлювати помилки, які можна виправити та виправити DIMM (довідник)
- Порівняйте поточний стан системи з автоматичною підтримкою від ДО збою або попередження DIMM
- Корисні DD-CLI (SSH) команди для перевірки пам'яті:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Використовуйте функцію DDOS-діагностики в автономному режимі для перевірки та визначення несправностей. Перейдіть до служби підтримки Dell, щоб отримати доступ до посібника користувача автономного діагностичного комплексу Dell EMC Data Domain 6.x
- Якщо можливо, виконайте фізичні методи усунення несправностей для усунення та визначення несправного компонента (використовуючи задокументовані інструкції та процедури заміни).
- Встановіть модуль DIMM на місце - переконайтеся, що обидві сторони зафіксовані належним чином.
- Замініть його на свідомо справний модуль DIMM з іншого слота, каналу, банку або контролера.
- Якщо система не працює (завантаження відсутнє) через підозру на несправність пам'яті/дімм, спробуйте варіант мінімального завантаження (вийміть периферійні пристрої або карти та залиште 1x DIMM у слоті «0»)
Additional Information
- Дивіться статтю знань 130388: Документи PowerProtect і Data Domain Hardware для отримання відповідної інформації про конфігурацію та компонування модулів DIMM.
- Дивіться статтю про знання 82030: Домен даних: Вимоги до системної пам'яті та розширені конфігурації сховища