Домен даних: Карта пам'яті або модуль DIMM з помилкою "Помилка" або "Несправність"

Summary: Цей документ допомагає визначити помилку або несправність і надає шлях її вирішення.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Системи домену даних (DD) відстежують стан апаратного забезпечення системної пам'яті (DIMM). У разі виникнення будь-яких помилок, пов'язаних із DIMM, надсилається відповідне сповіщення про попередження.

Застосовується для:
  • Всі системи Data Domain
  • Усі версії програмного забезпечення операційної системи Data Domain Operating System (DDOS)
Можливі сповіщення, що публікуються DDOS:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Cause

Модулі DIMM, встановлені в системах домену даних, мають код перевірки помилок (ECC), який дозволяє виправляти помилки пам'яті на льоту. Якщо порушується поріг помилки, то DDOS виявляє несправність, і в системі буде згенеровано відповідне попередження.

Невиправні помилки пам'яті можуть спричинити перезавантаження системи та вважаються несправністю жорсткої пам'яті. Повний вихід з ладу будь-якого окремого модуля DIMM або Memory Riser може призвести до події System Fault (Лад системи) і перешкодити активації файлової системи. Це пов'язано з тим, що процес файлової системи домену даних (DDFS) заповнює більшу частину фізичної пам'яті.

ПРИМІТКА. За помилками пам'яті можуть маскуватися інші симптоми або попередження - наприклад, помилка перевірки процесорного апарату - може знадобитися більш глибокий аналіз журналу та усунення несправностей.

Resolution

ПРИМІТКА. Якщо в системах на базі Dell PowerEdge повідомляється про помилку DIMM, першою дією для відновлення є перезавантаження модуля DataDomain. Це ініціює PPR (POST Package Repair) для відновлення модуля DIMM.

Необхідно докласти зусиль для визначення причини попередження та ідентифікації відповідних модулів DIMM, ЦП або материнської плати, а також замінити деталі за потреби. 

Якщо можливо, зберіть пакет підтримки та створіть запит на обслуговування з постачальником послуг, з яким ви уклали контракт. У наступному відео показано, як зібрати пакет підтримки: Зберіть пакетЦе гіперпосилання веде вас на веб-сайт за межами Dell Technologies.

підтримкиКерівні принципи:

  • Для систем на базі Dell PowerEdge ініціюйте перезавантаження системи, щоб полегшити автоматичний ремонт після пакетів (PPR); для відновлення модуля DIMM.
    • Удосконалення мікропрограми BIOS дозволяють PPR відновлювати помилки, які можна виправити та виправити DIMM (довідник)
  • Порівняйте поточний стан системи з автоматичною підтримкою від ДО збою або попередження DIMM
  • Корисні DD-CLI (SSH) команди для перевірки пам'яті:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Використовуйте функцію DDOS-діагностики в автономному режимі для перевірки та визначення несправностей. Перейдіть до служби підтримки Dell, щоб отримати доступ до посібника користувача автономного діагностичного комплексу Dell EMC Data Domain 6.x
  • Якщо можливо, виконайте фізичні методи усунення несправностей для усунення та визначення несправного компонента (використовуючи задокументовані інструкції та процедури заміни).
  • Встановіть модуль DIMM на місце - переконайтеся, що обидві сторони зафіксовані належним чином.
  • Замініть його на свідомо справний модуль DIMM з іншого слота, каналу, банку або контролера.
  • Якщо система не працює (завантаження відсутнє) через підозру на несправність пам'яті/дімм, спробуйте варіант мінімального завантаження (вийміть периферійні пристрої або карти та залиште 1x DIMM у слоті «0»)

Additional Information

Посилання:

Affected Products

Data Domain, Integrated Data Protection Appliance Family

Products

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000204330
Article Type: Solution
Last Modified: 03 Mar 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.