VxBlock: Поиск и устранение ошибок памяти в Cisco UCS

Summary: В этой статье подробно описано, как найти и устранить ошибки памяти в среде Cisco Unified Computing System (UCS).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Идентификация ошибки:

  • Просмотрите вкладку «Неисправности» в UCS, чтобы определить наличие ошибок и их последствий. 
  • Соберите журналы UCSM и корпуса с затронутого сервера ПЕРЕД поиском и устранением неисправностей. Это необходимо для сбора исторических данных, чтобы определить, возвращаются ли эти ошибки после устранения неполадок. 


Подтверждение ошибки:
После выявления ошибок удалите их все и отслеживайте счетчики, чтобы убедиться, что они не устранились. 

  1. Войдите в командную строку UCS.
  2. Ошибки сброса памяти с помощью следующих команд:

CLI# сервер области X/Y
CLI# reset-all-memory-errors
CLI# commit-buffer

  1. Очистите журналы системных событий с помощью следующих команд:

CLI# сервер области X/Y
CLI# очистить SEL
CLI# commit-buffer

  1. Сбросьте CIMC с помощью следующих команд:

Область CLI# сервера X/Y
CLI# CLI# область
CIMC
CLI# сброс буфера фиксации CLI#

  1. Мониторинг среды в течение 48 часов. 
Если ошибки памяти не будут устранены, соберите новый набор журналов UCSM и корпуса и перейдите к следующему разделу. 


Устранение физических неполадок.
Перед заменой модуля DIMM определите, с чем связаны ошибки — с разъемом, модулем DIMM или процессором.

Это достигается путем замены аппаратных компонентов и мониторинга среды. Инструкции приведены ниже:
  1. Переведите хост ESXi в режим обслуживания. 
  2. Неисправные модули DIMM следует заменить на модули DIMM, для которых ранее не было обнаружено никаких проблем.
  3. Сервер должен быть перезагружен и оставаться в режиме обслуживания.
  4. За сервером можно наблюдать в течение 48 часов, чтобы узнать, появляется ли проблема снова.

Если вы не можете переустановить компоненты, обратитесь в службу поддержки Dell или воспользуйтесь помощью к дополнительным специалистам.  

Если ошибки не будут устранены после переустановки, выполните следующие действия.

  • Если DIMM ошибается, установите модуль DIMM в новый разъем и замените его. 
  • Если ошибки DIMM остаются в том же слоте DIMM, замените системную плату.
  • Если ошибки DIMM не исчезнут после замены модуля DIMM и системной платы, запустите WebEx для поиска и устранения неисправностей в реальном времени с помощью службы поддержки Dell.  

Additional Information

Посмотрите следующее видео.

Affected Products

Converged Infrastructure
Article Properties
Article Number: 000194121
Article Type: How To
Last Modified: 19 Nov 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.