VxBlock: Поиск и устранение ошибок памяти в Cisco UCS
Summary: В этой статье подробно описано, как найти и устранить ошибки памяти в среде Cisco Unified Computing System (UCS).
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
Идентификация ошибки:
- Просмотрите вкладку «Неисправности» в UCS, чтобы определить наличие ошибок и их последствий.
- Соберите журналы UCSM и корпуса с затронутого сервера ПЕРЕД поиском и устранением неисправностей. Это необходимо для сбора исторических данных, чтобы определить, возвращаются ли эти ошибки после устранения неполадок.
Подтверждение ошибки:
После выявления ошибок удалите их все и отслеживайте счетчики, чтобы убедиться, что они не устранились.
- Войдите в командную строку UCS.
- Ошибки сброса памяти с помощью следующих команд:
CLI# сервер области X/Y
CLI# reset-all-memory-errors
CLI# commit-buffer
- Очистите журналы системных событий с помощью следующих команд:
CLI# сервер области X/Y
CLI# очистить SEL
CLI# commit-buffer
- Сбросьте CIMC с помощью следующих команд:
Область CLI# сервера X/Y
CLI# CLI# область
CIMC
CLI# сброс буфера фиксации CLI#
- Мониторинг среды в течение 48 часов.
Устранение физических неполадок.
Перед заменой модуля DIMM определите, с чем связаны ошибки — с разъемом, модулем DIMM или процессором.
Это достигается путем замены аппаратных компонентов и мониторинга среды. Инструкции приведены ниже:
- Переведите хост ESXi в режим обслуживания.
- Неисправные модули DIMM следует заменить на модули DIMM, для которых ранее не было обнаружено никаких проблем.
- Сервер должен быть перезагружен и оставаться в режиме обслуживания.
- За сервером можно наблюдать в течение 48 часов, чтобы узнать, появляется ли проблема снова.
Если вы не можете переустановить компоненты, обратитесь в службу поддержки Dell или воспользуйтесь помощью к дополнительным специалистам.
Если ошибки не будут устранены после переустановки, выполните следующие действия.
- Если DIMM ошибается, установите модуль DIMM в новый разъем и замените его.
- Если ошибки DIMM остаются в том же слоте DIMM, замените системную плату.
- Если ошибки DIMM не исчезнут после замены модуля DIMM и системной платы, запустите WebEx для поиска и устранения неисправностей в реальном времени с помощью службы поддержки Dell.
Additional Information
Посмотрите следующее видео.
Affected Products
Converged InfrastructureArticle Properties
Article Number: 000194121
Article Type: How To
Last Modified: 19 Nov 2025
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.