VxBlock: Solução de problemas de erros de memória em um Cisco UCS

Summary: Este artigo detalha como solucionar problemas e resolver erros de memória em um ambiente Cisco Unified Computing System (UCS).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Identificação do erro:

  • Analise a guia "falhas" no UCS para determinar se há erros e impactos. 
  • Capture logs do UCSM e do chassi do servidor afetado ANTES de realizar qualquer solução de problemas. Isso é necessário para capturar dados históricos para identificar se esses erros retornam após a solução de problemas. 


Confirmação do erro:
Depois que os erros forem identificados, limpe-os todos e monitore os contadores para ver se eles persistem. 

  1. Faça login na linha de comando do UCS.
  2. Redefina os erros de memória usando os seguintes comandos:

CLI# scope server X/Y
CLI# reset-all-memory-errors
CLI# commit-buffer

  1. Limpe os logs de eventos do sistema usando os seguintes comandos:

CLI# scope server X/Y
CLI# clear sel
CLI# commit-buffer

  1. Redefina o CIMC usando os seguintes comandos:

CLI# scope server X/Y
CLI# scope cimc
CLI# reset
CLI# commit-buffer

  1. Monitore o ambiente por 48 horas. 
Se os erros de memória persistirem, capture um novo conjunto de logs do UCSM e do chassi e vá para a próxima seção. 


Solução de problemas físicos:
Antes que um módulo DIMM possa ser substituído, determine se os erros estão relacionados ao soquete, ao DIMM ou à CPU.

Isso é feito trocando os componentes de hardware e monitorando o ambiente. As instruções são fornecidas abaixo:
  1. Coloque o host do ESXi no modo de manutenção. 
  2. Os DIMMs com defeito devem ser trocados por DIMMs que não estavam apresentando problemas anteriormente.
  3. O servidor deve ser reinicializado e permanecer no modo de manutenção.
  4. O servidor pode ser monitorado por 48 horas para ver se o problema se apresenta novamente.

Se você não conseguir recolocar os componentes, entre em contato com o Suporte Dell ou entre em contato com recursos adicionais para obter assistência.  

Se os erros persistirem após a recolocação, siga as ações abaixo:

  • Se houver erros de DIMM, siga o DIMM para um novo slot e substitua-o. 
  • Se os erros de DIMM permanecerem com o mesmo slot DIMM, substitua a placa-mãe.
  • Se os erros de DIMM persistirem após a substituição da DIMM e da placa-mãe, inicie um WebEx para solução de problemas em tempo real com o Suporte Dell.  

Additional Information

Assista a este vídeo:

Affected Products

Converged Infrastructure
Article Properties
Article Number: 000194121
Article Type: How To
Last Modified: 19 Nov 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.