Data Domain: Arızalı veya Hata Veren Bellek Kartı ya da DIMM

Summary: Bu belge, hatayı veya arızayı tespit etme ve çözüm yolu sağlama konusunda yardımcı olur.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Data Domain (DD) sistemleri, sistem bellek donanımının (DIMM'ler) durumunu izler. DIMM ile ilişkili herhangi bir hatayla karşılaşılırsa ilgili bir uyarı bildirimi yayınlanır.

Aşağıdakiler için geçerlidir:
  • Tüm Data Domain sistemleri
  • Data Domain işletim sisteminin (DDOS) tüm yazılım sürümleri
DDOS tarafından yayınlanan olası uyarı bildirimleri:
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert. 
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)

Cause

Data Domain sistemlerine takılı olan DIMM'ler, düzeltilebilir bellek hatalarının sistem çalışırken giderilmesine olanak sağlayan Hata Denetleme Kodu'na (ECC) sahiptir. Bir hata eşiği aşılırsa DDOS arızayı tanımlar ve sistemde uygun bir Uyarı oluşturulur.

Düzeltilemez bellek hataları sistemin yeniden başlatılmasına neden olabilir ve bu, sabit bellek hatası olarak kabul edilir. Tek bir DIMM veya Bellek Yükselticinin toplam arızası, Sistem Kapalı olayına neden olabilir ve Filesystem'ın etkinleştirilmesini önleyene kadar. Bunun nedeni, Data Domain Dosya Sistemi (DDFS) işleminin fiziksel belleğin çoğunu doldurmasıdır.

NOT: Diğer belirtiler veya uyarılar bellek hatalarını (örneğin, CPU Makine Kontrolü Hatası) gizleyebilir ve daha derinlemesine günlük analizi ve sorun giderme işlemleri gerektirebilir.

Resolution

NOT: Dell PowerEdge tabanlı sistemlerde bir DIMM hatası bildirilirse yapılacak ilk kurtarma işlemi DataDomain birimini yeniden başlatmaktır. Bu işlem, DIMM'yi kurtarmak için PPR yi (POST Paketi Onarımı) başlatır.

Uyarının nedenini belirlemek ve etkilenen bileşen DIMM'lerini, CPU'yu veya Anakartı belirlemek ve parçaları gerektiği gibi değiştirmek için çaba gösterilmelidir. 

Mümkünse bir Destek Paketi toplayın ve sözleşmeli servis sağlayıcınıza Servis Talebi gönderin. Bağlantısı verilen şu videoda Destek Paketinin nasıl toplanacağı gösterilmiştir: Destek Paketi ToplamaBu köprü bağlantı sizi Dell Technologies dışındaki bir web sitesine yönlendirir.

Çözüm Yönergeleri:

  • Dell PowerEdge tabanlı sistemlerde, otomatik Paket Sonrası Onarımı (PPR) kolaylaştırmak için sistemi yeniden başlatın; DIMM'yi kurtarmak için.
    • BIOS Bellenimindeki iyileştirmeler, PPR'nin DIMM düzeltilebilir ve düzeltilemez Hataları kurtarmasına olanak tanır (Referans)
  • Mevcut sistem durumunu DIMM arızası veya uyarısından ÖNCEKİ bir Auto-Support mesajıyla karşılaştırın
  • Belleği kontrol etmek için faydalı DD-CLI (SSH) komutları:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering  ('q' to quit)
  • Test gerçekleştirip arızayı belirlemek için DDOS çevrimdışı tanılama özelliğini kullanın. Dell EMC Data Domain İşletim Sistemi 6.x Çevrimdışı Tanılama Paketi Kullanıcı Kılavuzu'na (İngilizce) erişmek için Dell Destek sayfasına gidin.
  • Mümkünse arızalı bileşeni tespit edip ortadan kaldırmak için fiziksel sorun giderme yöntemleri uygulayın (belgelenmiş değiştirme kılavuzlarını ve prosedürlerini kullanarak).
  • Her iki taraftaki mandalların yerine oturduğundan emin olmak için DIMM'yi yeniden yerleştirin.
  • DIMM'yi başka bir yuva, kanal, sıra veya denetleyicideki çalıştığı bilinen bir DIMM ile değiştirin:
  • Bir sistem, şüphelendiğiniz bir bellek/DIMM arızası nedeniyle çalışmıyorsa (veya önyüklenmiyorsa) minimum önyükleme seçeneklerinden birini deneyin (çevre birimi aygıtlarını veya kartları çıkarın ve "0" yuvasında 1 tane DIMM bırakın).

Additional Information

Referanslar:

Affected Products

Data Domain, Integrated Data Protection Appliance Family

Products

PowerProtect Data Protection Appliance, Data Domain, Data Domain Deduplication Storage Systems, PowerProtect Data Protection Hardware
Article Properties
Article Number: 000204330
Article Type: Solution
Last Modified: 03 Mar 2025
Version:  11
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.