Data Domain: Arızalı veya Hata Veren Bellek Kartı ya da DIMM
Summary: Bu belge, hatayı veya arızayı tespit etme ve çözüm yolu sağlama konusunda yardımcı olur.
Symptoms
Aşağıdakiler için geçerlidir:
- Tüm Data Domain sistemleri
- Data Domain işletim sisteminin (DDOS) tüm yazılım sürümleri
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
Data Domain sistemlerine takılı olan DIMM'ler, düzeltilebilir bellek hatalarının sistem çalışırken giderilmesine olanak sağlayan Hata Denetleme Kodu'na (ECC) sahiptir. Bir hata eşiği aşılırsa DDOS arızayı tanımlar ve sistemde uygun bir Uyarı oluşturulur.
Düzeltilemez bellek hataları sistemin yeniden başlatılmasına neden olabilir ve bu, sabit bellek hatası olarak kabul edilir. Tek bir DIMM veya Bellek Yükselticinin toplam arızası, Sistem Kapalı olayına neden olabilir ve Filesystem'ın etkinleştirilmesini önleyene kadar. Bunun nedeni, Data Domain Dosya Sistemi (DDFS) işleminin fiziksel belleğin çoğunu doldurmasıdır.
Resolution
NOT: Dell PowerEdge tabanlı sistemlerde bir DIMM hatası bildirilirse yapılacak ilk kurtarma işlemi DataDomain birimini yeniden başlatmaktır. Bu işlem, DIMM'yi kurtarmak için PPR yi (POST Paketi Onarımı) başlatır.
Uyarının nedenini belirlemek ve etkilenen bileşen DIMM'lerini, CPU'yu veya Anakartı belirlemek ve parçaları gerektiği gibi değiştirmek için çaba gösterilmelidir.
Mümkünse bir Destek Paketi toplayın ve sözleşmeli servis sağlayıcınıza Servis Talebi gönderin. Bağlantısı verilen şu videoda Destek Paketinin nasıl toplanacağı gösterilmiştir: Destek Paketi Toplama
Çözüm Yönergeleri:
- Dell PowerEdge tabanlı sistemlerde, otomatik Paket Sonrası Onarımı (PPR) kolaylaştırmak için sistemi yeniden başlatın; DIMM'yi kurtarmak için.
- BIOS Bellenimindeki iyileştirmeler, PPR'nin DIMM düzeltilebilir ve düzeltilemez Hataları kurtarmasına olanak tanır (Referans)
- Mevcut sistem durumunu DIMM arızası veya uyarısından ÖNCEKİ bir Auto-Support mesajıyla karşılaştırın
- Belleği kontrol etmek için faydalı DD-CLI (SSH) komutları:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Test gerçekleştirip arızayı belirlemek için DDOS çevrimdışı tanılama özelliğini kullanın. Dell EMC Data Domain İşletim Sistemi 6.x Çevrimdışı Tanılama Paketi Kullanıcı Kılavuzu'na (İngilizce) erişmek için Dell Destek sayfasına gidin.
- Mümkünse arızalı bileşeni tespit edip ortadan kaldırmak için fiziksel sorun giderme yöntemleri uygulayın (belgelenmiş değiştirme kılavuzlarını ve prosedürlerini kullanarak).
- Her iki taraftaki mandalların yerine oturduğundan emin olmak için DIMM'yi yeniden yerleştirin.
- DIMM'yi başka bir yuva, kanal, sıra veya denetleyicideki çalıştığı bilinen bir DIMM ile değiştirin:
- Bir sistem, şüphelendiğiniz bir bellek/DIMM arızası nedeniyle çalışmıyorsa (veya önyüklenmiyorsa) minimum önyükleme seçeneklerinden birini deneyin (çevre birimi aygıtlarını veya kartları çıkarın ve "0" yuvasında 1 tane DIMM bırakın).
Additional Information
- Bilgi makalesine bakın 130388: DIMM yapılandırması ve düzeni hakkında ilgili bilgiler için PowerProtect ve Data Domain Donanım Belgeleri.
- 82030 numaralı ilgili Knowledge Base makalesine bakın: Data Domain: Sistem Bellek Gereksinimleri ve Genişletilmiş Depolama Yapılandırmaları