Data Domain: Muistikortti tai DIMM, jossa on epäonnistunut tai viallinen virhe
Summary: Tämä asiakirja auttaa virheen tai vian tunnistamisessa ja tarjoaa ratkaisupolun.
Symptoms
Koskee seuraavia:
- Kaikki Data Domain -järjestelmät
- Kaikki Data Domain Operating System (DDOS) -ohjelmistoversiot
DIMM-00001: Correctable ECC logging limit reached
DIMM-00002: Multibit Uncorrectable ECC error
DIMM-00003: A memory card has failed
ENVIRONMENT-00009: Memory correctable ECC errors exceed warning threshold
ENVIRONMENT-00013: Memory uncorrectable ECC error alert.
ENVIRONMENT-00044: Memory riser fault has been detected
MEM-00001: DIMM failure detected after install. DDFS ""will not be started.
MEM-00002: Memory size(nnnnnnnnKB) goes below the configured size(nnnnnnnnKB)
Cause
Data Domain -järjestelmiin asennetuissa DIMM-moduuleissa on virheentarkistuskoodi (ECC), jonka avulla korjattavissa olevat muistivirheet voidaan korjata siirron aikana. Jos virhekynnys ylittyy, DDOS tunnistaa vian ja järjestelmään luodaan asianmukainen hälytys.
Korjaamattomat muistivirheet voivat aiheuttaa järjestelmän uudelleenkäynnistyksen, ja niitä pidetään kiintolevyviana. Yksittäisen DIMM-moduulin tai muistinostimen täydellinen vikaantuminen voi aiheuttaa järjestelmän kaatumisen ja estää tiedostojärjestelmän käyttöönoton. Tämä johtuu siitä, että DDFS (Data Domain File System) -prosessi täyttää suurimman osan fyysisestä muistista.
Resolution
HUOMAUTUS: Jos Dell PowerEdge -järjestelmissä ilmoitetaan DIMM-virheestä, ensimmäinen palautustoimenpide on käynnistää DataDomain-yksikkö uudelleen. Tämä käynnistää PPR:n (POST Package Repair) DIMM-moduulin palauttamiseksi.
Hälytyksen syy on pyrittävä selvittämään, tunnistamaan vialliset DIMM-moduulit, CPU tai emolevy sekä vaihtamaan osat tarvittaessa.
Jos mahdollista, kerää tukipaketti ja luo palvelupyyntö sopimuspalveluntarjoajasi kanssa. Seuraavassa videossa näytetään, miten voit kerätä tukipaketin: Kerää tukipaketti
Kriisinratkaisuohjeet:
- Käynnistä Dell PowerEdge -järjestelmissä järjestelmän uudelleenkäynnistys, jotta automaattinen POST-Package Repair (PPR) -korjaus helpottuu. DIMM-moduulin palautusta varten.
- BIOS-laiteohjelmiston parannusten ansiosta PPR voi palauttaa DIMM-korjattavissa olevat ja korjauskelvottomat virheet (hakemisto)
- Vertaa järjestelmän nykyistä tilaa automaattiseen tukeen, joka on suoritettu ENNEN DIMM-vikaa tai -hälytystä
- Hyödyllisiä DD-CLI (SSH) -komentoja muistin tarkistamiseen:
# alerts show current
# system show meminfo
# enclosure show memory
# log view debug/messages.engineering ('q' to quit)
- Käytä DDOS Offline Diagnosticsia vikojen testaamiseen ja määrittämiseen. Siirry Dell-tukeen ja avaa Dell EMC Data Domain Operating System 6.x Offline Diagnostics Suite -käyttöopas
- Jos mahdollista, suorita fyysisiä vianmääritysmenetelmiä viallisen osan poistamiseksi ja määrittämiseksi (käyttämällä dokumentoituja vaihto-oppaita ja -menettelyjä).
- Aseta DIMM-moduuli uudelleen paikalleen – varmista, että molemmat puolet on lukittu oikein.
- Vaihda se toimivaksi tiedettyyn DIMM-moduuliin toisesta paikasta, kanavasta, pankista tai ohjaimesta:
- Jos järjestelmä on kaatunut (ei käynnistystä) epäillyn muisti-/DIMM-vian vuoksi, kokeile pientä käynnistysvaihtoehtoa (poista oheislaitteet tai kortit ja jätä 1 x DIMM paikkaan '0')
Additional Information
- Katso tietoartikkeli 130388: PowerProtect- ja Data Domain -laitteistoasiakirjoissa on tärkeitä tietoja DIMM-kokoonpanosta ja asettelusta.
- Katso aiheeseen liittyvä tietämysartikkeli 82030: Data Domain: järjestelmän muistivaatimukset ja laajennettujen tallennustilojen kokoonpanot