VxBlock: Parannetut muistin RAS-ominaisuudet Cisco UCS M5 -ympäristöissä
Summary: Intel Xeon Scalable -suorittimien (aiemmin koodinimeltään Skylake Server) ja 2. sukupolven Intel Xeon Scalable -suorittimien (aiemmin koodinimeltään Cascade Lake Server) muistivirheiden käsittelyn DIMM-virheiden ja arkkitehtuurimuutosten vuoksi Cisco UCS M5 -asiakkaat, jotka kokevat muistin DIMM-virheitä, saattavat saada enemmän suorituksenaikaisia muistivirheitä, joita ei voi korjata, kuin aiemmissa sukupolvissa, joissa on oletusarvoinen SDDC-muistin RAS-tila. ...
Instructions
Ongelman kuvaus
Cisco UCS M5 -palvelimissa, joissa on tietyt Intel Xeon Scalable -suorittimet, saattaa esiintyä enemmän suorituksenaikaisia korjaamattomia muistivirheitä kuin aiemmissa sukupolvissa, kun käytössä on oletusarvoinen SDDC (Single Device Data Correction) -muistin luotettavuus, käytettävyys ja huollettavuus (RAS).
Tausta
Intel Xeon Scalable -suorittimet ja 2. sukupolven Xeon Scalable -suorittimet toteuttivat muutoksia SDDC:hen. SDDC on Intel RAS:n perusominaisuus, joka on käytettävissä kaikissa Cisco-alustoissa. Näiden arkkitehtuurimuutosten ja DIMM (dual inline memory module) -virheiden seurauksena on eroa, mitkä virheet korjataan edellisen sukupolven prosessorien ja Xeon Scalable -suoritinperheen sukupolven välillä.
Uusimmat Intelin mikrokoodi- ja BIOS-parannukset parantavat muistivirheiden hallintaa ottamalla käyttöön Memory RAS -lisäominaisuuksia, kuten Adaptive Double Device Data Correction (ADDDC Sparing) ja Post Packet Repair (PPR). ADDDC Sparing ja PPR ovat nyt Memory RAS -oletuskokoonpanot Cisco UCS M5 -palvelimissa, joissa on Intel Xeon Scalable -suorittimet.
Lisätietoja Memory RAS -ominaisuuksista, kuten ADDDC:stä ja PPR:stä, on seuraavassa asiakirjassa: Cisco UCS HX M5 -muistin tekninen yleiskatsaus – muistin RAS-ominaisuudet.
Julkaisun sertifiointimatriisi (RCM), jota asia koskee
- RCM-versiot ennen versiota 7.0.3.0
- RCM-versiot ennen versiota 6.7.9.0
RCM-versiot ennen versiota 6.5.16.0.
UCS M5 -korttipalvelimet ja integroidut UCS M5 -kehikkopalvelimet
Cisco UCS 4.1(1d) tai uudempi laajentaa muistivirheiden kattavuutta. Tämä julkaisu ja uudemmat versiot sisältävät RAS-lisäominaisuuksia, mukautuvan kaksoislaitteen tietojen korjauksen (ADDDC Sparing) ja paketin jälkeisen korjauksen (PPR). Ne on otettu käyttöön ja määritetty "Platform Default" -ominaisuudella Memory RAS -kokoonpanoissa. Aiemmissa versioissa Memory RAS -määritykseksi oli asetettu "Maximum Performance". Alkuperäinen laiteohjelmisto, joka sisälsi ADDDC: n ja PPR: n, sisälsi UCS Manager 4.1 (1d), mutta tässä versiossa havaittiin vika, joka voi vaikuttaa useisiin järjestelmiin, nimittäin CSCvr79388. Tämän vian vuoksi Cisco on muuttanut vaadittua laiteohjelmistoa. Nyt on suositeltavaa päivittää USC-versio versioon 4.1(3b) tai uudempaan, joka sisältää tämän vian korjauksen. UCS 4.1(3b) -julkaisuversio on alla olevassa RCM-versiossa.
Erilliset UCS M5 -kehikot
Cisco Integrated Manager Controller (IMC) -versiossa 4.1(1d) ja sitä uudemmissa versioissa ovat käytettävissä Adaptive Double Device Data Correction (ADDDC Sparing)- ja Post Package Repair (PPR) -ominaisuudet. Ne on otettu käyttöön ja määritetty "Platform Default" -ominaisuudella Memory RAS -kokoonpanoissa. Aiemmissa versioissa Memory RAS -määritykseksi oli asetettu "Maximum Performance". Sama virhe, joka löytyy UCSM-versiosta 4.1(1d), vaikuttaa myös CIMC 4.1(1d) -versioon. Alkuperäinen CIMC-versio, jossa korjaus on, 4.1(3b), sisältyy alla lueteltuihin RCM-julkaisuihin.
Vaaditut BIOS-asetukset
- UCS Managerin hallitsemissa palvelimissa, joiden RAS-kokoonpanon BIOS-KÄYTÄNTÖ on Platform Default, muutoksia ei tarvita, jotta ADDDC-säästötoiminto tulee voimaan.
- UCS Managerin hallinnoimissa palvelimissa, joiden RAS-kokoonpanon BIOS-KÄYTÄNNÖN asetuksena EI ole Platform Default, käytäntö on muutettava ADDDC Sparing -käytännöksi (tai Platform Default), jotta ADDDC:tä voidaan hyödyntää.
- Erillisissä palvelimissa (muissa kuin UCS Managerin hallinnoimissa) palvelimissa ei tarvita muutoksia, jotta ADDDC-säästö tulee voimaan.
Release Certification Matrix (RCM), joka sisältää korjauksen versiolle 4.1(3b)
- RCM-versio 7.0.3.0 ja uudemmat seuraaville järjestelmille:
- VxBlock 340, 350, 540, 540-40G, 740 ja 1000
- Laskennan tekninen laajennus
- RCM-versio 6.7.9.0 ja uudemmat versiot seuraaville järjestelmille:
- Vblock 240, 340, 350, 540 ja 740
- VxBlock 240, 340, 350, 540, 540-40G, 740 ja 1000
- Laskennan tekninen laajennus
- RCM-versio 6.5.16.0 ja uudemmat versiot seuraaville järjestelmille:
- Vblock 240, 340, 350, 540 ja 740
- VxBlock 240, 340, 350, 540, 740 ja 1000
*Muistiinpano* RCM-julkaisunumerot voivat vaihdella VxBlock-järjestelmän mukaan. Varmista koodin noudattaminen tarkistamalla RCM-versio ennen VxBlock-järjestelmän päivittämistä.
TÄRKEÄÄ! Päivitä vain, jos mainittu ongelma vaikuttaa suoraan!
Lisätietoja tässä artikkelissa kuvatusta ongelmasta on Ciscon kenttäilmoituksessa: Kenttäilmoitus: FN - 70432
Viantunnus CSCvq38078
Katso lisätietoja tästä videosta: