RAID-järjestelmien kaksoisvirheet ja hajonneet kohdat

摘要: RAID-järjestelmissä voi ilmetä tietovirheitä. Tässä artikkelissa suositellaan toimia, joilla näitä ongelmia voi estää ja vähentää.

本文适用于本文不适用于本文并非针对某种特定的产品。本文并非包含所有产品版本。

症状

Tässä artikkelissa on tietoja RAID-järjestelmien tietovirheistä, kaksoisvirheistä ja hajonneista kohdista. Artikkeli sisältää myös suosituksia ongelmien ehkäisemiseen ja korjaamiseen.

Sisällysluettelo

Tietovirheet ja kaksoisvirheet
Hajonneet kohdat: mitä ne ovat ja mikä niitä aiheuttaa?
Ongelmien ehkäiseminen ja hajonneiden kohtien korjaaminen

Luku 1: Tietovirheet ja kaksoisvirheet

RAID-järjestelmissä voi ilmetä tietovirheitä. RAID-ohjain ja kiintolevyn laiteohjelmisto sisältävät toimintoja, joilla voi tunnistaa ja korjata monen tyyppisiä tietovirheitä, ennen kuin ne tallennetaan järjestelmään/asemaan. Vanhentuneen laiteohjelmiston käyttäminen voi aiheuttaa virheellisten tietojen tallentamisen järjestelmään/asemaan, koska vanhasta laiteohjelmistosta puuttuu uusimpien versioiden virheenkäsittely-/-korjausominaisuuksia.

Myös fyysiset vialliset lohkot voivat aiheuttaa tietovirheitä. Niin voi tapahtua esimerkiksi, kun kirjoitus-/lukupää osuu kiintolevyn pyörivään levyyn. Lohkot voivat vioittua myös ajan myötä, koska kiintolevyn pyörivä levy kuluu eikä enää pysty tallentamaan tietoja tiettyyn sijaintiin. Pyörivän levyn kulumisesta johtuvia vioittuneita lohkoja pystyy tavallisesti edelleen lukemaan. Tällaisten viallisten lohkojen tunnistaminen onnistuu ehkä vain ajoittain tai laajennetulla asemien diagnostiikalla.

Vialliset lohkot eli virheelliset loogisen lohkon osoitteet (LBA) saattavat johtua myös loogisista tietovirheistä. Niitä muodostuu, kun tiedot tallennetaan asemaan väärin, vaikka tallennus näyttäisi onnistuneen. Lisäksi asemaan tallennetut kunnossa olevat tiedot voivat muuttua tahattomasti. Yksi esimerkki on bitin kääntyminen, joka voi tapahtua, kun kirjoitus-/lukupää siirtyy läheisen sijainnin yli tai kirjoittaa siihen ja muuttaa nollista ja ykkösistä koostuvien tietojen arvoa. Tämä vioittaa tietojen eheyttä. Tietyn lohkon tietojen arvo poikkeaa alkuperäisistä tiedoista eikä välttämättä enää vastaa tietojen tarkistussummaa. Fyysinen LBA on kunnossa ja siihen voi tallentaa, mutta se sisältää virheellisiä tietoja ja se voidaan tulkita vioittuneeksi lohkoksi.

Vioittuneet LBA:t ilmoitetaan yleisesti Sense Code 3/11/0 -koodilla. Sense Key 3 on keskitason virhe. ASC (additional sense code) ja ASCQ (additional sense qualifier) 11/00 on määritetty korjaamattomaksi lukuvirheeksi. Lohkoa ei yritetä korjata eikä ole määritetty, johtuuko lohkon vioittuminen aseman levyn fyysisestä viasta tai muista syistä johtuvasta tietojen virheestä. Sense Code 3/11/00 -koodi ei tarkoita automaattisesti, että fyysisessä levyssä on vika tai että se tarvitsee vaihtaa.

Dellin laitteistoperustaisissa RAID-ohjaimissa on ominaisuuksia, kuten Patrol Read ja Check Consistency, joilla voi korjata monia tietovirheitä. Patrol Read toimii oletusarvoisesti automaattisena taustatehtävänä, joka tarkistaa kiintolevyn yksittäiset lohkot ja varmistaa, että tiedot voidaan lukea oikein. Patrol Read yrittää korjata vioittuneet lohkot tai yhdistää korjauskelvottomat lohkot uudelleen varattuihin lohkoihin. Check Consistency on manuaalisesti aktivoitava toiminto (sen voi myös ajoittaa), joka vertaa järjestelmän kaikkia asemia keskenään ja varmistaa, että tiedot ja päällekkäisyys täsmäävät. Esimerkiksi RAID 5 -järjestelmän kolmea asemaa verrataan keskenään, jotta voidaan varmistaa, että tiedoissa ja pariteetissa käytetään oikeita arvoja. Jos yksittäinen virhe havaitaan, virheellinen arvo kirjoitetaan uudelleen ja korjataan jäljellä olevien tietojen ja/tai pariteetin avulla. Vastaavasti RAID 1 -järjestelmässä yhden aseman tietoja verrataan toisen aseman tietoihin, jotta voidaan varmistaa, että tiedot peilataan oikein.

Mikä tahansa RAID-järjestelmässä oleva yksittäinen virhe, jota ei korjata, voi aiheuttaa järjestelmään vakavia virheitä erityisesti, jos muitakin virheitä ilmenee. Yksi tai muutama yksittäinen virhe ei aiheuta tietojen menettämistä, kunhan järjestelmä pysyy optimaalisessa tilassa. Tietoja on edelleen riittävästi, ja päällekkäisyyden ansiosta järjestelmä toimii normaalisti ollessaan optimaalisessa tilassa.

Koska ohjain pystyy korjaamaan virheet normaalin käytön yhteydessä, tietojen taustalla olevien ongelmien havaitseminen voi olla vaikeaa. Ohjainlokissa, laitteistolokeissa ja käyttöjärjestelmän tapahtumalokeissa näkyy harvoin virheitä tai hälytyksiä, kun järjestelmässä on yksittäisiä virheitä. Siksi järjestelmä voi näyttää toimivan oikein pitkään, vaikka siinä olisi jatkuvuusvirheitä ja/tai yksittäisiä virheitä.

SLN111497_en_US__11

Kuva 1: Useita yksittäisiä virheitä RAID 5 -järjestelmässä - optimaalinen järjestelmä

Kuten kuvassa 1 näkyy, järjestelmässä on useita virheitä. Koska kussakin lomituksessa on kuitenkin enintään yksi virhe, ohjain pystyy käyttämään tietoja RAID 5 -järjestelmän päällekkäisyyden vuoksi. Jos virhe ilmenee pariteettilohkossa, kaikki tiedot ovat kunnossa eikä virhe vaikuta lukutoimintoihin. Jos virhe ilmenee tietolohkossa, kunnossa olevien tietojen ja kunnossa olevien pariteettiosien XOR-vertailu on tehtävä, jotta puuttuva/viallinen tietolohko voidaan laskea uudelleen. Joka tapauksessa, koska kussakin lomituksessa on vain yksi virhe, päällekkäisyys riittää kaikkien tietojen käyttämiseen.

Jos yksi tai usea RAID-järjestelmän asema sisältää tietovirheitä ja jokin toinen järjestelmän asema ei ole enää aktiivinen järjestelmän jäsen aseman vioittumisen, vieraan kokoonpanon tai aseman poistamisen vuoksi tai muusta syystä, virhettä kutsutaan kaksoisvirheeksi. Kaksoisvirhe aiheuttaa välittömän tietojen menetyksen lomituksissa, joissa ongelma ilmenee.

SLN111497_en_US__22

Kuva 2: Kaksoisvirhe ja vioittunut asema (lomituksissa 1 ja 2 olevat tiedot menetetään) - vioittunut järjestelmä

Kaksoisvirhe on mahdollinen, vaikka järjestelmä on optimaalisessa tilassa. Siinä tapauksessa useassa kiintolevyasemassa on samat vialliset LBA-osoitteet. Tämä tilanne on erittäin harvinainen, koska nykyisissä suurikokoisissa kiintolevyasemissa niin paljon LBA-osoitteita. On erittäin epätodennäköistä, että sama LBA on viallinen useassa kiintolevyasemassa samanaikaisesti.

Säännöllisillä Check Consistency -tarkistuksilla voidaan korjata yksittäisiä vikoja. Tämä koskee sekä fyysisiä viallisia lohkoja että tietojen loogisia virheitä. Lisäksi Check Consistency vähentää kaksoisvirheiden riskiä lisävirheiden yhteydessä. Jos kussakin lomituksessa on enintään yksi virhe, Check Consistency pystyy korjaamaan virheen lähes aina.

Alkuun

Luku 2: Hajonneet kohdat: mitä ne ovat ja mikä niitä aiheuttaa?

Hajonnut kohta on Dellin PERC-ohjainten ominaisuus, jonka ansiosta ohjain pystyy palauttamaan järjestelmän päällekkäisyyden, vaikka kaksoisvirhe aiheuttaa tietojen menetyksen. Toisin sanoen hajonneella kohdalla tarkoitetaan kokoamista uudelleen siten, että lopputulokseen jää virheitä (rebuild with errors). RAID-ohjain tunnistaa kaksoisvirheen, ja koska päällekkäisyys ei riitä vioittuneen lomituksen tietojen palauttamiseen, ohjain merkitsee kyseisen lomituksen hajonneeksi ja mahdollistaa uudelleenkokoamisen jatkamisen.

Kaksoisvirhe on tilanne, jonka vuoksi saman lomituksen tietoja useassa asemassa ei voi käyttää.
Kaksoisvirheet aiheuttavat vioittuneen lomituksen kaikkien tietojen menetyksen.
Kaikki hajonneet kohdat ovat kaksoisvirheitä, mutta kaikki kaksoisvirheet EIVÄT ole hajonneita kohtia.

Kuva 3: Hajonneita lomituksia (lomitusten 1 ja 2 tiedot menetetään kaksoisvirheen vuoksi) - optimaalinen järjestelmä

Ilman hajonnut kohta -ominaisuutta järjestelmän kokoaminen uudelleen epäonnistuisi ja järjestelmä jäisi vioittuneeseen tilaan. Joissakin tapauksissa viat saattavat aiheuttaa muiden asemien vikoja, joiden vuoksi järjestelmä jää toimimattomaan offline-tilaan. Järjestelmän merkitseminen hajonneeksi ei vaikuta järjestelmän käynnistämiseen tai tietojen käyttämiseen. Kaksoisvirheestä johtuvat vauriot ja tietojen menetykset olivat jo tapahtuneet.

Hajonneita kohtia voidaan merkitä kahdessa tilanteessa:

Kaksoisvirhe on jo tapahtunut (tiedot on jo menetetty)
- Verkkoasemassa oleva tietovirhe kopioituu uudelleen koottavaan asemaan

Kaksoisvirhettä ei ole tapahtunut (tiedot menetetään, jos tapahtuu toinen virhe)
- Vioittuneessa tilassa verkkoaseman viallisen lohkon LBA on hajonnut

Kun järjestelmän kohta voidaan merkitä hajonneeksi, järjestelmä on aina käytettävissä tuotantoon ja järjestelmän päällekkäisyys voidaan palauttaa. Vioittuneen lomituksen tiedot on menetetty riippumatta siitä, onko kohta merkitty hajonneeksi. LSI-tavan ensisijainen huono puoli on se, että kun järjestelmässä on hajonnut kohta, korjauskelvottomia virheitä ilmenee edelleen aina, kun (mahdollisesti) vioittuneita tietoja käytetään.

Hajonneita kohtia voi ilmetä kolmessa paikassa. Ensinnäkin hajonnut kohta voi sijaita tyhjässä tilassa, joka ei sisällä tietoja. Kyseistä lomitusta ei voi käyttää, mutta koska kyseisessä sijainnissa ei ole tietoja, kohdan hajoamisella ei ole merkittäviä vaikutuksia. Jos käyttöjärjestelmä yrittää kirjoittaa hajonneeksi merkittyyn lomitukseen, kirjoitus epäonnistuu ja tiedot kirjoitetaan muualle.

Toiseksi hajonnut kohta voi ilmetä lomituksessa, jonka tiedot eivät ole kriittisen tärkeitä, kuten README.TXT-tiedostossa. Jos vioittuneita tietoja ei käytetä, virheitä ei ilmene normaalin I/O-toiminnan yhteydessä. Tiedostojärjestelmän varmuuskopiointiyritysten yhteydessä ei varmuuskopioida hajonneeseen kohtaan kirjoitettuja tiedostoja. Check Consistency- tai Patrol Read -toiminto tuottaa Sense-koodin: 3/11/00 sovellettavalle LBA:lle ja/tai lomituksille.

Kolmanneksi hajonnut kohta voi ilmetä tiedontallennustilassa, jota käytetään. Siinä tapauksessa menetetyt tiedot voivat aiheuttaa monenlaisia virheitä. Virheet voivat olla pieniä virheitä, jotka eivät vaikuta tuotantoympäristöön negatiivisesti. Virheet voivat olla myös niin vakavia, että ne estävät järjestelmää käynnistymästä käyttöjärjestelmään tai aiheuttavat sovelluksiin vikoja.

Hajonneeksi merkitty kohta on lopulta poistettava ja luotava uudelleen. Tämä poistaa kaikki tiedot. Sen jälkeen tiedot on luotava uudelleen tai palautettava varmuuskopiosta, kun hajonnut kohta on poistettu. Hajonneen kohdan korjaaminen voidaan ajoittaa liiketoiminnan kannalta sopivaan ajankohtaan.

Jos hajonneen lomituksen tietoja käytetään, vioittuneiden LBA-osoitteiden virheistä ilmoitetaan siten, että mahdollista korjausta ei ole käytettävissä. Lopulta (esimerkiksi muutaman minuutin, päivän, viikon tai kuukauden kuluttua) BBM (Bad Block Management) -taulukko täyttyy, ja sen vuoksi vähintään yhteen asemaan lisätään merkintä ennakoidusta viasta. Kuvan 3 mukaan asemaan 0 lisätään tavallisesti merkintä ennakoidusta viasta, koska asemien 1 ja 2 virheet kopioituvat siihen. Asema 0 saattaa itse asiassa toimia normaalisti, ja aseman 0 vaihtaminen aiheuttaa ainoastaan sen, että lopulta myös vaihdettuun asemaan lisätään merkintä ennakoidusta viasta.

Hajonneen kohdan merkitsemisen jälkeen tehty Check Consistency -tarkistus ei ratkaise ongelmaa. Siksi Check Consistency -tarkistus kannattaa tehdä säännöllisesti. Se on erityisen tärkeää ennen asemien vaihtamista, jos se on mahdollista. Järjestelmän on oltava optimaalisessa tilassa, jotta Check Consistency -tarkistuksen voi tehdä.

RAID-järjestelmä, joka sisältää yksittäisen tietovirheen ja lisäksi toisen virhetapahtuman, kuten kiintolevyn vian, aiheuttaa hajonneen kohdan merkinnän, kun vioittunut tai vaihdettu asema kootaan uudelleen järjestelmään. Esimerkiksi optimaalinen RAID 5 -järjestelmä sisältää kolme jäsentä: asema 0, asema 1 ja asema 2. Jos asema 0 vioittuu (kuva 2) ja se vaihdetaan, asemissa 1 ja 2 jäljellä olevien tietojen ja pariteetin avulla kootaan puuttuvat tiedot takaisin vaihtoasemaan 0. Jos kuitenkin asemassa 1 on tietovirhe, kun uudelleenkoonti saavuttaa kyseisen virheen, lomituksen tiedot eivät riitä kyseisen lomituksen tietojen uudelleenkoontiin. Asemassa 0 ei ole tietoja, aseman 1 tiedot ovat vioittuneet ja aseman 2 tiedot ovat kunnossa, koska niitä kootaan uudelleen. Kyseisessä lomituksessa on useita virheitä. Asema 0 ja asema 1 eivät sisällä kelvollisia tietoja, joten kyseisen lomituksen tietoja ei voida palauttaa ja ne menetetään. Kuvassa 3 näkyvä tulos on, että hajonneet kohdat (lomituksessa 1 ja 2) luodaan uudelleenkoonnin yhteydessä. Virheet kopioituvat asemaan 0.

Hajonneen kohdan merkitseminen järjestelmään palauttaa päällekkäisyyden ja palauttaa järjestelmän optimaaliseen tilaan. Siten järjestelmä on suojattu muiden tietojen menetykseltä siinä tapauksessa, että lisää virheitä ilmenee tai asema vioittuu.

Alkuun

Luku 3: Ongelmien ehkäiseminen ja hajonneiden kohtien korjaaminen

On helppoa ajatella, että vain rikkinäisiä asioita kannattaa korjata. Vaikka se on usein totta, tallennuksen alijärjestelmien suojauksen ja hallinnan kannalta on erittäin tärkeää tehdä ylläpitotoimia rutiininomaisesti ja säännöllisesti. Ennakoivan ylläpidon avulla voidaan korjata olemassa olevia virheitä ja myös estää virheitä. Kaikkia virheitä ei toki voi estää, mutta useimpia vakavia virheitä voidaan vähentää merkittävästi ennakoivilla ylläpitotoimilla. Tallennus- ja RAID-alijärjestelmissä tehtävät toimet:

päivitä ohjaimet ja laiteohjelmistot ohjaimissa, kiintolevyillä, taustalevyillä ja muissa laitteissa
tee Check Consistency -tarkistuksia säännöllisesti
tarkista lokit ongelmien merkkien varalta.

Tämän ei tarvitse olla erityisen teknistä tarkistusta, vaan lokien silmäilyä, jotta näet mahdollisten ongelmien silmäänpistävimmät merkit
Ota yhteys Dellin tekniseen tukeen, jos sinulla on kysyttävää

Yksi tärkeimmistä toimista on varmistaa, että laiteohjelmisto on ajantasainen. Laiteohjelmisto sisältää laitteen käyttölogiikan. Se varmistaa laitteen toimivuuden ja ominaisuudet sekä monenlaisia virheenkäsittely- ja -korjaustoimintoja. Ajantasaisella laiteohjelmistolla voidaan parantaa suorituskykyä ja vähentää virheitä. Laiteohjelmistopäivityksellä voidaan myös lisätä uusia ominaisuuksia ja parannuksia.

Laiteohjelmisto voi sijaita monessa paikassa. RAID-ohjaimet sisältävät laiteohjelmiston, samoin kun kukin järjestelmään asennettu yksittäinen kiintolevyasema. Myös taustalevyt ja ulkoiset kotelot sisältävät laiteohjelmiston, joka voi vaikuttaa asemien ja järjestelmien toimintaan.

Toinen suositeltava ennakoiva ylläpitotoimi on Check Consistency -tarkistus. Check Consistency -tarkistus on manuaalinen toiminto, koska se kuluttaa osan RAID-ohjaimen käytettävissä olevasta kaistanleveydestä. Check Consistency -tarkistuksen voi kuitenkin ajoittaa ajankohtaan, jolloin se vaikuttaa suorituskykyyn mahdollisimman vähän.

Check Consistency tarkistaa asemien vialliset lohkot, mutta sitäkin tärkeämpää on sen tekemä järjestelmän tietojen vertailu, jolla se varmistaa, että tiedot täsmäävät. Kun se löytää ongelman, se määrittää, miltä tietojen pitäisi näyttää, ja korjaa ne tarkistamalla järjestelmän muiden asemien tiedot. Suhteellisen pienten tietovirheiden korjaaminen on paras tapa estää riski kohtien hajoamiseen, joka johtuu nykyisistä tietovirheistä sekä toisesta virheestä tai viasta. Kaksoisvirheet ja hajonneet kohdat voivat keskeyttää toiminnan, kunnes järjestelmät ja tiedot saadaan palautettua toimivaan tilaan, tai ne voivat aiheuttaa kaikkien tietojen menetyksen.

Kaksoisvirheisiin tai hajonneisiin kohtiin liittyy usein tietojen menetys. Jos virheet sijaitsevat tyhjässä tilassa tai kohdassa, jonka sisältämät tiedot eivät ole kriittisen tärkeitä, välitön vaikutus tuotantoympäristön tietoihin jää suhteellisen pieneksi. Nämä virheet voivat kuitenkin viitata vakavampiinkin virheisiin. Laitteiston virheet ja vanhentuneet laiteohjelmistot voivat edellyttää välittömiä toimia.

Jos järjestelmässä tiedetään tai epäillään olevan kaksoisvirhe tai hajonnut kohta, voit minimoida vakavampien ongelmien riskin seuraavasti:

tee Check Consistency -tarkistus (järjestelmän on oltava optimaalisessa tilassa)
tarkista, onko järjestelmässä laitteisto-ongelmia
tarkista ohjaimen loki
tee laitteistodiagnostiikka
ota tarvittaessa yhteys Dellin tekniseen tukeen.

Jos nämä toimet on tehty, ongelmaa ei ole vielä estetty. Kiintolevyasemat voivat siirtyä hajonneiden kohtien vuoksi ajan myötä ennakoidun vian tilaan. Asemaan kopioituneet tietovirheet raportoidaan aseman tallennusvälinevirheiksi, vaikka todellisia laitteisto-ongelmia ei olisi. Virhe raportoidaan aina, kun viallista LBA-osoitetta käytetään. Kun virheloki on täynnä, asema raportoi olevansa ennakoidun vian tilassa.

Yksittäinen hajonnut LBA voidaan raportoida useita kertoja. Hajonneiden kohtien määrän mukaan usean järjestelmän aseman voidaan raportoida olevan ennakoidun vian tilassa. Ennakoidun vian tilassa olevan aseman vaihtaminen aiheuttaa olemassa olevien hajonneiden kohtien kopioitumisen uudelleen vaihtoasemaan, minkä vuoksi myös vaihtoasema merkitään lopulta ennakoidun vian tilaan. Siinä tapauksessa ainoa mahdollinen korjaustoimi on korjata hajonnut kohta.

Kuvassa 3 näkyy, että lomituksessa 1 ja 2 on hajonnut kohta. Ongelma ei ratkea kiintolevyaseman vaihdolla, koska tietojen päällekkäisyys ei riitä alkuperäisten tietojen uudelleenkoontiin. Hajonneiden lomitusten tiedot menetetään (elleivät ne sisälly aiempaan varmuuskopioon). Muista, että hajonnut kohta ei aiheuta tietojen menetystä. Kaksoisvirhe aiheuttaa tietojen menetyksen. Hajonneen kohdan merkitseminen on tapa palauttaa päällekkäisyys järjestelmään, jossa on kaksoisvirhe.

Huomautus: Tällä prosessilla voidaan ratkaista useimmat hajonneiden kohtien ongelmat. Ongelman ratkaisemiseen ei välttämättä tarvita kaikkia näitä toimia. Jos ongelma ei korjaannu näillä toimilla, kysy lisätietoja Dellin teknisestä tuesta.

Varoitus: Näiden ohjeiden noudattaminen poistaa kaikki tiedot järjestelmästä. Varmista ennen ohjeiden noudattamista, että pystyt palauttamaan järjestelmän varmuuskopiosta tai muuten. Ole huolellinen, jotta näiden ohjeiden noudattaminen ei vaikuta muihin järjestelmiin.

Poista (mahdollinen) varattu välimuisti
Tyhjennä (mahdolliset) vieraat kokoonpanot
Poista järjestelmämääritys
Siirrä asemia yhden paikan verran (siirrä kuvan 1 mukaan levy 0 paikkaan 1, levy 1 paikkaan 2 ja levy 2 paikkaan 0)
Luo järjestelmämääritys uudelleen haluamallasi tavalla
Tee järjestelmän täysi alustus (ei nopea alustus)
Tee järjestelmän Check Consistency -tarkistus

Jos järjestelmä läpäisee yhtenäisyystarkistuksen ilman virheitä, voit olettaa, että järjestelmä on kunnossa ja hajonnut kohta on korjattu. Voit palauttaa tiedot kunnossa olevaan järjestelmään.

Vakavammissa tapauksissa nämä toimet eivät välttämättä korjaa ongelmaa ja virheet voivat jatkua. Jos ongelma ei korjaannu näillä toimilla, kysy lisätietoja Dellin teknisestä tuesta.

Hajonneita kohtia tarvitsee ehkä analysoida tarkemmin, jotta nähdään, mitkä asemat ovat yhteisiä. Esimerkiksi kuvassa 3 ohjaimen lokissa näkyy hajonnut kohta levyllä 0 ja 1 ja toinen levyllä 0 ja 2. Levy 0 on yhteinen asema. Toimi edellä olevien ohjeiden mukaisesti, mutta poista yhteiset asemat ensin kokonaan. Poista siis kuvan 1 esimerkin mukaisesti levy 0 ja seuraa ohjeita. Luo järjestelmä jäljellä olevista levyistä (1 ja 2). Kun olet tehnyt tämän ja Check Consistency -tarkistus on ilmoittanut, että järjestelmä on kunnossa, lisää levy 0 takaisin ja tee samat toimet kaikkien asemien kohdalla tai lisää asemat takaisin järjestelmään RAID-tason siirrolla (RLM) ja/tai verkkokapasiteetin laajennuksella (OCE).

Ennakoidun vian tilaan merkityt asemat on poistettava eikä niitä saa käyttää palautukseen. Jos levy 0 oli ennakoidun vian tilassa (kuvan 3 esimerkin mukaisesti), poista levy. Tee sen jälkeen edellä mainitut toimet. Koska jäljellä on vain kaksi asemaa, luotu RAID-järjestelmä on RAID 1, ei RAID 5. Kun olet hankkinut levyn 0 korvaavan levyn (ennakoidun vian vuoksi), tee nämä toimet uudelleen kaikille kolmelle asemalle tai lisää levy 0 nykyiseen järjestelmään RAID-tason siirtotoiminnolla ja muuta järjestelmä kahden aseman RAID 1 -järjestelmästä kolmen aseman RAID 5 -järjestelmäksi.

Prosessi saattaa vaikuttaa hankalalta erityisesti tietojen menetyksen riskin vuoksi. Sanonta "Ei vara venettä kaada" sopii erinomaisesti tähän tilanteeseen. Kokemuksen mukaan lähes kaikki kaksoisvirheet ja hajonneet kohdat olisi voitu välttää RAID-laitteistojen ja -järjestelmien ennakoivalla ylläpidolla.

Huomautus: kun järjestelmää valvotaan tehokkaasti, ongelmia voidaan havaita ja korjata ripeästi, mikä myös vähentää vakavampien ongelmien riskiä.

Aiheeseen liittyvä artikkeli
PERC - RAID-järjestelmän hajonneen kohdan korjaaminen

Alkuun

原因

解决方案

受影响的产品

Servers

文章编号: 000139251

文章类型: Solution

上次修改时间: 02 7月 2024

版本: 7

RAID-järjestelmien kaksoisvirheet ja hajonneet kohdat

摘要: RAID-järjestelmissä voi ilmetä tietovirheitä. Tässä artikkelissa suositellaan toimia, joilla näitä ongelmia voi estää ja vähentää.

症状

Luku 1: Tietovirheet ja kaksoisvirheet

Luku 2: Hajonneet kohdat: mitä ne ovat ja mikä niitä aiheuttaa?

Luku 3: Ongelmien ehkäiseminen ja hajonneiden kohtien korjaaminen

原因

解决方案

受影响的产品

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

欢迎

欢迎访问戴尔

RAID-järjestelmien kaksoisvirheet ja hajonneet kohdat

摘要: RAID-järjestelmissä voi ilmetä tietovirheitä. Tässä artikkelissa suositellaan toimia, joilla näitä ongelmia voi estää ja vähentää.

详细文章

症状

原因

解决方案

受影响的产品

症状

Luku 1: Tietovirheet ja kaksoisvirheet

Luku 2: Hajonneet kohdat: mitä ne ovat ja mikä niitä aiheuttaa?

Luku 3: Ongelmien ehkäiseminen ja hajonneiden kohtien korjaaminen

原因

解决方案

受影响的产品

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

文章属性

从其他戴尔用户那里查找问题的答案

支持服务