Número del artículo: 000139277

Jak řešit narušení (chybné bloky) na virtuálních discích serverů PowerEdge

Resumen: Odstraňování problémů s (narušením) chybnými bloky pevných disků u serverů PowerEdge s řadiči PERC. Následující informace mohou pomoci navrátit dotčený virtuální disk do optimálního stavu, zejména pokud není k dispozici záloha. ...

Es posible que este artículo se traduzca automáticamente. Si tiene comentarios sobre su calidad, háganoslo saber mediante el formulario en la parte inferior de esta página.

Contenido del artículo

Síntomas

Causa

Resolución

Tento článek popisuje odstraňování problémů s (narušením) chybnými bloky pevných disků u serverů PowerEdge s řadiči PERC. Následující informace mohou pomoci navrátit dotčený virtuální disk do optimálního stavu, zejména pokud není k dispozici záloha.

1. Popis chyb

Chyba č. 1:

Nástroj OpenManage Server Administrator (OMSA) zobrazuje červený křížek před virtuálním diskem (obrázek 1).

SLN111146_en_US__11343098652871.1
Obrázek 1: Virtuální disk označený červeným křížkem (příklad: model H800)

Poznámka: Nástroj Dell OpenManage Server Administrator (OMSA) nabízí komplexní řešení typu 1-k-1 („one-to-one“), které umožňuje spravovat systémy. Nástroj OMSA lze rozdělit na dvě aplikace:
– Integrovaná – grafické uživatelské rozhraní (GUI) založené na webovém prohlížeči
– Rozhraní příkazového řádku (CLI) – prostřednictvím operačního systému

Chyba č. 2:

Systémový protokol Windows zobrazuje vady chybných bloků (obrázek 2).

SLN111146_en_US__31343098674763.2
Obrázek 2: Vada chybného bloku zobrazená v systémovém protokolu Windows

Chyba č. 3:

Protokol řadiče RAID (TTYLOG) zobrazuje chyby jako:

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Varování: Protokol řadiče (TTYLOG) nemusí chyby vykazovat.

Další informace o získávání těchto specifických protokolů najdete v našem článku o shromažďování protokolů.

2. Jaká je příčina:

Pole RAID nejsou vůči chybám dat imunní. Řadič RAID a firmware pevného disku obsahují funkce, které umožňují rozpoznat a napravit mnoho typů chyb dat předtím, než dojde k jejich zápisu do pole či na disk. K zápisu nesprávných dat do pole či na disk může vést používání zastaralého firmwaru, protože neobsahuje funkce zpracování či nápravy chyb, které jsou dostupné v nejnovějších verzích firmwaru.
Chyby dat mohou být také způsobeny vadnými fyzickými bloky. K tomu může dojít například tehdy, když čtecí/zapisovací hlava spadne na točící se plotnu (tzv. „Head Crash“). Bloky také mohou začít být vadné v průběhu doby v důsledku postupného zhoršování schopnosti plotny magneticky uchovávat bity na konkrétním místě. Vadné bloky způsobené postupným zhoršováním plotny je často možné úspěšně přečíst. Takový vadný blok je možné rozpoznat pouze občas nebo pomocí rozsáhlé diagnostiky disků.

Vadný blok, známý také jako vadná adresa logického bloku (LBA), může být způsoben také logickými chybami dat. K nim dochází, když se data na disk zapíšou nesprávně, i když se nahlásí úspěšný zápis. Kromě toho se dobrá data uložená na disku mohou neúmyslně změnit. Jedním takovým příkladem je překlopení bitu („bit flip“), ke kterému může dojít, když čtecí/zapisovací hlava přejede přes blízké místo nebo na něj zapíše a způsobí změnu dat v podobě nul a jedniček na jinou hodnotu. Takový stav způsobí narušení „konzistence“ dat. Hodnota dat na konkrétním bloku je jiná než původní data a už neodpovídá kontrolnímu součtu dat. Fyzická adresa logického bloku je v pořádku a je možné do ní úspěšně zapisovat, v danou chvíli ale obsahuje nesprávná data a může být interpretována jako vadný blok.

Další informace najdete v našem článku Dvojité chyby a narušeních v polích RAID.

3. Postup řešení problému:

Poznámka: Stávající data na virtuálním disku jsou poškozená a bude je nutné smazat.

Vytvořte ověřenou zálohu dat na úrovni souboru.
- V záloze na bázi bloku by se problém přenesl.
- Záloha na úrovni souboru ukáže poškozené soubory (jejich zálohování by mělo selhat).
- Nikdy neexistuje 100% záruka zachování všech dat, pokud již došlo k narušení.
Všechny chybové disky vykazující prediktivní poruchy je třeba vyměnit.
Odstraňte a znovu vytvořte virtuální disk.
- Tento krok z něj smaže veškerá data.
- Odstraňte pole
- Znovu vytvořte pole podle požadavků
Proveďte plnou inicializaci virtuálního disku.
- Nepoužívejte rychlou inicializaci.
- Problém vyřeší pouze úplná (pomalá) inicializace.
Proveďte na nově vytvořeném virtuálním disku kontrolu konzistence.
- Jestliže se kontrola konzistence dokončí bez chyb, pole je nyní v dobrém stavu a narušení je odstraněno.
Na virtuální disk v dobrém stavu je nyní možné obnovit data.
Doporučení: Upgradujte firmware všech pevných disků na nejnovější verzi.

4. Další informace

Nástroj OMSA nabízí možnost vymazat varování ohledně chybných bloků. Pokud chcete vymazat chybné bloky, doporučuje se postupovat takto:

Při zálohování virtuálního disku s vybranou možností Verify může dojít ke dvěma situacím:
- Zálohování selže u jednoho nebo více souborů. V takovém případě obnovte soubor ze starší zálohy. Po obnovení souboru pokračujte dalším krokem.
- Zálohování se dokončí bez chyb. To znamená, že na části virtuálního disku, kde jsou zapsaná data, nejsou žádné chybné bloky.
Poznámka: Pokud nadále dostáváte varování ohledně chybných bloků, nacházejí se chybné bloky v oblasti bez dat.
Spusťte proces Patrol Read (v části Virtual Disk Tasks nástroje OMSA) a zkontrolujte protokol systémových událostí, abyste měli jistotu, že nebyly nalezeny žádné nové chybné bloky. Pokud jsou chybné bloky stále přítomné, pokračujte dalším krokem. Pokud ne, problém je vyřešen.

Poznámka: Automatizovaný proces Patrol Read je nutné deaktivovat, než se v nástroji OMSA zobrazí možnost manuálního spuštění této akce.
Když chcete vymazat chybné bloky, spusťte úlohu Clear Virtual Disk Bad Blocks. To je možné v grafickém rozhraní nástroje OMSA nebo pomocí příkazu CLI:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Poznámka: Pokud chcete získat hodnoty ID řadiče a ID virtuálního disku, zadejte příkaz omreport storage controller, který zobrazí ID řadičů, a poté příkaz omreport storage vdisk controller=ID, který zobrazí ID virtuálních disků.

Propiedades del artículo

Producto comprometido

Servers

Fecha de la última publicación

01 oct 2021

Versión

Tipo de artículo

Solution

Volver al principio

Bienvenido

Bienvenido a Dell