Den här artikeln innehåller felsökningssteg för (punktering av) felaktiga block på hårddiskar i PowerEdge-servrar med PERC-styrenheter. Följande information kan hjälpa till att få tillbaka en påverkad virtuell enhet till ett optimalt läge, i synnerhet när ingen säkerhetskopiering är möjlig.
OpenManage Server Administrator (OMSA) visar ett rött kryss framför en virtuell hårddisk (bild 1).
Bild 1: Virtuell disk med rött kryss i status (exempel H800)
Windows systemlogg visar felaktigt block-fel (bild 2).
Bild 2: Felaktigt blockfel i Windows-systemloggen visas
Loggen för RAID-styrenheten (TTYLOG) visar fel som:
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
Mer information om hur du tar emot dessa specifika loggar finns i vår artikel om insamling av loggar.
RAID-disksystem är inte immuna mot datafel. RAID-styrenheten och den inbyggda programvaran på hårddisken innehåller funktioner för att upptäcka och korrigera många typer av datafel innan de skrivs till ett disksystem/en disk. Om inaktuell inbyggd programvara används kan felaktiga data skrivas till ett disksystem/en disk eftersom felhanterings-/felkorrigeringsfunktionerna som finns i de senaste versionerna av den fasta programvaran saknas.
Datafel kan också orsakas av felaktiga fysiska block. De kan till exempel uppstå när läs-/skrivhuvudena påverkar den snurrande skivan (en så kallad ”huvudkrock”). Block kan också bli dåliga med tiden på grund av skivans förmåga att magnetiskt lagra bitar på en viss plats. Felaktiga block som orsakas av degraderade skivor går ofta att läsa. Sådana felaktiga block kan bara detekteras tillfälligt eller med utökad diagnostik på enheterna.
Ett felaktigt block, även kallat en felaktig logisk blockadress (LBA), kan också orsakas av logiska datafel. Detta inträffar när data skrivs felaktigt till en disk även om det rapporteras som en lyckad skrivning. Dessutom kan data som lagras på enheten ändras oavsiktligt. Ett exempel är en ”bit flip” som kan uppstå när läs-/skrivhuvudena passerar över eller skriver till en närliggande plats och gör att data i form av nollor och ettor ändras till ett annat värde. Ett sådant tillstånd medför att enhetligheten i data skadas. Värdet för data på ett visst block skiljer sig från ursprungliga data och kanske inte längre matchar kontrollsumman av data. Den fysiska LBA-enheten är bra och kan skrivas till, men den innehåller för närvarande felaktiga data och kan tolkas som ett felaktigt block.
Mer information finns i vår artikel om dubbelfel och punkteringar på RAID-disksystem.
Skapa en validerad säkerhetskopiering av data på filnivå
Se till att alla trasiga drivenheter som visar förutsägbara fel byts ut
Radera och återskapa den virtuella hårddisken
Utför en fullständig initiering av den virtuella hårddisken
Kör en konsekvenskontroll av den nyskapade virtuella hårddisken
Dina data kan nu återställas till den fungerande virtuella hårddisken
Rekommendation: Uppgradera all fast programvara för hårddiskar till den senaste versionen
OMSA ger möjlighet att rensa varningar om felaktiga block. Om du vill rensa felaktiga block rekommenderar vi följande procedur:
När du utför en säkerhetskopiering av den virtuella hårddisken med alternativet Verify (verifiera) markerat kan två scenarier uppstå:
Kör Patrol Read (under Virtual Disk Tasks (uppgifter för virtuella hårddiskar) i OMSA) och kontrollera systemets händelselogg i syfte att kontrollera att inga nya felaktiga block hittas. Om det fortfarande finns felaktiga block går du vidare till nästa steg. Om det inte gör det är situationen löst.
Om du vill ta bort de felaktiga blocken utför du uppgiften Clear Virtual Disk Bad Blocks (Rensa felaktiga block på virtuell hårddisk). Detta kan göras i OMSA:s grafiska gränssnitt eller med följande kommando i kommandogränssnitet:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
för att visa styrenhets-ID:n och skriver sedan omreport storage vdisk controller=ID
för att visa ID:n för de virtuella diskarna