Jednotka může vyžadovat výměnu kvůli chybám I/O nebo pokud softwarově definované úložiště označí disk jako vadný nebo nepoužitelný
Summary: Uživatelé mohou požádat o výměnu jednotky z důvodu chyb I/O nebo v případě, že řešení softwarově definovaného úložiště (SDS) označilo disk za vadný či nepoužitelný.
Instructions
Existuje několik různých řešení SDS, jako je Ceph (Linux), vSAN (VMware), Nutanix a tak dále. Několik stejně nakonfigurovaných serverů se spojí přes síť a vytvoří cluster úložišť. Servery jsou konfigurovány s hostitelským adaptérem sběrnice (HBA) namísto řadiče PERC, takže jednotky jsou operačnímu systému prezentovány "tak, jak jsou". Operační systém spravuje všechny disky na jednotlivých serverech přímo, bez jakéhokoli zásahu ze strany adaptéru HBA. Disk je v monitorovacích nástrojích Dell (např. iDRAC a OMSA) a offline diagnostice ePSA uveden jako "V dobrém stavu". Data SMARTCTL disku mohou, ale nemusí obsahovat neopravené chyby čtení a zápisu. Testy SMART (krátké, dlouhé a delší) proběhnou úspěšně a disk je uveden jako "Zdravý".
Řešení softwarově definovaného úložiště (SDS) přesouvají veškerou kontrolu související s úložištěm z hardwaru na software pomocí adaptéru hostitelské sběrnice (HBA), aby bylo zajištěno fyzické připojení disků.
Řadič RAID (PERC) zodpovídá za provádění několika proaktivních činností údržby na discích, včetně kontrol patrol a konzistence virtuálních disků. Vzhledem k tomu, že řešení SDS používají namísto PERC hostitelský adaptér (HBA), software nyní provádí všechny tyto proaktivní činnosti údržby.
Uživatelé mohou hlásit, že SDS označí disk jako "vadný nebo nepoužitelný" nebo může na disku vypsat chyby I/O. Monitorovací nástroje Dell, jako je iDRAC a OMSA, hlásí, že je disk v dobrém stavu a funkční.
Nástroje jako "SMARTMON" nebo "SMARTCTL" mohou vypsat některé chyby na jednom nebo více označených discích, ale celkový stav disku je uveden jako "HEALTHY nebo OK".
Tento nesoulad je způsoben následujícími faktory:
- Řadič iDRAC zobrazuje stav komponenty. Pokud firmware jednotky hlásí, že je v pořádku, řadič iDRAC zobrazí totéž. Pokud firmware jednotky uvádí, že je ve stavu Predictive Failure, řadič iDRAC zobrazí stejný stav.
- Všechny disky mohou tolerovat některé vadné bloky nebo neopravitelné chyby a pokračují v provozu bez jakéhokoli dopadu na funkci. Prahová hodnota pro vadné bloky je naprogramována ve firmwaru disku výrobcem disku a nejedná se o standardní číslo nebo procento.
- Disky zůstanou funkční, dokud celkový počet vadných bloků nebo neopravitelných chyb na discích nepřekročí prahovou hodnotu pro prediktivní selhání nebo selhání.
- Offsetová adresa jednotky je označena jako chybný blok a data budou přemístěna POUZE v případě, že operace zápisu na této konkrétní adrese selže. Firmware jednotky nebere v úvahu chyby čtení u označení sektorů jako vadných bloků.
- Vstupně-výstupní chyby zaznamenané na úrovni operačního systému se nemusí projevit v protokolech Lifecycle.
V takovém případě jsou disky funkční a v rámci svých provozních parametrů. Nemají nárok na výměnu hardwaru ani jej nevyžadují. Doporučeným akčním plánem je provést nezbytné činnosti údržby ze softwarové vrstvy, aby se problém vyřešil.
V takovém případě zaznamenejte kompletní balíček protokolů operačního systému nebo sestavy z jednoho nebo více dotčených serverů. Požádejte o kontrolu protokolů společnost Dell SST (pokud se na ni vztahuje záruka) nebo dodavatele operačního systému, který vám musí poradit s dalším opravným postupem.
Dell SST nebo dodavatel operačního systému určí následující podrobnosti:
- Celkový počet chyb I/O zaznamenaných jádrem operačního systému (pokud existují).
- U kterých zařízení (jednoho nebo více) se chyby protokolují.
- Typ korupce: Úroveň souboru nebo metadat (pokud existuje)
- Zhroutila se služba úložiště? Pokud ano, proč?
- V bezpečnostním listu jsou k dispozici nápravné kroky k vyřešení těchto chyb.