Et drev skal muligvis udskiftes på grund af I/O-fejl, eller hvis softwaredefineret storage markerer drevet som defekt eller ubrugeligt
Summary: Brugere kan anmode om, at et drev udskiftes på grund af I/O-fejl, eller hvis drevet er markeret som "mislykket" eller "ubrugeligt" af SDS-løsningen (Software-Defined-Storage).
Instructions
Der er flere forskellige SDS-løsninger som Ceph (Linux), vSAN (VMware), Nutanix og så videre. Flere identisk konfigurerede servere sættes sammen over et netværk for at oprette en storageklynge. Serverne konfigureres med en Host Bus Adapter (HBA) i stedet for en PERC, så drevene præsenteres for operativsystemet, "som de er". Operativsystemet administrerer alle drevene på hver server direkte uden indblanding fra HBA'en. Drevet er angivet som "Sundt" i Dells overvågningsværktøjer (som iDRAC og OMSA) og ePSA Offline Diagnostics. SMARTCTL-data til drevet har muligvis ikke korrigeret læse- og skrivefejl. SMART-tests (kort, lang og udvidet) består, og drevet er angivet som "Sund".
Softwaredefinerede storageløsninger (SDS) flytter alle storagerelaterede kontroller fra hardware til software ved hjælp af HBA (Host Bus Adapter) for at give drevene fysisk tilslutning.
RAID-controlleren (PERC) er ansvarlig for at udføre flere proaktive vedligeholdelsesaktiviteter på drevene, som omfatter patruljelæsnings- og konsistenskontrol på virtuelle diske. Da SDS-løsninger bruger HBA (Host Bus Adapter) i stedet for PERC, udfører softwaren nu alle disse proaktive vedligeholdelsesaktiviteter.
Brugere kan rapportere SDS, der markerer et drev som "mislykket eller ubrugeligt", eller det kan vise I / O-fejl på et drev. Dells overvågningsværktøjer som iDRAC og OMSA rapporterer, at drevet er sundt og funktionsdygtigt.
Værktøjer som "SMARTMON" eller "SMARTCTL" kan vise nogle fejl på et eller flere angivne drev, men den generelle drevtilstand er angivet som "SUND eller OK".
Denne uoverensstemmelse skyldes følgende faktorer:
- iDRAC viser komponentens tilstandsstatus. Hvis drevets firmware rapporterer, at det er sundt, viser iDRAC det samme. Hvis drevets firmware angiver, at det er i tilstanden Predictive Failure, viser iDRAC det samme.
- Alle drev kan tåle nogle dårlige blokke eller fejl, der ikke kan rettes, og fortsætter med at fungere uden nogen funktionel påvirkning. Tærsklen for beskadigede blokke er programmeret ind i drevfirmwaren af drevproducenten og er ikke et standardtal eller en standardprocentdel.
- Drevene forbliver i drift, indtil det samlede antal beskadigede blokke eller uoprettelige fejl på drevet overskrider grænsen for forudsigende fejl eller fejl.
- En forskydningsadresse på drevet markeres som en dårlig blok, og dataene flyttes KUN, hvis en WRITE-handling mislykkes på den specifikke adresse. Drevets firmware tager ikke hensyn til READ-fejl ved markering af sektorer som dårlige blokke.
- I/O-fejl, der logges på operativsystemniveau, afspejles muligvis ikke i livscykluslogfilerne.
I et sådant scenarie er drevene funktionelle og godt inden for deres driftsparametre. De er ikke berettiget til og kræver ikke en hardwareudskiftning. Den anbefalede handlingsplan er her at udføre de nødvendige vedligeholdelsesaktiviteter fra softwarelaget for at løse problemet.
I et sådant scenarie skal du registrere en komplet logpakke eller rapporter fra et eller flere berørte servere. Kontakt Dell SST (hvis dækket af garantiaftalen) eller leverandøren af operativsystemet til loggennemgang, da de skal rådgive om de næste korrigerende trin.
Dell SST eller producenten af operativsystemet bestemmer følgende oplysninger:
- Det samlede antal I/O-fejl registreret af operativsystemets kerne (hvis der er nogen).
- Hvilke enheder (en eller flere) er fejlene logget op imod.
- Type korruption: Fil- eller metadataniveau (hvis der er nogen)
- Gik lagertjenesten ned? Hvis ja, hvorfor?
- Korrigerende handlinger er tilgængelige i sikkerhedsdatabladet for at løse sådanne fejl.