En stasjon kan måtte byttes ut på grunn av I/O-feil eller hvis programvaredefinert lagring markerer disken som defekt eller ubrukelig
Summary: Brukere kan be om at en stasjon byttes ut på grunn av I/O-feil eller hvis stasjonen er merket som "defekt" eller "ubrukelig" av en SDS-løsning (Software-Defined-Storage).
Instructions
Det finnes flere forskjellige SDS-løsninger som Ceph (Linux), vSAN (VMware), Nutanix og så videre. Flere identisk konfigurerte servere slås sammen over et nettverk for å opprette en lagringsklynge. Serverne er konfigurert med en vertsbussadapter (HBA) i stedet for en PERC, slik at diskene presenteres for operativsystemet "som de er". Operativsystemet administrerer alle diskene på hver server direkte uten noen innblanding fra HBA-en. Disken er oppført som "Healthy" i Dells overvåkingsverktøy (som iDRAC og OMSA) og ePSA Offline Diagnostics. SMARTCTL-data for stasjonen kan ha ukorrigerte lese- og skrivefeil eller ikke. SMART-tester (kort, lang og forlenget) passerer, og stasjonen er oppført som "Sunn".
Programvaredefinerte lagringsløsninger (SDS) flytter alle lagringsrelaterte kontroller fra maskinvare til programvare ved hjelp av vertsbussadapter (HBA) for å gi fysisk tilkobling til diskene.
RAID-kontrolleren (PERC) er ansvarlig for å utføre flere proaktive vedlikeholdsaktiviteter på stasjonene, som omfatter patruljerese- og konsekvenskontroller på virtuelle disker. Siden SDS-løsninger bruker vertsbussadapter (HBA) i stedet for PERC, utfører programvaren nå alle disse proaktive vedlikeholdsaktivitetene.
Brukere kan rapportere at SDS merker en stasjon som "mislykket eller ubrukelig", eller det kan føre til I/O-feil på en stasjon. Dells overvåkingsverktøy som iDRAC og OMSA rapporterer disken som frisk og operativ.
Verktøy som «SMARTMON» eller «SMARTCTL» kan vise noen feil på én eller flere angitte stasjoner, men den generelle disktilstanden er oppført som «SUNN eller OK».
Denne uoverensstemmelsen skyldes følgende faktorer:
- iDRAC viser tilstandsstatus for komponenten. Hvis diskfastvaren rapporterer at den er i orden, gjenspeiler iDRAC det samme. Hvis fastvaren for disken angir at den er i prediktiv feil-tilstand, gjenspeiler iDRAC det samme.
- Alle stasjoner kan tolerere noen dårlige blokker eller uopprettelige feil og fortsette å fungere uten funksjonell påvirkning. Terskelen for ugyldige blokker programmeres inn i diskfastvaren av stasjonsprodusenten og er ikke et standardtall eller en prosentandel.
- Diskene forblir i drift til det totale antallet ugyldige blokker eller uopprettelige feil på disken bryter den prediktive feil- eller feilterskelen.
- En forskyvningsadresse på disken er merket som en ugyldig blokk, og dataene flyttes BARE hvis en skriveoperasjon mislykkes på den bestemte adressen. Diskfastvaren anser ikke READ-feil for merking av sektorer som ugyldige blokker.
- I/O-feil som er logget på operativsystemnivå, gjenspeiles kanskje ikke i Lifecycle-loggene.
I et slikt scenario er frekvensomformerne funksjonelle og godt innenfor driftsparametrene. De kvalifiserer ikke for eller krever utskifting av maskinvare. Den anbefalte handlingsplanen her er å utføre de nødvendige vedlikeholdsaktivitetene fra programvarelaget for å løse problemet.
I et slikt scenario må du registrere en komplett pakke med operativsystemloggen eller rapporter fra én eller flere berørte servere. Kontakt Dell SST (hvis dekket av garantiavtalen) eller operativsystemleverandøren for logggjennomgang, da de må gi råd om de neste korrigerende trinnene.
Dell SST eller leverandøren av operativsystemet bestemmer følgende detaljer:
- Totale I/O-feil registrert av operativsystemkjernen (hvis noen).
- Hvilke enheter (en eller flere) er feilene logget mot.
- Type skade: Fil- eller metadatanivå (hvis aktuelt)
- Krasjet lagringstjenesten? Hvis ja, hvorfor?
- Korrigerende tiltak er tilgjengelige i SDS for å løse slike feil.